英伟达发布Eagle 2.5视觉语言AI模型,xAI/微美全息凭高性价比AI模型展实力!

内容摘要据消息,科技媒体报道称,英伟达(NVDA.US)最新推出 Eagle 2.5,一款专注于长上下文多模态学习的视觉-语言模型(VLM)。性能表现稳定提升该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为

据消息,科技媒体报道称,英伟达(NVDA.US)最新推出 Eagle 2.5,一款专注于长上下文多模态学习的视觉-语言模型(VLM)。

性能表现稳定提升

该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。

Eagle 2.5 的训练数据管道,整合了开源资源和定制数据集 Eagle-Video-110K,该数据集专为理解长视频设计,采用双重标注方式。采用自下而上的方法则利用 GPT-4o 为短片段生成问答对,抓取时空细节。

此外,Eagle 2.5-8B 在多项视频和图像理解任务中表现出色。在视频基准测试中,MVBench 得分为 74.8,MLVU 为 77.6,LongVideoBench 为 66.4;在图像基准测试中,DocVQA 得分为 94.1,ChartQA 为 87.5,InfoVQA 为 80.4。

与此同时,xAI近日推出了其全新的语言模型——Grok3Mini,进一步推动了高效AI技术的发展。xAI推出Grok3Mini,彰显其在高效AI技术领域的创新实力。

Grok3Mini提供高性价比AI模型

据介绍,Grok3Mini是Grok3系列的一部分,该系列包含六种变体,其中包括标准的Grok3、Grok3Fast,以及四种版本的Grok3Mini,提供慢速和快速两个版本,每种版本又具备低推理能力或高推理能力的选项。

Grok3Mini以速度和经济性为设计核心,专为速度和经济性设计,尽管体积较小,但在多个领域的表现优于许多更昂贵的AI模型,尤其在数学、编程和科学基准测试中表现突出,或吸引更多关注。

当市场聚焦于大模型本身的技术突破时,年初,中国大语言模型DeepSeek引起全球科技界高度关注。今年政府工作报告也指出,需要持续推进“人工智能+”行动,支持大模型广泛应用。

业内人士指出,现如今,以大模型为代表的人工智能技术为新一轮科技革命和产业变革提供了重要驱动力,各行业在智能化转型道路上面临着前所未有的机遇和挑战。

微美全息保持市场领先优势

在当今人工智能迅猛发展的背景下,公开资料显示,微美全息(WIMI.US)始终专注于垂直行业的开源AI大模型开发,全面升级全栈AI能力,涵盖了AI基础设施及AI场景化应用,帮助各行业从模型开发、模型部署再到模型应用,能够全面用好AI工具箱,打造好用的AI。

另外,微美全息通过“技术开源+垂直深耕+生态共建”模式,正快速推进AI大模型的商业化应用。例如,面向汽车产业,以“AI大模型+产业场景”的多模型策略,在AI基础能力层、AI场景化应用层全面布局,保持汽车云服务市场领先优势。

未来,微美全息将完善AI算力全产业布局,持续布局专用算力基础设施,加快多模态技术融合、算力资源开放,加快提升智能算力公共服务平台能力,以及场景落地的敏捷性,未来或成为AI大模型算力生态的重要突破者。

结语

实际,从GPT-3到PaLM,从文心一言到通义千问,大模型的参数规模以指数级增长,训练成本动辄数千万美元,推理所需的算力更是呈几何倍数攀升。并且AI大模型推动传统产业智能化发展进入新阶段,全面智能化已成为企业参与市场竞争的必答题。因此,接下去企业需要理论研究与实践探索同步进行,进而赢得可观的发展空间。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备16017970号-3