全球前十开源模型均源自中国!千问3.5霸榜,国产AI改写游戏规则

正文内容

当全球最大AI开源社区的榜单揭晓时,人们看到了一个从未出现过的景象:前十名,清一色来自中国。

2月24日,全球最大AI开源社区Hugging Face公布了最新一期开源大模型榜单。结果让整个AI圈为之一震:

排名前十的开源模型,均是中国模型或中国模型的衍生模型。阿里千问3.5系列包揽前四,成为全球AI社区最热门的开源模型

这不再是“追赶”,而是“领跑”。

01 榜单震撼:前十名全是“中国造”

根据Hugging Face公布的数据,在最新一期全球开源模型榜单中,排名前十的模型全部源自中国

其中,阿里千问3.5模型包揽前四,基于千问大模型的3款衍生模型同样入选前十。紧随其后的,是智谱、MiniMax、月之暗面等多家中国机构研发的开源模型

这并非偶然的“爆发”。麻省理工与Hugging Face此前发布的联合报告显示,过去一年,中国研发的开源模型全球下载量占比达到17.1%首次超过美国,位居全球第一

一个曾被西方主导的赛道,正在被中国改写游戏规则。

02 千问3.5:为何能霸榜?

千问3.5系列的开源,始于除夕那天。

2月16日除夕当天,阿里巴巴开源了新一代大模型千问Qwen3.5-Plus。这款总参数3970亿、激活仅170亿的模型,性能媲美Gemini 3 Pro,部署显存占用降低60%,推理吞吐量最高提升19倍,API价格仅为Gemini 3 Pro的1/18

随后,千问团队继续放出“杀手锏”。2月25日,三款中等规模新模型开源,包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B。其中Qwen3.5-35B-A3B通过4-bit量化,可在24GB显存的消费级显卡上流畅运行,成为本地开发者的理想助手

开发者实测给出了更有说服力的数据:

  • 人类中级程序员5小时才能完成的编程测试,Qwen3.5-35B-A3B仅用10分钟高分通过
  • 在上下文引用等关键模型能力上,表现优于Claude Sonnet 4.6、Gemini 3 Pro等8款主流模型
  • 在指令遵循(IFBench)、博士级别推理(GPQA)、数学推理(HMMT 25)等多个权威榜单上,超越远大于其规模的上代旗舰模型

截至目前,千问共开源400多款模型,覆盖全尺寸、全模态,累计下载量超10亿,衍生模型超20万,稳居全球第一开源大模型。了解不同尺寸模型的适用场景,可以参考 开源模型选型指南

03 MOVA:填补国内空白的音视频模型

就在千问霸榜的同时,另一个国产开源模型也悄然亮相。

上海创智学院联合模思智能发布了国内首个开源高质量音视频同步生成模型MOVA,填补了国内开源大模型在音视频同步生成基础模型领域的空白

相比字节跳动商用导向的Seedance2.0(不开放下载、不允许本地部署),MOVA选择了一条不同的路:完全开源

MOVA项目负责人、复旦大学教授邱锡鹏解释:“选择开源是为了技术普惠,唯有开源才能吸引更多人参与研究,既推动技术快速进步,也助力国内开源生态建设。”

正是基于这一理念,MOVA不仅完整开源360p、720p两个基础模型,还开源了微调、推理、生成工作流在内的全链路组件,支持二次开发、本地部署和学术研究。不管是做动漫还是游戏,都能以MOVA为“底座”,按自己的需求和风格进一步优化,适合中小团队、垂直场景的低成本落地。

据透露,MOVA1.5预计在3月底推出,性能将有更大提升。想了解音视频生成模型的最新进展,可以关注 AI前沿 系列。

04 DeepSeek V4:下一场重头戏

开源模型的战局并未因千问霸榜而终结。下一个焦点,已经浮现。

3月1日,DeepSeek宣布将于下周正式推出全新多模态大语言模型V4版本。该模型原生支持文本、图像与视频的联合理解与生成,是继今年1月发布R1推理模型后,DeepSeek在技术路线上的首次重大升级

更值得关注的是V4在测试阶段采取的战略性授权安排

DeepSeek已向包括华为在内的多家国内硬件企业开放模型测试权限。与此形成鲜明对比的是,全球主要GPU厂商英伟达与AMD此次未获得预发布版本的接入资格

这一做法突破了人工智能领域长期以来形成的行业惯例。通过差异化测试授权,国内芯片厂商得以提前数周开展模型部署、编译优化与推理加速等深度适配工作,从而在模型落地效率、运行能效及软硬协同水平等方面构建实质性优势

Information此前爆料,DeepSeek V4的编程实力可以赶超Claude、GPT系列等顶尖闭源模型。若真如此,2026年的开源模型竞赛,将再添一位重量级选手。关于DeepSeek的更多动态,可以查看 DeepSeek系列教程

05 开源生态:从“跟跑”到“领跑”

国产开源模型的集体爆发,并非一日之功。

2023年2月,复旦大学发布类ChatGPT对话式大模型MOSS,时隔两个月便正式开源,成为国内首个支持搜索、画图、计算等插件的开源对话模型

2024年,DeepSeek-R1以不到30万美元的训练成本震撼业界,证明力大砖飞并非唯一路径。黄仁勋感叹:“Deepseek-R1是开源模型的一大代表,让整个世界惊讶,在2025年引领了开源模型的发展。”

2025年,阿里千问累计开源超300个模型,衍生模型数量超17万个,全球下载量持续攀升。

2026年,千问3.5霸榜、MOVA填补空白、DeepSeek V4蓄势待发。

这条时间线揭示了一个事实:中国开源模型已从“跟跑”走向“并跑”,并在某些维度实现“领跑”。想了解不同开源模型的技术差异,可以参考 开源模型对比评测

06 为什么是现在?三个关键因素

国产开源模型的集体突围,背后有深层逻辑。

第一,算力不再是唯一核心指标。 DeepSeek-R1证明,通过算法优化和架构创新,可以用更低的成本实现顶尖性能。这降低了后来者的门槛,也让更多人相信“华山并非一条路”

第二,开源成为落地最短路径。 模型开源的底层逻辑是打造正反馈的AI生态,通过沉淀用户壮大基本盘,进而释放更大商业价值。当这条路走通之后,互联网大厂纷纷入局与加码

第三,场景驱动倒逼能力提升。 千问3.5在Agent工具调用(BFCL v4)、Agentic Coding(SWE-bench Verified)等评测中的优异表现,源于对真实应用场景的深度理解。想学习如何将开源模型应用于实际场景,可以看看 落地AI应用场景 分类的教程。

写在最后:开源模型的“中国时刻”

Hugging Face榜单前十名全部源自中国,这是一个象征性的“中国时刻”。

但它也带来新的问题:当开源模型的能力已经比肩甚至超越闭源模型,当任何人都可以下载、部署、微调这些模型,AI的竞争格局会发生怎样的变化?

一种可能是:模型本身不再是护城河,数据和场景才是

邱锡鹏在谈到MOVA时提到一个更深层的观点:“视频生成本身只是一项基础任务,其核心价值在于通过这一任务赋能模型,推动模型向更高层次智能演进。当视频模型实现真正的智能提升后,最终将指向通用人工智能。”

开源的意义,或许正在于此——它不是终点,而是通往AGI的必经之路。

而这条路,中国已经走在了前列。

想持续追踪开源模型最新动态?

文章评分

这篇文章对您有帮助吗?

分享到

微信
朋友圈
QQ
QQ空间
微博
抖音
小红书
复制
二维码

实用功能

夜间模式
小字
大字
收藏
目录
笔记
朗读
相关
搜索
我的笔记
文章内搜索
相关文章推荐
正在加载相关文章...

反馈建议

您需要登录后才能填写意见反馈信息

分享二维码

使用手机扫描二维码

操作成功