“比拼规模的时代已过，大模型竞逐新赛道”

来源：中国舆情网时间：2025-11-29

导读：在当前大模型蓬勃发展的背景下，人们不禁思考：有无标准能够评价AI大模型的“智力水平”？不久前，清华大学研究团队发布了一项名为“大模型密度法则”的研究成果，并将相关论文发表在《自然·机器智能》杂志。所谓密度法则，揭示了大语言模型的最大能力密度

在当前大模型蓬勃发展的背景下，人们不禁思考：有无标准能够评价AI大模型的“智力水平”？不久前，清华大学研究团队发布了一项名为“大模型密度法则”的研究成果，并将相关论文发表在《自然·机器智能》杂志。所谓密度法则，揭示了大语言模型的最大能力密度呈指数增长趋势——从2023年2月至2025年4月，约每3.5个月增长一倍。

许多人对计算机领域的“摩尔定律”早已烂熟于心：芯片上的晶体管数量大约每隔固定时间便会翻倍。芯片之所以强大，并非靠体积的堆砌，而是凭借指甲盖大小的面积承载着庞大的计算单元。清华大学计算机科学与技术系助理研究员肖朝军向科技日报记者解释称，大模型的智能水平也需要与之相对应的评价指标，这个指标即是“能力密度”。

他们的研究核心观点在于：只要制造工艺相同且模型得到充分训练，模型规模不同，其能力密度会保持一致。类似于芯片领域借助提升电路集成度，促进计算设备小型化并广泛应用，AI大模型的进步主要依靠能力密度的提升来实现效率飞跃。

肖朝军补充道，以往人们受规模法则影响，更关注参数数量——即模型“体型”越大，智能程度似乎就越高。这种逻辑就像是关注举重运动员的体重，一般认为体重越大力量越强。如今，密度法则带来了新的视角：衡量AI模型发展势头时，能力密度（每个参数包含的智慧量）才是关键。正如评判武林高手，肌肉再强并不一定厉害，能够在招式中蕴含深厚功力才是高明之处。

团队通过系统分析近51个开源大模型，总结出一条重要发展曲线：大模型最大能力密度正加速指数增长，自2023年以来平均每3.5个月提升一倍。这意味着，随着数据、算力、算法相互协同，即使参数更少，也能呈现匹敌以往的智能水平。

研究还带来了进一步推论。例如，模型的推理消耗会因能力密度提升而迅速减少。数据显示，在ChatGPT发布之前，能力密度翻倍周期约为4.8个月，而其问世之后，这一周期缩短至3.2个月，增长速率提高了约50%。这表明，随着技术成熟与开源生态的发展，能力密度增速正不断加快。

肖朝军表示，能力密度越高，大模型便越聪明，所需算力也越小，相应成本降低。围绕这一理论，无论学术界还是工业界，都能展开多维创新，让大模型更容易被大众接受和应用。

从实际应用角度来看，密度法则不仅意味着AI变得更强，还在逐步走向“可用性增强”。肖朝军介绍，芯片电路密度与模型能力密度双重提升之下，原本只能部署在云端的大模型，未来有望在终端芯片上实现运行。如此一来，大模型本地化部署，可在响应速度、数据隐私等方面具备更多优势，为用户提供丰富的新服务。

肖朝军举例，如今智能汽车上的大模型多以“打开车窗”“查询附近的餐厅”等被动式服务居多。而当模型部署到终端时，凭借对车舱内外环境的感知与意图理解，能够融合多种信息实现主动决策，帮助智能座舱从被动响应向主动服务转型，让智能化真正融入驾驶过程。

记者张盖伦

编辑：夏蕊娜

上一篇：科学突破首次阐明溃疡性结肠炎的成因
下一篇：国家启动新兴产业示范基地建设工作