登录邮箱:1527511756@qq.com
当前位置:时空热线 >> 科技>>正文内容

阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点

2024年07月07日 来源:时空热线

在2024世界人工智能大会启明创投·创业与投资论坛上,阶跃星辰创始人、CEO姜大昕发表了演讲,分享了对于大模型发展现状与趋势的观察与思考。在演讲中,姜大昕重点阐述了一个核心观点:探索AGI路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达AGI。

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚未形成共识,但阶跃星辰认为,参数量接下来再提高一个数量级是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在随着参数量、数据量和计算量的增加呈幂次方增长。在此发展过程中,万亿参数量已经成为一个基本的入门门槛。

正是基于这样的认知,阶跃星辰很早便启动了万亿参数模型的训练。从千亿到万亿,模型的参数规模提升了一个量级,难度也提升了十倍以上。为此,阶跃星辰加大资源投入,尤其在系统和算法上积极探索,最终走通了万亿参数 MoE 大模型训练的道路。在 WAIC 2024 上,阶跃星辰发布了全新的 Step-2 万亿参数语言大模型正式版。根据从逻辑推理、世界知识、数学和编程等多个维度进行的权威测试,Step-2 模型能力都已全面接近国际主流模型,在部分测试集甚至实现了超越。

责任编辑:杜烽
相关推荐
阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。[详细]

阶跃星辰首次参加WAIC:谈“万亿参数+多模态”,出手即王炸

阶跃星辰的创始人姜大昕坚信,“万亿参数”和“多模融合”是攀登AGI这座高峰的必要条件。他认为,早期的AI语言、视觉、声音等不同模态独立发展,而现在不同模态开始走向融合,但理解能力与生...[详细]

WAIC热浪来袭,阶跃星辰《大闹天宫》互动体验区人气爆棚

《AI+大闹天宫》互动体验,巧妙地将中国经典动画《大闹天宫》与前沿AI技术相结合,为参观者提供了一次穿越时空的神奇旅程。参与者不仅可以上传自拍照,瞬间变身《大闹天宫》中的角色,还能通...[详细]

返回顶部