
(广东27日讯)中国AI新创企业DeepSeek(深度求索)近期推出“DeepSeek-V3”与“DeepSeek-R1”两款最新的AI模型。这两款模型具备低廉的制造成本,且采用运算能力相对低阶的英伟达H800晶片,却拥有与全球顶尖AI语言模型匹敌的表现(例如OpenAI 的 ChatGPT-4),让矽谷巨头相当震惊。
《观点财经》报导,据美国匿名职场论坛TeamBlind上,一位自称Meta员工的贴文,自DeepSeek发布DeepSeek-V3以来,Meta旗下的Llama 4在各项测试中落后,让公司的生成式AI部门陷入恐慌。
更令人忧虑的是,这间鲜为人知的中国公司仅耗资557万美元(约2437万令吉)就达成这项技术成就。
该Meta员工指出,公司内部生成式AI部门的高阶主管薪资都超过DeepSeek的开发成本,而Meta目前拥有数十位此类高管,令人质疑部门庞大成本的合理性。
Meta试图复制技术
该员工透露,目前Meta工程师正疯狂研究分析DeepSeek的成功秘诀,试图复制任何可复制的技术。然而,当DeepSeek-R1发布时,情况变得更加严峻。该员工表示,虽然无法透露具体细节,但一些资讯将很快公开。
DeepSeek-V3于去年12月26日发布后,随即成为开源模型的领头羊。DeepSeek公布的技术报告数据显示,Meta的Llama 3.1-405B仅在 MMLU-Pro大规模多任务理解数据集上接近DeepSeek-V3的水平,而在其他项目中表现几乎都不及八成。
今年1月20日,DeepSeek正式发表DeepSeek-R1,官方技术报告中的对照模型,仅包含OpenAI公司的闭源模型OpenAI o1以及自家模型DeepSeek-v3。
在前次DeepSeek-V3测试中被拿来做对照的Meta、Anthropic等公司模型在本次报告中已销声匿迹。