Anthropic首席执行官澄清Claude 3.5 Sonnet谣言及Deepseek未来展望

avatar大模型Daily
Anthropic首席执行官达里奥·阿莫代伊近日对关于Claude 3.5 Sonnet的误解进行了澄清,并展望了Deepseek的技术进展。阿莫代伊明确指出,Claude 3.5 Sonnet的训练成本仅为1000万美元,远低于外界传闻的数十亿美元。他强调,该模型并未使用更复杂、未发布的模型(如Opus 3.5)生成的合成数据进行开发。尽管Claude 3.5 Sonnet在9到12个月前进行了训练,但其在编程和人际互动等实际任务中的表现依然领先。 阿莫代伊进一步指出,Deepseek的真正技术成就并非R1模型,而是他们在12月底发布的Deepseek- v3模型。该模型引入了先进的“专家混合”方法等关键改进,展现了显著的技术进步。相比之下,R1模型主要基于现有的方法。他还提到,人工智能开发的成本通常每年下降约4倍,尽管如此,Deepseek仍投资了约5万个hopper代芯片,价值10亿美元,使其GPU储备相当于美国主要人工智能公司的2-3倍。 在谈到人工智能模型的未来发展时,阿莫代伊强调,强化学习(RL)将成为扩展人工智能模型的核心。他指出,这种为Deepseek R1和OpenAI最新模型提供动力的新方法才刚刚开始显示其潜力,预示着Anthropic的下一个潜在版本将不会是标准的大型语言模型(LLM)。 此外,阿莫代伊对中国的芯片出口管制发表了看法。他认为,Deepseek的进展使得这些限制变得更加重要,而不是减少。他指出,人工智能技术正变得越来越高效,但这并不是取消管制的理由。这些限制有助于阻止中国购买数以百万计的芯片,赶上美国的人工智能能力,并获得“军事优势”。阿莫代伊还提到,中国最好的人工智能芯片,如华为Ascend系列,其性能远不如美国英伟达(Nvidia)生产的领先芯片。 关键要点: • Claude 3.5 Sonnet的训练成本为1000万美元,远低于外界传闻。 • Deepseek- v3模型引入了先进的“专家混合”方法等关键改进。 • 人工智能开发的成本每年下降约4倍,Deepseek投资了约5万个hopper代芯片。 • 强化学习将成为扩展人工智能模型的核心。 • 中国的芯片出口管制对阻止中国赶上美国的人工智能能力至关重要。 总结性句子:Anthropic首席执行官达里奥·阿莫代伊通过对Claude 3.5 Sonnet的澄清和对Deepseek技术进展的展望,揭示了人工智能开发成本的下降趋势及强化学习的未来潜力,同时也对中国的芯片出口管制提出了重要见解。

最新文章

OpenAI计划发布没有使用限制的开放权重推理LLM

4/2/2025

ChatGPT的新图像模型使文档伪造变得更加容易

4/1/2025

吉卜力工作室创始人宫崎骏对人工智能的批评缺乏关键背景

3/31/2025
logo

松鼠快看 - 一站式阅读平台

PC端也可以便捷阅读公众号内容。在松鼠快看,开启更舒适的阅读体验。