Anthropic首席执行官澄清Claude 3.5 Sonnet谣言及Deepseek未来展望

Anthropic首席执行官达里奥·阿莫代伊近日对关于Claude 3.5 Sonnet的误解进行了澄清，并展望了Deepseek的技术进展。阿莫代伊明确指出，Claude 3.5 Sonnet的训练成本仅为1000万美元，远低于外界传闻的数十亿美元。他强调，该模型并未使用更复杂、未发布的模型（如Opus 3.5）生成的合成数据进行开发。尽管Claude 3.5 Sonnet在9到12个月前进行了训练，但其在编程和人际互动等实际任务中的表现依然领先。阿莫代伊进一步指出，Deepseek的真正技术成就并非R1模型，而是他们在12月底发布的Deepseek- v3模型。该模型引入了先进的“专家混合”方法等关键改进，展现了显著的技术进步。相比之下，R1模型主要基于现有的方法。他还提到，人工智能开发的成本通常每年下降约4倍，尽管如此，Deepseek仍投资了约5万个hopper代芯片，价值10亿美元，使其GPU储备相当于美国主要人工智能公司的2-3倍。在谈到人工智能模型的未来发展时，阿莫代伊强调，强化学习（RL）将成为扩展人工智能模型的核心。他指出，这种为Deepseek R1和OpenAI最新模型提供动力的新方法才刚刚开始显示其潜力，预示着Anthropic的下一个潜在版本将不会是标准的大型语言模型（LLM）。此外，阿莫代伊对中国的芯片出口管制发表了看法。他认为，Deepseek的进展使得这些限制变得更加重要，而不是减少。他指出，人工智能技术正变得越来越高效，但这并不是取消管制的理由。这些限制有助于阻止中国购买数以百万计的芯片，赶上美国的人工智能能力，并获得“军事优势”。阿莫代伊还提到，中国最好的人工智能芯片，如华为Ascend系列，其性能远不如美国英伟达（Nvidia）生产的领先芯片。关键要点： • Claude 3.5 Sonnet的训练成本为1000万美元，远低于外界传闻。 • Deepseek- v3模型引入了先进的“专家混合”方法等关键改进。 • 人工智能开发的成本每年下降约4倍，Deepseek投资了约5万个hopper代芯片。 • 强化学习将成为扩展人工智能模型的核心。 • 中国的芯片出口管制对阻止中国赶上美国的人工智能能力至关重要。总结性句子：Anthropic首席执行官达里奥·阿莫代伊通过对Claude 3.5 Sonnet的澄清和对Deepseek技术进展的展望，揭示了人工智能开发成本的下降趋势及强化学习的未来潜力，同时也对中国的芯片出口管制提出了重要见解。

查看原文登录松鼠快看订阅「大模型Daily」

松鼠快看 - 一站式阅读平台

PC端也可以便捷阅读公众号内容。在松鼠快看，开启更舒适的阅读体验。

立即注册，畅享一站式阅读体验

松鼠快看

智慧阅读，洞察未来。加入我们，开启您的知识探索之旅！

立即注册

Anthropic首席执行官澄清Claude 3.5 Sonnet谣言及Deepseek未来展望

最新文章

OpenAI计划发布没有使用限制的开放权重推理LLM

ChatGPT的新图像模型使文档伪造变得更加容易

吉卜力工作室创始人宫崎骏对人工智能的批评缺乏关键背景

松鼠快看 - 一站式阅读平台