Welcome to 0516f.com ! 游戏 应用 新闻 专题 排行
首页 > 新闻 > DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Sebastian
Feb 27,2025

DeepSeek的廉价AI模型令人惊讶地挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,大大削弱了竞争对手,仅需600万美元。然而,这似乎很低的成本掩盖了更多的投资。

DeepSeek Test图像:ensigame.com

DeepSeek V3的创新架构有助于其效率。关键技术包括用于同时单词预测的多态预测(MTP),使用256个神经网络的专家(MOE)进行加速训练的混合物(MOE)以及多头潜在注意(MLA)(MLA),以改善信息提取。

DeepSeek V3图像:ensigame.com

但是,一份半分析报告显示,基础设施大得多:约有50,000名NVIDIA GPU,耗资约16亿美元,运营费用接近9.44亿美元。这与公开的600万美元培训成本形成鲜明对比,这仅反映了培训前的GPU使用情况,不包括研究,改进,数据处理和整体基础设施。

DeepSeek的独立性和高效结构是高级对冲基金的子公司,是其成功的关键。拥有其数据中心可以优化模型开发和快速创新。公司的自筹资金和精益结构也有助于其敏捷性。对于一些研究人员来说,高薪高薪,每年超过130万美元,吸引了中国大学的顶尖人才。

DeepSeek图像:ensigame.com

尽管DeepSeek的600万美元索赔具有误导性,但与竞争对手相比,其实际投资超过5亿美元仍然代表了巨大的成本优势。该公司的R1型号的培训花费了500万美元,而Chatgpt-4据说耗资1亿美元。 DeepSeek的成功强调了一家资金充足,独立的AI公司的竞争潜力,尽管其“预算友好”的叙述需要资格。

DeepSeek图像:ensigame.com

总之,DeepSeek的竞争优势源于大量投资,技术创新和高技能的团队的结合,而不仅仅是培训预算非常低。但是,即使有了校正的数字,其成本仍然大大低于其竞争对手的成本。

最新文章
  • 夏日游戏节2025:未来游戏展前瞻指南
    "未来游戏展2025"将作为夏日游戏节主阵容的一部分,展示超过十款游戏。请继续阅读,了解关于这场即将到来的活动及其已知最新详情。← 返回至2025年夏日游戏节未来游戏展2025:完整概览未来游戏展2025时间安排官网已突出展示未来游戏展2025的官方时间安排。该展会将于2025年6月7日美国东部时间下午4点开始,计划持续约三小时,将与夏日游戏节的"绿色游戏展示会"同步直播。本次活动由劳拉·贝利和马修·默瑟主持,他们分别是《尼尔》中的凯妮和《生化危机6》中里昂的配音演员,届时将重点展示超过十款作品
    作者 : Anthony Dec 26,2025
  • 《英灵神殿》公布英雄晋升系统 新增多款道具
    英灵殿生存游戏刚刚推出了一次重大更新,引入了全新的游戏系统和挑战。雄狮之心工作室已正式将英雄晋升系统整合到游戏体验中。此外,还新增了一大批全新的战场物品。新系统有何作用?英灵殿生存游戏中的英雄晋升系统允许您使用英雄碎片来提升您的英雄。每次升级都会增强英雄的通用能力及其职业特定技能。此外,您还能解锁第二个技能槽,用于装备来自其他英雄的强大技能。每次升级尝试都保证成功。达到特定的晋升里程碑将授予累积的被动增益。对于那些达到特定等级阈值的玩家,还将解锁独特的个人资料图标和边框,以彰显您的投入。您可以在
    作者 : Simon Dec 26,2025