Welcome to 0516f.com ! 游戏 应用 新闻 专题 排行
首页 > 新闻 > DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Sebastian
Feb 27,2025

DeepSeek的廉价AI模型令人惊讶地挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,大大削弱了竞争对手,仅需600万美元。然而,这似乎很低的成本掩盖了更多的投资。

DeepSeek Test图像:ensigame.com

DeepSeek V3的创新架构有助于其效率。关键技术包括用于同时单词预测的多态预测(MTP),使用256个神经网络的专家(MOE)进行加速训练的混合物(MOE)以及多头潜在注意(MLA)(MLA),以改善信息提取。

DeepSeek V3图像:ensigame.com

但是,一份半分析报告显示,基础设施大得多:约有50,000名NVIDIA GPU,耗资约16亿美元,运营费用接近9.44亿美元。这与公开的600万美元培训成本形成鲜明对比,这仅反映了培训前的GPU使用情况,不包括研究,改进,数据处理和整体基础设施。

DeepSeek的独立性和高效结构是高级对冲基金的子公司,是其成功的关键。拥有其数据中心可以优化模型开发和快速创新。公司的自筹资金和精益结构也有助于其敏捷性。对于一些研究人员来说,高薪高薪,每年超过130万美元,吸引了中国大学的顶尖人才。

DeepSeek图像:ensigame.com

尽管DeepSeek的600万美元索赔具有误导性,但与竞争对手相比,其实际投资超过5亿美元仍然代表了巨大的成本优势。该公司的R1型号的培训花费了500万美元,而Chatgpt-4据说耗资1亿美元。 DeepSeek的成功强调了一家资金充足,独立的AI公司的竞争潜力,尽管其“预算友好”的叙述需要资格。

DeepSeek图像:ensigame.com

总之,DeepSeek的竞争优势源于大量投资,技术创新和高技能的团队的结合,而不仅仅是培训预算非常低。但是,即使有了校正的数字,其成本仍然大大低于其竞争对手的成本。

最新文章
  • 小岛秀夫评估《OD》早期反馈,力求打造持久影响力。
    随着《死亡搁浅2:冥滩》现已完成,小岛秀夫正专注于由Xbox发行的《OD》,他曾称该项目是“我一直想打造的游戏”。在与Ssense的对话中,小岛回顾了《死亡搁浅2》的开发与反响,并简要透露了接下来的计划,包括神秘的《OD》。若你期待具体的细节,恐怕要失望了——小岛对新作依然守口如瓶,这是他的一贯风格。不过,他将这款游戏描述为“一种完全不同的东西……人们要么会爱上它,要么会讨厌它。”值得注意的是,小岛似乎对可能面临的批评并不在意。他承认自己很可能会看到网上的粉丝讨论,观看分析其作品的视频文章,但他
    作者 : Julian Dec 27,2025
  • 废车场狂飙:美国南方亡命赛车纪实
    《废土狂飙》是 Istom Games 最新推出的汽车冒险游戏,它带来了源自美国南部、粗犷刺激的狂野赛车体验。游戏灵感源自《正义先锋》中的大胆飞车特技,每一场比赛都是你证明自己才是真正公路霸主的机会。极速狂飙!在《废土狂飙》中,由定制引擎驱动的赛车将咆哮着驶过尘土飞扬的乡间小道、废车场捷径和乡村公路。体验高速驾驶、大胆超车以及车轮卷起的滚滚烟尘。游戏提供多种模式,保持新鲜感。在锦标赛模式中,你将与同一批对手进行多轮较量,包含三种不同的赛制:竞速赛、淘汰赛和计时赛。若想进行纯粹的比拼,可以选择竞速
    作者 : Savannah Dec 27,2025