Deepseek或证明云基建是实现成本革命的关键
最近,DeepSeek 频繁登上热搜,这个来自中国的 AI 实验室因训练出 R1 开源推理模型而备受瞩目。R1 模型与 OpenAI 的世界最强 O1 推理大模型相比,实力不分伯仲。国内的大模型数量众多,为何 DeepSeek 能脱颖而出,掀起如此高的热度?
关键在于 DeepSeek 开辟了一条独特的技术路径。它摒弃了国外那种大量囤积显卡、疯狂堆砌算力、盲目购置硬件搭建数据中心,一味依靠海量数据投喂大模型的 “大力飞砖” 模式,而是仅利用普通硬件,对模型算法进行优化,以极低的成本就完成了大模型 R1 的训练。
美国一直试图将 AI 大模型与显卡垄断性地结合起来,打造一条资本密集型的坚固护城河,使得后来者想要涉足这一领域,就得付出巨大的成本和代价。然而,DeepSeek 的出现打破了这种局面。它以极高的性价比推出模型,彻底打破了业界对显卡的盲目迷信。DeepSeek 的成功,使得人们重新审视大模型发展的方向,不再单纯依赖高成本的算力投入。这一变革性的突破,对整个行业产生了深远影响。这一成果直接反映在英伟达的股价上 —— 英伟达股价暴跌。毕竟,当低算力成本也能训练出强大的大模型时,对高性能计算硬件的依赖程度自然会降低 。
但这并不意味着显卡就失去了其重要性,只是表明,在大模型训练中,没必要再毫无节制地疯狂屯卡。DeepSeek 用事实证明,在 AI 大模型的发展进程中,除了依赖强大的算力硬件,精妙的算法研究同样具有不可忽视的价值 !
就像百度 CEO 李彦宏指出,创新具有不可预测性,人们无法提前知晓它在何时何地发生。我们能做的,是积极营造一个有利于创新的环境。就像大语言模型领域,短短 12 个月,随着deepseek的横空出世,让大模型的推理成本就能降低 90% 以上,这种迅猛的发展速度远超以往计算机革命的进程。
而云基建在这一创新环境中扮演着关键角色,它能够帮助众多开发者和研究人员降低成本和门槛。从本质上讲,创新意味着成本下降与生产力提升,过往几百年的历史表明,大多数创新成果都与成本降低密切相关。在 AI、IT 等众多领域,成本降低一定比例,往往就伴随着生产力的同比例提高 。
另一方面DeepSeek不仅将模型、权重开放为可商用,还同步发表了一篇详细阐述训练过程的优质论文,这一做法堪称行业典范!
或许有人会疑惑,如此强大的模型,为何要选择开源?实则是 DeepSeek 团队深刻洞悉开源的巨大能量。要知道,基础设施往往需要根据实际情况定制,而开源能让更多人参与其中。从更宏观的角度来看,开源也是一种规则输出,有助于实现技术平权,打破技术封锁,降低 AI 社区的资源门槛,推动整个行业的进步。
DeepSeek 的开源之举,直接让 OpenAI 重新审视其收费策略。因为 DeepSeek 的开源意味着任何企业都能直接将其用于私有化部署,甚至还有面向个人本地部署的 R1 小型版本。反观 OpenAI,对中国研发人员严防死守,ChatGPT 官网即便通过科学上网也无法正常使用,用户只能花费高价寻求其他途径。
DeepSeek 将模型开源,也有力地回击了那些无端指责中国大模型抄袭 OpenAI 的言论。事实上,OpenAI 从未开源任何内容,说它是 “close ai” 也不为过。正所谓千言万语的辩解,都不如用实力说话。
还有人担心,开源之后 DeepSeek 该如何盈利?DeepSeek 的母公司 “幻方量化” 在金融领域经验丰富,在 DeepSeek R1 开源时,通过反手做空美股就收获颇丰。而且后续也能通过 API 收费来收回成本,不同于OpenAI 不得不采用高价 API 收费策略,也是因为deepseek的成本真的很低。
DeepSeek R1 的出现,拉开了硅谷 AI 霸权和神话破灭的序幕。也许有人会说 OpenAI 还有更新的模型尚未推出,但不可否认的是,国产大模型不仅有望跻身世界顶尖行列,而且性价比远超其他产品,价格仅有它们的几十分之一。创新的本质是成本下降与生产力提升!并且,我们国产大模型的发展潜力巨大,未来还会持续进化,不断带给世界更多惊喜 。
最后速来关注我们的公众号:小牛呼噜噜
!无需繁琐步骤,无任何套路,只需在后台回复deepseek
,精心整理的 DeepSeek 全套资料即刻免费到手,带你轻松解锁 DeepSeek 的奥秘