分享好友 最新资讯首页 最新资讯分类 切换频道
DeepSeek开源周收官,颠覆存储架构!OpenAI继续“大力出奇迹”,GPT-4.5价格达R1的270倍
2025-03-06 07:58

每经记者:岳楚鹏    每经编辑:程鹏,兰素英

谁能想到为了搞大模型自己弄了套文件系统?

2月28日,DeepSeek开源周的最后一天,DeepSeek直接公开了V3和R1训练推理过程中用到的Fire-Flyer文件系统(简称3FS,第三个F代表File)和基于3FS和DuckDB构建的轻量级数据处理框架Smallpond。

3FS是一个真正意义上面向现代SSD(固态硬盘)和RDMA(远程直接访问)网络的文件系统,它可以把固态硬盘的带宽性能利用到极致,并表现出了惊人的速度:180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。

KCORES联合创始人karminski-牙医评价道:“DeepSeek颠覆了存储架构。”

根据DeepSeek团队介绍,3FS就是为了AI训练和推理工作负载的挑战所开发的。它利用现代SSD和RDMA网络来提供共享存储层,从而简化分布式应用程序的开发。

它可以在没有双方操作系统介入的情况下,将数据直接从一台计算机的内存传输到另一台计算机,也不需要中央处理器、CPU缓存或上下文交换参与。特点就是高通量、低延迟,尤其适合在大规模并行计算机集群中使用。

那这样方便的系统,有什么作用呢?每经小编请DeepSeek大模型用白话来解答这一问题。

图片

而在DeepSeek开源3FS文件系统前几个小时,OpenAI推出了期待已久的GPT-4.5,之前这个模型的代号为“Orion”。OpenAI声称这是其迄今最大、知识最丰富的模型,现已向每月订阅费用达200美元的ChatGPT Pro用户开放。

OpenAI首席执行官阿尔特曼表示,新模型的运行成本太高了,下周OpenAI将增加数万块GPU,提供算力支撑。

在马斯克旗下xAI的Grok 3发布时,大家都兴奋地表示,Scaling Law(规模法则)还没有撞墙。但GPT-4.5一出,外界发现,OpenAI“撞墙”了。

GPT-4.5的预训练计算量是GPT-4的10倍,但是基准测试只比4o好5%。在AIME和GPQA等困难的学术基准测试中,GPT-4.5的表现也达不到o3-mini、DeepSeek-R1和Claude 3.7 Sonnet等领先AI推理模型的水平。

阿尔特曼都只能解释道,虽然它又贵,又慢,又不够好。但是它有人情味儿。

有博主测评后表示,GPT-4.5这情商高得直接把智商干没了。

而GPT-4.5的价格也是高到离谱,每百万Tokens输出价格150美元(约合人民币1093.5元),是其他模型的10~100倍,更别说和DeepSeek比了。

2月26日,DeepSeek宣布了错峰价格制度,DeepSeek-R1在高峰期每百万Tokens输出价格为2.19美元(约合人民币15.9元),低谷期的价格仅为0.55美元 (约合人民币4元)。以低谷期的价格计算,GPT-4.5的价格是DeepSeek-R1的近270倍。

DeepSeek为何能做出成本高效的AI模型呢?从这周开源的五大项目就能看出来,DeepSeek主打的就是“榨干”硬件性能。

第一天:架构,直接“爆改”英伟达GPU,突破H800计算上限;

第二天:DeepEP,第一个用于MoE(混合专家)模型训练和推理的开源EP(专家并行)通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

第三天:DeepGEMM,仅300行代码的通用矩阵乘法库;

第四天:连开三源,创新的双向流水线并行算法DualPipe、用于MoE的负载均衡算法EPLB,以及训练和推理框架的性能分析数据;

第五天:3FS和Smallpond,高效的分布式文件系统和以之为基础的数据处理框架压榨固态硬盘性能。

在DeepSeek的数弹连发后,有网友称,DeepSeek成领头羊了。

那让我们来看看,DeepSeek是怎么评价GPT-4.5这一模型的吧。

图片

所以说,与其用OpenAI的天价模型,真不如使用DeepSeek更高效的R1模型。但老是“服务器繁忙,请稍后再试”,怎么办?

不用担心,2月12日每日经济新闻App和每经网全面接入DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型。用户通过每日经济新闻App和每经网就能与大模型自由对话还能一键“问公司”“问投资”“问基金”。

不得不说,用起来真的很丝滑,目前使用量已经超15万次了! 

咋用呢?超简单!

下载每日经济新闻App

https://www.nbd.com.cn/corp/2016app/index.html

再往下看

一、 在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。

图片

二、 进入“每经大模型平台”页面,即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。

图片

最近,每经“136计划”还增加了新功能:

大模型解读投资热榜。

只需点击投资热榜中的任意新闻。

图片

立即就能得到大模型的全面分析。

还能一键生成图片分享给朋友。

图片

图片

告别“服务器繁忙”

快用每日经济新闻App吧!

(免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。)

记者|岳楚鹏

编辑|程鹏 兰素英 杜波

校对|孙志成

图片

|每日经济新闻  nbdnews  原创文章|

未经许可禁止转载、摘编、复制及镜像等使用


最新文章
1枚比特币=10万美元? 比特币会暴涨,也会暴跌
12月5日,比特币价格首次突破10万美元,再创历史新高。自特朗普胜选以来,比特币涨幅已达40%,市值逼近2万亿美元,相当于两个或
“南方小土豆”的美味:苏式熏鱼
近日,哈尔滨的“南方小土豆”词条频频登上热搜,其特指来北方玩雪身穿浅色的羽绒服,头戴可爱帽子,再坐上行李箱脚都够不着地的
延续奇幻热潮,TVB奇幻喜剧《双生陌生人》于5月2日埋堆堆APP全网独播
2020年的TVB最佳剧集《反黑路人甲》斩获高口碑和高收视,狂扫多个奖项。相隔2年,监制林志华带领观众熟悉的班底成员,炮制全新剧
4Plas 尼龙6 4MID 9B23300高强度
供应 PA6 4MID 9B22330 H 生产商: 4Plas供应 PA6 4MID 9B23100 生产商: 4Plas供应 PA6 4MID 9B23300 UV 生产商: 4Plas供应 PA6 4
出海这件事是怎么火上加火的
文 | 习木方编辑 | 杨旭然相对于以前“大型企业走出去”的国家战略,或者一些大量现金买买买的方式,这一轮新兴企业的出海,
黑龙江省第十五届运动会—女子篮球比赛圆满落幕
是一群无畏的斗士,使劲浑身解术,只为夺得头筹,坚定脚印,将无穷的潜力聚集,执着的背影在那一刻结成永恒,你是站在追光之外的
【入门攻略】《三角洲行动》药品指南
而高强度的伤害,比如遭遇敌方集火、爆炸物功能、从高处坠落等,则可能会导致一些异常状态。例如:身体各部位出现伤口,就会陷入
从爱情见证物到废弃物,销毁婚纱照火了
(IC photo / 图)这年头,关于爱情的生意,开始逐渐突破人们的想象力。比如最近,一项新兴业务就吸引了大众的注意。都知道结婚
真我彻底发飙?“顶尖性能”手机才卖2465元,6500mAh+120W+IP69
谈到“性价比”三个字,相信不少网友都会首先想到小米这个品牌,然而,现在的小米不再是极致性价比的代名词,而是把性价比的衣钵
三国谋定天下:白板大黄猪逆转满红大乐马!教科书式的倒反天罡!
在此特别鸣谢游戏ID名为“北境丨搁浅”的玩家朋友,给本文提供了宝贵的创作素材。北境丨搁浅自己都想不到,他用白板的大乔、黄盖
推荐文章