苹果M3 Ultra史诗级逆袭！单挑8块A100竟跑出19.6t/s，74249元工作站碾压AI算力天花板！ - Apple银魂 - 科技改变生活 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

评分

苹果M3 Ultra史诗级逆袭！单挑8块A100竟跑出19.6t/s，74249元工作站碾压AI算力天花板！

等级-蕴含的太阳 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

27天前发布

100

震惊！苹果自研芯片引爆生成式AI革命，全新Mac Studio工作站凭M3 Ultra实现惊人突破。B站科技区现象级UP主”虽然但是张黑黑”最新实测视频引发行业地震：在运行6710亿参数的DeepSeek V3大模型时，搭载满血版M3 Ultra芯片的苹果工作站竟以19.66 Tokens/s的推理速度，正面碾压8张NVIDIA A100显卡组建的算力集群！

这场智能算力巅峰对决中，M3 Ultra展现了苹果统一内存架构的恐怖实力。当采用专为苹果生态优化的MLX框架时，其推理速度飙升至19.17 Tokens/s，直接超越价值数十万元的8卡A100系统（16.41 Tokens/s）。更令人惊叹的是，这套配置512GB统一内存的Mac Studio工作站，整套方案成本仅需74249元人民币，堪称大模型推理领域的性价比神机！

科技博主实测数据解密：

GGUF格式基准测试：M3 Ultra（15.78t/s）vs 8*A100（16.41t/s）
MLX框架优化后：M3 Ultra性能暴增21.5%达19.17t/s
DeepSeek V3模型实测：苹果芯片19.66t/s刷新行业纪录

不过这场AI算力革命仍有边界——在多用户并发推理和大模型训练场景中，配备HBM显存的A100依然保有优势。专家指出，M3 Ultra的突破性在于开辟了”端侧大模型”新赛道，其统一内存架构完美适配单用户的高效推理需求，特别适合AI绘画、智能编程等生成式AI应用场景。

值得关注的是，本次测试采用的512GB超大内存配置，正是苹果突破冯诺依曼架构限制的关键。这种颠覆性的内存设计，让Mac Studio在运行Llama3、DeepSeek等千亿参数模型时，彻底摆脱了传统GPU显存容量的桎梏。

评分

欢迎为Ta评分

万事屋新帖

热门槽点

最新吐槽！

万事屋用户榜！

等级-苍之风云 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

这家伙很懒，什么都没有写...

327

等级-摇曳的金星 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

这家伙很懒，什么都没有写...

228

我996我骄傲了么

等级-苍之风云 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

这家伙很懒，什么都没有写...

213

等级-蕴含的太阳 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

这家伙很懒，什么都没有写...

169

等级-奔跑的春风 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

这家伙很懒，什么都没有写...

139

等级-水面上的小草 - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地

这家伙很懒，什么都没有写...

20