震惊!苹果自研芯片引爆生成式AI革命,全新Mac Studio工作站凭M3 Ultra实现惊人突破。B站科技区现象级UP主”虽然但是张黑黑”最新实测视频引发行业地震:在运行6710亿参数的DeepSeek V3大模型时,搭载满血版M3 Ultra芯片的苹果工作站竟以19.66 Tokens/s的推理速度,正面碾压8张NVIDIA A100显卡组建的算力集群!
这场智能算力巅峰对决中,M3 Ultra展现了苹果统一内存架构的恐怖实力。当采用专为苹果生态优化的MLX框架时,其推理速度飙升至19.17 Tokens/s,直接超越价值数十万元的8卡A100系统(16.41 Tokens/s)。更令人惊叹的是,这套配置512GB统一内存的Mac Studio工作站,整套方案成本仅需74249元人民币,堪称大模型推理领域的性价比神机!
科技博主实测数据解密:
- GGUF格式基准测试:M3 Ultra(15.78t/s)vs 8*A100(16.41t/s)
- MLX框架优化后:M3 Ultra性能暴增21.5%达19.17t/s
- DeepSeek V3模型实测:苹果芯片19.66t/s刷新行业纪录
不过这场AI算力革命仍有边界——在多用户并发推理和大模型训练场景中,配备HBM显存的A100依然保有优势。专家指出,M3 Ultra的突破性在于开辟了”端侧大模型”新赛道,其统一内存架构完美适配单用户的高效推理需求,特别适合AI绘画、智能编程等生成式AI应用场景。
值得关注的是,本次测试采用的512GB超大内存配置,正是苹果突破冯诺依曼架构限制的关键。这种颠覆性的内存设计,让Mac Studio在运行Llama3、DeepSeek等千亿参数模型时,彻底摆脱了传统GPU显存容量的桎梏。
没有回复内容