评分

清华发布AI加速神器，单卡驾驭满血版DeepSeek R1！

9天前更新

951

这可是真厉害了，运行Deepseek R1/V3的满血Q4_K_M 版本，仅需 14GB 显存和 382GB 内存。

清华大学的kvcache.ai团队发布的ktransformer大模型加载框架v0.3 Preview，提升本地加载满血deepseek 671b的运行效率。

预填充速度性能指标27.79 倍于llama.cpp

解码速度3倍于llama.cpp

硬件环境:

github链接：

https://github.com/kvcache-ai/ktransformers

https://github.com/kvcache-ai/ktransformers/blob/main/doc/en/DeepseekR1_V3_tutorial.md

评分

欢迎为Ta评分

万事屋新帖

热门槽点

最新吐槽！

万事屋用户榜！

这家伙很懒，什么都没有写...

286

这家伙很懒，什么都没有写...

228

这家伙很懒，什么都没有写...

189

这家伙很懒，什么都没有写...

133

这家伙很懒，什么都没有写...

122

这家伙很懒，什么都没有写...