設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
漫威《复仇者联盟 5》开拍,27 名演员公布    2025 胡润全球富豪榜发布

美團開源首發(fā) INT8 無損滿血版 DeepSeek R1,部署 A100 實現(xiàn) 50% 吞吐提升

2025/3/7 18:00:41 來源:IT之家 作者:汪淼 責編:汪淼
感謝IT之家網(wǎng)友 HH_KK、天擎 的線索投遞!

IT之家 3 月 7 日消息,美團搜推機器學習團隊 3 月 4 日公布最新首發(fā)開源成果,實現(xiàn)對 DeepSeek R1 模型基本無損的 INT8 精度量化。

DeepSeek R1 原生版本的模型權(quán)重為 FP8 數(shù)據(jù)格式,對 GPU 芯片類型有嚴格限制,僅能被英偉達新型 GPU 支持(如 Ada、Hopper 架構(gòu)芯片),其他型號 GPU(如 A100)無法直接部署。

目前,量化代碼已經(jīng)合入到了開源 LLM 推理框架 SGLang,量化模型已經(jīng)發(fā)布到了 Hugging Face 社區(qū),方便用戶使用。官方測試,滿血版 DeepSeek R1 部署 A100,基于 INT8 量化,相比 BF16 實現(xiàn) 50% 吞吐提升。

IT之家附開源地址:

https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:DeepSeek,美團開源,開源AI
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知