月之暗面 Kimi 聯(lián)合清華大學(xué)等開(kāi)源大模型推理架構(gòu) Mooncake

2024/11/28 13:06:19 來(lái)源:IT之家 作者:汪淼 責(zé)編:汪淼
感謝IT之家網(wǎng)友 Skyraver 的線索投遞!

IT之家 11 月 28 日消息,月之暗面 Kimi 和清華大學(xué) MADSys 實(shí)驗(yàn)室 2024 年 6 月聯(lián)合發(fā)布了 Kimi 底層的 Mooncake 推理系統(tǒng)設(shè)計(jì)方案。該系統(tǒng)基于以 KVCache 為中心的 PD 分離和以存換算架構(gòu),提升了推理吞吐量。

圖片

近日,為了進(jìn)一步加速該技術(shù)框架的應(yīng)用與推廣,月之暗面 Kimi 和清華大學(xué) MADSys 實(shí)驗(yàn)室聯(lián)合 9#AISoft、阿里云、華為存儲(chǔ)、面壁智能、趨境科技等共同發(fā)布開(kāi)源項(xiàng)目 Mooncake,共建以 KVCache 為中心的大模型推理架構(gòu)。

11 月 28 日,Mooncake 技術(shù)框架已開(kāi)源上線,IT之家附地址如下:

https://github.com/kvcache-ai/Mooncake

據(jù)介紹,Mooncake 開(kāi)源項(xiàng)目從論文延伸,以超大規(guī)模 KVCache 緩存池為中心,通過(guò)以存換算的創(chuàng)新理念大幅度減少算力開(kāi)銷(xiāo),提升了推理吞吐量。

本次開(kāi)源將采用分階段的方式,逐步開(kāi)源高性能 KVCache 多級(jí)緩存 Mooncake Store 的實(shí)現(xiàn),同時(shí)針對(duì)各類(lèi)推理引擎和底層存儲(chǔ) / 傳輸資源進(jìn)行兼容。其中傳輸引擎 Transfer Engine 部分現(xiàn)在已經(jīng)在 GitHub 全球開(kāi)源。

Mooncake 開(kāi)源項(xiàng)目的最終目標(biāo)是,為大模型時(shí)代打造一種新型高性能內(nèi)存語(yǔ)義存儲(chǔ)的標(biāo)準(zhǔn)接口,并提供參考實(shí)現(xiàn)方案。

Mooncake 推理系統(tǒng)架構(gòu)圖

Mooncake 推理系統(tǒng)架構(gòu)圖

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知