DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版

2025/1/20 21:37:38 來(lái)源：IT之家作者：遠(yuǎn)洋 責(zé)編：遠(yuǎn)洋

評(píng)論：

感謝IT之家網(wǎng)友 Extraverity、名人在路上飛的線(xiàn)索投遞！

IT之家 1 月 20 日消息，幻方量化旗下 AI 公司深度求索（DeepSeek）今日正式發(fā)布 DeepSeek-R1 模型，并同步開(kāi)源模型權(quán)重。

據(jù)官方介紹，DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)，在僅有極少標(biāo)注數(shù)據(jù)的情況下，極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上，性能比肩 OpenAI o1 正式版。

DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版

DeepSeek 稱(chēng)，DeepSeek-R1 蒸餾小模型超越 OpenAI o1-mini。DeepSeek 在開(kāi)源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個(gè) 660B 模型的同時(shí)，通過(guò) DeepSeek-R1 的輸出，蒸餾了 6 個(gè)小模型開(kāi)源給社區(qū)，其中 32B 和 70B 模型在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo) OpenAI o1-mini 的效果。

DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版

登錄 DeepSeek 官網(wǎng)或官方 App，打開(kāi)“深度思考”模式，即可調(diào)用最新版 DeepSeek-R1 完成各類(lèi)推理任務(wù)。

DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版

DeepSeek-R1 API 服務(wù)定價(jià)為每百萬(wàn)輸入 tokens 1 元（緩存命中）/ 4 元（緩存未命中），每百萬(wàn)輸出 tokens 16 元。

DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版

IT之家注意到，DeepSeek 已將 DeepSeek-R1 訓(xùn)練技術(shù)全部公開(kāi)，在發(fā)布并開(kāi)源 R1 的同時(shí)，同步在協(xié)議授權(quán)層面也進(jìn)行了如下調(diào)整：

模型開(kāi)源 License 統(tǒng)一使用 MIT。我們?cè)槍?duì)大模型開(kāi)源的特點(diǎn)，參考當(dāng)前行業(yè)的通行實(shí)踐，特別引入 DeepSeek License 為開(kāi)源社區(qū)提供授權(quán)，但實(shí)踐表明非標(biāo)準(zhǔn)的開(kāi)源 License 可能反而增加了開(kāi)發(fā)者的理解成本。為此，此次我們的開(kāi)源倉(cāng)庫(kù)（包括模型權(quán)重）統(tǒng)一采用標(biāo)準(zhǔn)化、寬松的 MIT License，完全開(kāi)源，不限制商用，無(wú)需申請(qǐng)。
產(chǎn)品協(xié)議明確可“模型蒸餾”。為了進(jìn)一步促進(jìn)技術(shù)的開(kāi)源和共享，我們決定支持用戶(hù)進(jìn)行“模型蒸餾”。我們已更新線(xiàn)上產(chǎn)品的用戶(hù)協(xié)議，明確允許用戶(hù)利用模型輸出、通過(guò)模型蒸餾等方式訓(xùn)練其他模型。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版

相關(guān)文章

DeepSeek-R1 模型發(fā)布，性能對(duì)標(biāo) OpenAI o1 正式版