設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
央视入股爱奇艺    抖音首次公开推荐算法原理

月之暗面因 DeepSeek 調(diào)整工作重心??jī)?nèi)部人士:強(qiáng)化學(xué)習(xí)或許會(huì)是個(gè)方向

2025/2/15 16:51:20 來(lái)源:新浪科技 作者:凌辰 責(zé)編:清源

2 月 15 日下午消息,據(jù)媒體報(bào)道,月之暗面內(nèi)部已經(jīng)將“持續(xù)拿到 SOTA 結(jié)果”確定為當(dāng)下最重要的工作目標(biāo)。2025 年,月之暗面圍繞模型能力的關(guān)鍵方向除了繼續(xù)強(qiáng)化多模態(tài)部分外,還會(huì)繼續(xù)強(qiáng)化長(zhǎng)文本推理能力。

報(bào)道分析稱,DeepSeek 爆火后,DeepSeek 與月之暗面存在的路線差異,讓外界面臨重新審視月之暗面技術(shù)模式、用戶增長(zhǎng)模式的情況。其中,月之暗面閉源,堅(jiān)持預(yù)訓(xùn)練(需要大量卡和算力資源),且不把蒸餾技術(shù)作為關(guān)鍵,在 C 端市場(chǎng)通過(guò)大量投流實(shí)現(xiàn)拉新;而 DeepSeek 則是開(kāi)源,雖然也采取預(yù)訓(xùn)練,但把蒸餾技術(shù)作為關(guān)鍵手段大幅度節(jié)省成本,在 C 端市場(chǎng)并未投流。

而今,DeepSeek 采用區(qū)別與月之暗面的路線,也取得了現(xiàn)階段更為出色的效果。業(yè)內(nèi)人士認(rèn)為,月之暗面如果想守住生態(tài)位,“需要做一些改變或者嘗試,比如開(kāi)源,比如調(diào)整引流策略等。”不過(guò)目前,月之暗面尚未明確是否“接入”DeepSeek,對(duì)于接下來(lái)是否“開(kāi)源”,公司也未置評(píng)媒體問(wèn)詢。

對(duì)于月之暗面是否會(huì)因 DeepSeek 而調(diào)整工作重心一事,新浪科技向月之暗面方面求證,截止發(fā)稿公司暫無(wú)回應(yīng)。不過(guò)有內(nèi)部人士透露稱,“RL(強(qiáng)化學(xué)習(xí))大概率會(huì)是一個(gè)(工作重點(diǎn))方向”。

作為此次 DeepSeek 出圈后最受關(guān)注的熱門技術(shù)話題,DeepSeek 通過(guò)大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù)得到比肩 OpenAI o1 能力的 DeepSeek-R1-Zero,令業(yè)界倍感興奮。新浪科技了解到,去年 11 月份月之暗面宣布推出新一代數(shù)學(xué)推理模型 k0-math 之際,Kimi 探索版便通過(guò)運(yùn)用強(qiáng)化學(xué)習(xí)技術(shù)創(chuàng)新了搜索體驗(yàn),在意圖增強(qiáng)、信源分析和鏈?zhǔn)剿伎既笸评砟芰ι蠈?shí)現(xiàn)突破。彼時(shí),月之暗面 Kimi 創(chuàng)始人楊植麟便對(duì)強(qiáng)化學(xué)習(xí)這一技術(shù)路線帶來(lái)的模型能力提升給予了高度評(píng)價(jià)。

而在近日 OpenAI 發(fā)布關(guān)于推理模型在競(jìng)技編程中應(yīng)用的研究論文報(bào)告《Competitive Programming with Large Reasoning Models》中,論文也特別提到,“中國(guó)的 DeepSeek-R1 和 Kimi k1.5 通過(guò)獨(dú)立研究顯示,利用思維鏈學(xué)習(xí)(COT)方法,可顯著提升模型在數(shù)學(xué)解題與編程挑戰(zhàn)中的綜合表現(xiàn)。其中 k1.5 便是 DeepSeek 和 Kimi 在 1 月 20 日同時(shí)發(fā)布的新型推理模型?!?/p>

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:月之暗面Kimi,DeepSeek
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知