IT之家 1 月 30 日消息,人工智能正加速向著邊緣計算領域發(fā)展,Copilot+ PC 在其中扮演著重要角色。隨著 DeepSeek R1 出現(xiàn),微軟也意識到了這一模型可能會帶來了一系列變革。
微軟今日發(fā)文,宣布推出針對 NPU 優(yōu)化的 DeepSeek-R1(IT之家注:已在 Azure AI Foundry 和 GitHub 上提供),首批將面向搭載高通驍龍 X 芯片的 Copilot+ PC 推出,隨后是英特爾酷睿 Ultra 200V 等平臺。
微軟表示,首個版本 DeepSeek-R1-Distill-Qwen-1.5B 將在 AI Toolkit 中提供,7B 和 14B 版本也將很快推出,從而幫助開發(fā)者充分利用 Copilot+ PC 中強大的 NPU 配置。
微軟表示,Copilot+ PC 上的 NPU 開啟了一種新的范式。在這種范式下,生成式 AI 不僅可以在被調(diào)用時執(zhí)行,還可以支持半連續(xù)運行的服務。這使開發(fā)者能夠利用 AI 推理引擎來構(gòu)建主動和持續(xù)的體驗。微軟表示:
通過我們在 Phi Silica 上的工作,我們實現(xiàn)了高效的推理 —— 在首次生成 token 的時間和吞吐率方面表現(xiàn)出色,同時對電池續(xù)航和 PC 資源消耗的影響降至最低。針對 NPU 優(yōu)化的 DeepSeek 模型借鑒了該項目的多項關鍵經(jīng)驗和技術,包括如何分離模型的各個部分以實現(xiàn)性能與效率的最佳平衡、低比特率量化以及將 Transformer 映射到 NPU。此外,我們還利用 Windows Copilot Runtime(WCR)通過 ONNX QDQ 格式在多樣化的 Windows 生態(tài)系統(tǒng)中實現(xiàn)擴展。
微軟表示,要想在 Copilot+ PC 上體驗 DeepSeek 只需下載 AI Toolkit VS Code 擴展即可;以 ONNX QDQ 格式優(yōu)化的 DeepSeek 模型將很快出現(xiàn)在 AI Toolkit 的模型目錄中(直接從 Azure AI Foundry 中拉取)。
用戶可以通過點擊“下載”按鈕將其下載到本地。下載完成后,只需打開 Playground 加載“deepseek_r1_1_5”模型,并給出提示詞即可開始實驗。
除了為 Copilot+ PC 優(yōu)化的 ONNX 模型外,您還可以通過點擊“DeepSeek R1”下的“Try in Playground”按鈕,在 Azure Foundry 中嘗試云托管的源模型。
如下圖所示,微軟還展示了原始模型和量化模型的示例,以展現(xiàn)兩者之間微小但確實存在的差異:
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。