IT之家 3 月 4 日消息,基于 ChatGPT 的必應(yīng)聊天已經(jīng)讓不少用戶感受到了 AI 的強(qiáng)大,而微軟于近日推出了更為強(qiáng)悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM,而它是更強(qiáng)大的多模式大型語(yǔ)言模型(MLLM)。
Kosmos-1 可以分析圖像的內(nèi)容、解決視覺(jué)難題、執(zhí)行視覺(jué)文本識(shí)別、通過(guò)視覺(jué)智商測(cè)試以及理解自然語(yǔ)言指令等等。
IT之家從報(bào)道中獲悉,Kosmos-1 可以處理文本、音頻、圖像和視頻等內(nèi)容,構(gòu)建一個(gè)全能型的人工智能,可以像人類思維一樣來(lái)處理任務(wù)。
研究人員在他們的學(xué)術(shù)論文中寫(xiě)道:“作為智能的基本組成部分,多模態(tài)感知是實(shí)現(xiàn)人工智能的必要條件”。Kosmos-1 論文中的視覺(jué)示例顯示模型分析圖像并回答有關(guān)圖像的問(wèn)題,從圖像中讀取文本,為圖像編寫(xiě)標(biāo)題,并以 22-26% 的準(zhǔn)確度進(jìn)行視覺(jué)智商測(cè)試。
微軟表示,它計(jì)劃向開(kāi)發(fā)人員提供 Kosmos-1,盡管該論文引用的 GitHub 頁(yè)面在本文發(fā)表時(shí)沒(méi)有明顯的 Kosmos 特定代碼。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。