IT之家 3 月 7 日消息,據(jù)英國金融時報報道,社交媒體巨頭 Meta 正在加速其人工智能的語音功能開發(fā),計劃在未來幾周內(nèi)推出其最新開源大語言模型 Llama 4,并將語音交互作為核心功能之一。據(jù)知情人士透露,Meta 希望借此推動 AI 技術(shù)的商業(yè)化發(fā)展,并在 2025 年實現(xiàn)其 AI 產(chǎn)品的重要突破。
一位人士表示,Meta 的語音功能開發(fā)重點在于讓用戶與 AI 的對話更接近自然的雙向?qū)υ挘莻鹘y(tǒng)的問答模式。這意味著用戶可以在對話中隨時打斷,使交互更加靈活。Meta 首席執(zhí)行官馬克?扎克伯格(Mark Zuckerberg)已明確表示,希望將 Meta 打造成“AI 領(lǐng)域的領(lǐng)導(dǎo)者”,并計劃通過 AI 技術(shù)實現(xiàn)新的收入增長。扎克伯格稱,2025 年對其許多人工智能產(chǎn)品來說是成敗攸關(guān)的一年。
據(jù)兩位知情人士透露,為了實現(xiàn)這一目標,Meta 正在考慮為其 AI 助手 Meta AI 推出高級訂閱服務(wù),用于執(zhí)行諸如預(yù)訂餐廳和視頻創(chuàng)作等代理任務(wù)。此外,公司還在探討在其 AI 助手的搜索結(jié)果中引入付費廣告或贊助帖子,以進一步實現(xiàn)商業(yè)變現(xiàn)。
扎克伯格今年曾透露打造一個具有中級工程師編程和解決問題能力的人工智能工程代理的計劃,他表示這可能有一個“非常大的市場”。
Meta 的產(chǎn)品負責人克里斯?考克斯(Chris Cox)在摩根士丹利科技、媒體和電信會議上表示,Llama 4 將是一個“全能模型”,語音交互將被設(shè)計為“原生功能”,而不是將語音轉(zhuǎn)換為文本后再進行處理。
知情人士稱,Meta 也一直在討論最新的 Llama 模型在輸出內(nèi)容方面應(yīng)該設(shè)置哪些限制,以及是否需要放寬這些限制。這一討論背景是,Meta 的競爭對手們正在不斷推出新的 AI 產(chǎn)品,而 Meta 需要在技術(shù)與倫理之間找到平衡。
IT之家注意到,Meta 的競爭對手 OpenAI 去年推出了語音模式,并專注于為其賦予不同個性;而埃隆?馬斯克(Elon Musk)的 xAI 開發(fā)的 Grok 3 模型則在上個月向部分用戶推出了語音功能,該模型以較少的限制和“無拘無束模式”為特點。
此外,Meta 的語音交互功能也是其 Ray Ban 智能眼鏡的核心賣點之一,該產(chǎn)品近期在市場上取得了巨大成功。Meta 正在加速開發(fā)輕量級頭戴設(shè)備,希望取代智能手機成為消費者的主要計算設(shè)備。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。