IT之家 3 月 10 日消息,谷歌公司于 3 月 7 日發(fā)布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本處理模型,現(xiàn)已集成至 Gemini API。
該模型在 Massive Text Embedding Benchmark(MTEB)中拔得頭籌,超越了 Mistral、Cohere 和 Qwen 等競爭對手,成為當前性能最強的文本嵌入模型。
Gemini Embedding 將文本轉(zhuǎn)換為數(shù)值表示(向量),從而支持語義搜索、推薦系統(tǒng)和文檔檢索等功能。它在 MTEB 基準測試中表現(xiàn)出色,平均任務得分為 68.32,顯著高于 Linq-Embed-Mistral 和 gte-Qwen2-7B-instruct 等模型,達到 State-of-the-art。
State-of-the-art(SOTA)AI 模型是指在特定任務或領域中,當前表現(xiàn)最優(yōu)的模型或方法。這些模型通常通過在各種基準測試中取得最高分來證明其優(yōu)越性,并且往往在準確性、效率或能力上超越了之前的模型,甚至在某些任務中達到了人類水平的表現(xiàn)。
該模型在配對分類上得分為 85.13;在檢索上得分 67.71,在重排序得分為 65.58,表明 Gemini Embedding 在 AI 搜索引擎、文檔分析和聊天機器人優(yōu)化等實際應用中具有顯著優(yōu)勢。
MTEB 由 Hugging Face 創(chuàng)建,通過 50 多個數(shù)據(jù)集評估 AI 模型在文本數(shù)據(jù)排名、分類和檢索方面的能力。作為行業(yè)標準,MTEB 排行榜為企業(yè)在選擇 AI 模型時提供了重要參考。Gemini Embedding 的優(yōu)異表現(xiàn)不僅鞏固了谷歌在 AI 領域的領導地位,也為其在商業(yè)應用中的推廣奠定了基礎。
Gemini Embedding 的高性能使其在以下領域具有廣泛的應用前景:
搜索引擎:提升搜索結果的相關性,支持谷歌正在測試的純 AI 驅(qū)動搜索模式。
多語言應用:增強跨語言翻譯、客戶服務自動化和內(nèi)容排名能力。
企業(yè)服務:優(yōu)化基于 Google Cloud 的 AI 分析、語義搜索和自動化數(shù)據(jù)檢索功能。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。