設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

下一個 OpenAI 來了?Mistral 超大杯模型直逼 GPT-4,93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

新智元 2024/2/27 13:41:22 責編:遠洋

  新智元報道  

編輯:編輯部

【新智元導讀】成立 9 個月,當初那個「6 人團隊,7 頁 PPT,8 億融資」的公司不斷締造傳奇。Mistral AI 今日發(fā)布的 Mistral Large 模型性能已經(jīng)直逼 GPT-4,同時和微軟官宣合作?!赶乱粋€ OpenAI」的爆相,已經(jīng)越來越明顯了。

下一個 OpenAI 來了?

開源社區(qū)的另一個中心 Mistral AI,剛剛發(fā)布了最強力的旗艦模型 Mistral Large,性能直接對標 GPT-4?。ǖ上У氖菦]有開源)

Mistral Large 具備卓越的邏輯推理能力,能夠處理包括文本理解、轉(zhuǎn)換以及代碼生成在內(nèi)的復雜多語言任務(wù)。

在眾多主流基準測試中,Mistral Large 力壓 Anthropic 的 Claude 2 和谷歌的 Gemini Pro,成績僅次于 GPT-4!

LLM 領(lǐng)域,格局再次改變。

同時,就在今天,AI 圈又一重磅消息曝出:繼 OpenAI 之后,微軟將 Mistral 也納入麾下!

Mistral 從誕生之初,就充滿傳奇的光環(huán)。成立 4 周,6 人團隊,7 頁 PPT,8 億融資(1.05 億歐元),簡直堪稱爽文走進現(xiàn)實。

創(chuàng)始人 Arthur Mensch 是 1993 年出生的法國小伙,在谷歌工作 3 年后,在自己 31 歲時離開谷歌,拉攏了兩位 Llama 模型的開發(fā)者,一起創(chuàng)立了這個日后可以和 OpenAI、Anthropic 分庭抗禮的公司。

幾個人的團隊,極少的融資,做出的模型卻可以和 GPT-4 掰手腕。如今再加上金主爸爸微軟的撐腰,Mistral 「下一個 OpenAI」的名頭,是坐實了。

Mistral 不開源?網(wǎng)友慌了!

現(xiàn)在,正處于全世界聚光燈下的 Mistral,一舉一動都十分引人注目。有網(wǎng)友發(fā)現(xiàn) Mistral 修改了網(wǎng)站內(nèi)容,刪除了所有提及開源社區(qū)義務(wù)的內(nèi)容,這立馬引發(fā)了恐慌!

之前的主頁(左);現(xiàn)在的主頁(右)

不過,大家目前還不需要太過擔心。

根據(jù)外媒對 Mistral CEO 的采訪,未來他們依然會堅持開源理念,但是同時也會推出性能最為強大的閉源模型參與商業(yè)競爭。

現(xiàn)在他們已經(jīng)完成了以規(guī)模命名的開源模型:Mistral 7B 和 Mistral 8 x 7B 回饋社區(qū),以「大中小」命名的閉源模型賺錢的產(chǎn)品線搭建。

歐洲最強大模型來了!

話說回來,這次發(fā)布的 Mistral Large,可以說是最適合歐洲人體質(zhì)的大模型。

簡單來說:

- Mistral Large 能夠母語般流利地使用英語、法語、西班牙語、德語和意大利語,深刻理解各自的語法規(guī)則和文化背景。

- Mistral Large 能夠處理 32K Token 的上下文內(nèi)容,使其能夠從龐大的文檔中精確快速地提取信息。

- Mistral Large 在執(zhí)行具體指令方面異常精準,這讓開發(fā)人員可以根據(jù)自己的需求定制內(nèi)容審查政策 —— 例如,Mistral AI 利用它來進行了 le Chat 的系統(tǒng)級別審查。

- Mistral Large 原生支持函數(shù)調(diào)用。這個特性,結(jié)合 Mistral AI 在 la Plateforme 上實施的輸出內(nèi)容限制模式,極大地促進了應用程序的開發(fā)和技術(shù)棧的現(xiàn)代化。

目前,Mistral AI 的這個新旗艦模型僅在 Azure AI 和 Mistral AI 平臺上可用。

其中,在 Azure AI 上的定價如下:輸出為 0.024 美元 / 1000 token,輸入為 0.008 美元 / 1000 token。

推理能力與知識掌握

要說 Mistral Large 最令人印象深刻的,還是超強的推理能力。

作為旗艦模型,Mistral Large 在常識、推理以及知識方面,都展現(xiàn)出了令人矚目的實力。

雖然和 GPT-4 還有不小的差距,但 Claude 2 和 Gemini Pro 1.0 基本上已經(jīng)是手下敗將了。

多語言能力

作為一款歐洲人自己的大模型,Mistral Large 在法語、德語、西班牙語和意大利語上的表現(xiàn),均優(yōu)于 Llama 2 70B 模型。

同時,也強過自家更小規(guī)模的模型。

數(shù)學與編程能力

在編程和數(shù)學方面,Mistral Large 的能力也非常突出。

不僅相比自己其他模型有了大幅的提升,而且在主流的測試基準上都取得了不俗的成績。

「小杯」也來了

相比之下,規(guī)模更小的 Mistral Small,則更加專注于對延遲和成本的優(yōu)化。

相較于 Mixtral 8x7B,Mistral Small 展現(xiàn)出更優(yōu)異的性能和更低的延遲,是介于 Mistral AI 開源模型和旗艦模型之間的解決方案。

與 Mistral Large 類似,Mistral Small 同樣采用了在 RAG 和函數(shù)調(diào)用方面的創(chuàng)新技術(shù)。

此外,Mistral 還優(yōu)化了自家的服務(wù)接口:

- 提供競爭力價格的開放權(quán)重端點,包括 open-mistral-7B 和 open-mixtral-8x7b。

- 推出新的優(yōu)化模型端點,包括 mistral-small-2402 和 mistral-large-2402,同時繼續(xù)提供未更新的 mistral-medium。

和微軟官宣合作,Mistral AI 腰板更硬了

除了宣布模型之外,Mistral AI 還官宣了和微軟的深度合作。而這也是微軟繼 OpenAI 之后,再次「真金白銀」地入股 AI 圈的另一家頂流模型公司。

雖然 2023 年 4 月才成立,Mistral AI 已經(jīng)對歐洲的 AI 領(lǐng)域產(chǎn)生了重大影響。開源模型 Mistral 7B 和 Mixtral 的發(fā)布,驚艷了一眾開發(fā)者,在 AI 社區(qū)掀起了軒然大波。

如今微軟的支持,讓更多人堅信:Mistral 就是下一個 OpenAI。

Mistral AI 是法國的 AI 初創(chuàng)公司,微軟與它的合作,無疑讓微軟在歐洲也建立起了自己的 AI 影響力。

兩家公司的合作,目標是彌補基礎(chǔ) AI 研究與實際解決方案之間的差距。如果在未來建立多年的合作伙伴關(guān)系,Mistral AI 就可以訪問微軟 Azure 的 AI 基礎(chǔ)設(shè)施了。

微軟的加持對 Mistral AI 意味著什么,不言而喻。

不光 Mistral AI 下一代 LLM 的開發(fā)和部署會大大加速,并且會開辟出新的商機。以歐洲為基礎(chǔ),Mistral AI 會向全球市場擴張自己的影響力!

具體來說,微軟和 Mistral AI 之間的合作集中在以下三個關(guān)鍵領(lǐng)域 ——

超算基礎(chǔ)結(jié)構(gòu):微軟將通過 Azure AI 超算基礎(chǔ)結(jié)構(gòu)支持 Mistral AI,用于 AI 訓練和推理工作負載。

擴展市場:微軟和 Mistral AI 將通過 Azure AI Studio 中的 MaaS 和 Azure 機器學習模型目錄,向客戶提供 Mistral AI 的高級模型。

AI 研發(fā):微軟和 Mistral AI 將探索合作,為指定的客戶開發(fā)專有模型,甚至包括歐洲公共部門的工作負載。

目前,兩家公司還沒有透露財務(wù)細節(jié)。

最近,Mistral AI 以近 20 億美元的估值,籌集了 4.5 億歐元,由科技投資者 Andreessen Horowitz 領(lǐng)投。

不過,跟它在美國的競爭者比,Mistral AI 所獲得的資金顯然并不算多。

要知道,OpenAI 僅從微軟就獲得了超過 100 億美元的投資,而 Anthropic 從谷歌和亞馬遜獲得的資金,也高達 60 億美元。

據(jù)《華爾街日報》報道,去年 10 月,谷歌承諾向 Anthropic 投資 20 億美元因此,此項合作一出,Mistral AI「歐洲版 OpenAI」的名頭,更加坐實了。

而對于微軟來說,這項投資也是好處多多 —— 這是它在歐洲 AI 領(lǐng)域站穩(wěn)腳跟的機會。

本來,作為 Azure 云中歐盟服務(wù)器上 OpenAI 模型的唯一提供商,微軟已經(jīng)在歐洲的 AI 競賽中處于領(lǐng)先地位。

不過 AI 在歐洲所受的待遇,并不像在美國那樣備受支持。歐洲許多國家對于 AI 的態(tài)度偏保守,他們持的是批判性的態(tài)度,尤其是在數(shù)據(jù)保護方面。而如果是歐洲服務(wù)器商的歐洲 AI 模型,或許能讓人放心,不失為一種不錯的補救措施。

成立 9 個月的傳奇 AI 初創(chuàng)企業(yè),挑戰(zhàn)硅谷巨頭

Mistral 在種子輪融資時「6 人團隊,7 頁 PPT,8 億融資」的故事,值得好好講一講。

2023 年初,還在谷歌工作的 Arthur Mensch,剛剛 30 歲。

一年之后,他離開谷歌創(chuàng)立自己的公司,只用了 9 個來月的時間,就已經(jīng)估值 20 億美元!

Mensch 于 2020 年初加入了谷歌,成為 DeepMind 的研究員,他的研究方向是提高 AI 和機器學習系統(tǒng)的效率。那時他 27 歲。

后來,他和兩位之前一起參與了 Llama 模型研發(fā)的年輕人 Timothée Lacroix 和 Guillaume Lample 一起,決定成立一家公司,通過更加高效的方法構(gòu)建和部署 AI 模型。

他們相信,小團隊能力在靈活性上超越硅谷的大公司,而開源模型就是他們實現(xiàn)這一目標的利器。

雖然已經(jīng)從各路投資者那里籌集了超過 5 億美元,他的公司 Mistral AI 相比于微軟支持的 OpenAI,谷歌,乃至 Anthropic,依然顯得有些「微不足道」。

這些巨頭,以及巨頭重金支持的巨型獨角獸投入了幾十億美元來構(gòu)建全世界最先進的 AI 系統(tǒng)。

但 Mensch 并不擔心與這些龐然大物競爭。

「我們的目標是成為 AI 領(lǐng)域中最節(jié)省資本的公司,」Mensch 表示。「這是我們成立的初衷?!?/p>

對于剛剛推出的 Mistral Large 模型,他認為,這款模型在執(zhí)行某些推理任務(wù)上能夠與 OpenAI 最先進的語言模型 GPT-4 和谷歌的新模型 Gemini Ultra 相匹敵。

Mensch 透露,開發(fā)這款新模型的成本不到 2000 萬歐元(約合 2200 萬美元)。

Mistral 巴黎總部的辦公室

相比之下,OpenAI 的首席執(zhí)行官 Sam Altman 曾在去年發(fā)布 GPT-4 時表示,訓練他們公司的大型模型的成本接近 1 億美元。

而且隨著他們用行業(yè)內(nèi)最為高效的開源模型不斷震驚業(yè)界,他們也獲得了微軟,英偉達和 Salesforce 等大公司的背書。

巨頭們也通過現(xiàn)金或者算力的支持,獲取了 Mistral AI 的少量股份。伴隨著 Mistral Large 的發(fā)布,9 個月前他們用 7 頁 PPT 吹下的牛,已經(jīng)完全兌現(xiàn)了。

撬動 8 億元投資的六人團隊

這六個人的團隊,是這樣組成的。

Arthur Mensch 在巴黎綜合理工學院和巴黎高等師范學院學習期間,結(jié)識了另兩位創(chuàng)始人 ——Timothée Lacroix 和 Guillaume Lample。

兩人都是 Meta AI 團隊的,Lample 甚至領(lǐng)導了 LLaMA 的開發(fā)。

幾個三十出頭的年輕人,在 LLM 開發(fā)領(lǐng)域已經(jīng)有不少經(jīng)驗。

在當時,即使在全世界范圍內(nèi),具備構(gòu)建、訓練和優(yōu)化 LLM 專業(yè)經(jīng)驗的人,也不超過 100 人。

而另外三位,分別是來自法國巴黎健康初創(chuàng)公司 Alan 的 CEO Jean-Charles Samuelian 和 CTO Charles Gorintin,以及前法國數(shù)字事務(wù)國務(wù)秘書 Cédric O。

AI 科學家,如何創(chuàng)立自己的獨角獸公司

Mensch 個頭高大,一頭濃密的深色頭發(fā),他既不像典型的科技極客,也不像常見的 CEO。

他的朋友和同事們說,他總是一邊喝啤酒一邊輕松地和朋友開玩笑。

作為一名運動愛好者,他在 2018 年提交博士論文前的幾個月,以不到三小時半的時間跑完了巴黎馬拉松。

Mensch 從小就在學術(shù)追求與創(chuàng)業(yè)之間徘徊。他出生在巴黎西郊,母親是物理老師,父親擁有一家小型科技公司。

這位未來的 CEO 畢業(yè)于法國頂級的數(shù)學和機器學習院校。他的導師們將他描述為一個熱情投入、能夠迅速掌握自己幾乎沒有基礎(chǔ)的項目的學生。

「我確實熱愛探索新事物,」Mensch 表示?!肝液苋菀赘械絽捑搿!?/p>

在攻讀博士期間,Mensch 的研究方向是優(yōu)化軟件,分析核磁共振圖像(fMRI)系統(tǒng)的三維大腦圖像,讓軟件能夠處理高達數(shù)百萬的圖像量。

2020 年底,Mensch 加入了 DeepMind,在那里他參與開發(fā)了大語言模型。

到了 2022 年,他以主要作者的身份發(fā)表了著名的「Chinchilla 論文」。

這項研究重新定義了人們對 AI 模型的大小、訓練它所需的數(shù)據(jù)量以及其性能之間關(guān)系的認識,被稱為 AI 縮放法則。

隨著 2022 年 AI 競賽的升溫,Mensch 對于大公司的 AI 實驗室減少了關(guān)于大語言模型研究成果的發(fā)表,減少了與研究社區(qū)的分享這一情況表示失望。

ChatGPT 發(fā)布后,谷歌決定加速追趕。

Mensch 所在的團隊從一個 10 人的小團隊變?yōu)?30 人,最后擴充成為了一個 70 人的大團隊。

「我覺得我在事情變得過于官僚化之前應該離開了,」Mensch 說?!肝也幌朐诖笮涂萍脊局虚_發(fā)那些不透明的技術(shù)?!?/p>

Mistral 在 2023 年春天向投資者提出的最初方案中,批評了由美國公司主導的「正在形成的寡頭壟斷」,這些公司開發(fā)的是專有閉源模型。

對于 Mensch 和他的合伙人來說,將他們的初始 AI 系統(tǒng)作為開源軟件發(fā)布,允許任何人免費使用或修改,這是一個重要的原則。

這也是吸引開發(fā)者和潛在客戶的一種方式,他們希望每個人對自己使用的 AI 有更多的控制權(quán)。

盡管 Mistral 現(xiàn)在的最先進模型 Mistral Large 并不開源,但 Mensch 表示:

「在構(gòu)建商業(yè)模式和堅持我們的開源價值觀之間找到一個平衡點是非常微妙的。我們希望創(chuàng)造新的事物、新的架構(gòu),但是還想向我們的客戶提供一些額外的產(chǎn)品和服務(wù)。」

參考資料:

  • https://www.wsj.com/tech/ai/the-9-month-old-ai-startup-challenging-silicon-valleys-giants-ee2e4c48?st=htctyj5gooqlcll

  • https://mistral.ai/news/mistral-large/

  • https://old.reddit.com/r/LocalLLaMA/comments/1b0o41v/top_10_betrayals_in_anime_history/?continueFlag=e442fb10c2502e2fe0c601afe6270309

本文來自微信公眾號:新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Mistral,Le Chat人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知