下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

新智元 2024/2/27 13:41:22 責編：遠洋

評論：

新智元報道

編輯：編輯部

【新智元導讀】成立 9 個月，當初那個「6 人團隊，7 頁 PPT，8 億融資」的公司不斷締造傳奇。Mistral AI 今日發(fā)布的 Mistral Large 模型性能已經(jīng)直逼 GPT-4，同時和微軟官宣合作?！赶乱粋€ OpenAI」的爆相，已經(jīng)越來越明顯了。

下一個 OpenAI 來了？

開源社區(qū)的另一個中心 Mistral AI，剛剛發(fā)布了最強力的旗艦模型 Mistral Large，性能直接對標 GPT-4?。ǖ上У氖菦]有開源）

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mistral Large 具備卓越的邏輯推理能力，能夠處理包括文本理解、轉(zhuǎn)換以及代碼生成在內(nèi)的復雜多語言任務(wù)。

在眾多主流基準測試中，Mistral Large 力壓 Anthropic 的 Claude 2 和谷歌的 Gemini Pro，成績僅次于 GPT-4！

LLM 領(lǐng)域，格局再次改變。

同時，就在今天，AI 圈又一重磅消息曝出：繼 OpenAI 之后，微軟將 Mistral 也納入麾下！

Mistral 從誕生之初，就充滿傳奇的光環(huán)。成立 4 周，6 人團隊，7 頁 PPT，8 億融資（1.05 億歐元），簡直堪稱爽文走進現(xiàn)實。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

創(chuàng)始人 Arthur Mensch 是 1993 年出生的法國小伙，在谷歌工作 3 年后，在自己 31 歲時離開谷歌，拉攏了兩位 Llama 模型的開發(fā)者，一起創(chuàng)立了這個日后可以和 OpenAI、Anthropic 分庭抗禮的公司。

幾個人的團隊，極少的融資，做出的模型卻可以和 GPT-4 掰手腕。如今再加上金主爸爸微軟的撐腰，Mistral 「下一個 OpenAI」的名頭，是坐實了。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mistral 不開源？網(wǎng)友慌了！

現(xiàn)在，正處于全世界聚光燈下的 Mistral，一舉一動都十分引人注目。有網(wǎng)友發(fā)現(xiàn) Mistral 修改了網(wǎng)站內(nèi)容，刪除了所有提及開源社區(qū)義務(wù)的內(nèi)容，這立馬引發(fā)了恐慌！

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

之前的主頁（左）；現(xiàn)在的主頁（右）

不過，大家目前還不需要太過擔心。

根據(jù)外媒對 Mistral CEO 的采訪，未來他們依然會堅持開源理念，但是同時也會推出性能最為強大的閉源模型參與商業(yè)競爭。

現(xiàn)在他們已經(jīng)完成了以規(guī)模命名的開源模型：Mistral 7B 和 Mistral 8 x 7B 回饋社區(qū)，以「大中小」命名的閉源模型賺錢的產(chǎn)品線搭建。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

歐洲最強大模型來了！

話說回來，這次發(fā)布的 Mistral Large，可以說是最適合歐洲人體質(zhì)的大模型。

簡單來說：

- Mistral Large 能夠母語般流利地使用英語、法語、西班牙語、德語和意大利語，深刻理解各自的語法規(guī)則和文化背景。

- Mistral Large 能夠處理 32K Token 的上下文內(nèi)容，使其能夠從龐大的文檔中精確快速地提取信息。

- Mistral Large 在執(zhí)行具體指令方面異常精準，這讓開發(fā)人員可以根據(jù)自己的需求定制內(nèi)容審查政策 —— 例如，Mistral AI 利用它來進行了 le Chat 的系統(tǒng)級別審查。

- Mistral Large 原生支持函數(shù)調(diào)用。這個特性，結(jié)合 Mistral AI 在 la Plateforme 上實施的輸出內(nèi)容限制模式，極大地促進了應用程序的開發(fā)和技術(shù)棧的現(xiàn)代化。

目前，Mistral AI 的這個新旗艦模型僅在 Azure AI 和 Mistral AI 平臺上可用。

其中，在 Azure AI 上的定價如下：輸出為 0.024 美元 / 1000 token，輸入為 0.008 美元 / 1000 token。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

推理能力與知識掌握

要說 Mistral Large 最令人印象深刻的，還是超強的推理能力。

作為旗艦模型，Mistral Large 在常識、推理以及知識方面，都展現(xiàn)出了令人矚目的實力。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

雖然和 GPT-4 還有不小的差距，但 Claude 2 和 Gemini Pro 1.0 基本上已經(jīng)是手下敗將了。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

多語言能力

作為一款歐洲人自己的大模型，Mistral Large 在法語、德語、西班牙語和意大利語上的表現(xiàn)，均優(yōu)于 Llama 2 70B 模型。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

同時，也強過自家更小規(guī)模的模型。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

數(shù)學與編程能力

在編程和數(shù)學方面，Mistral Large 的能力也非常突出。

不僅相比自己其他模型有了大幅的提升，而且在主流的測試基準上都取得了不俗的成績。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

「小杯」也來了

相比之下，規(guī)模更小的 Mistral Small，則更加專注于對延遲和成本的優(yōu)化。

相較于 Mixtral 8x7B，Mistral Small 展現(xiàn)出更優(yōu)異的性能和更低的延遲，是介于 Mistral AI 開源模型和旗艦模型之間的解決方案。

與 Mistral Large 類似，Mistral Small 同樣采用了在 RAG 和函數(shù)調(diào)用方面的創(chuàng)新技術(shù)。

此外，Mistral 還優(yōu)化了自家的服務(wù)接口：

- 提供競爭力價格的開放權(quán)重端點，包括 open-mistral-7B 和 open-mixtral-8x7b。

- 推出新的優(yōu)化模型端點，包括 mistral-small-2402 和 mistral-large-2402，同時繼續(xù)提供未更新的 mistral-medium。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

和微軟官宣合作，Mistral AI 腰板更硬了

除了宣布模型之外，Mistral AI 還官宣了和微軟的深度合作。而這也是微軟繼 OpenAI 之后，再次「真金白銀」地入股 AI 圈的另一家頂流模型公司。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

雖然 2023 年 4 月才成立，Mistral AI 已經(jīng)對歐洲的 AI 領(lǐng)域產(chǎn)生了重大影響。開源模型 Mistral 7B 和 Mixtral 的發(fā)布，驚艷了一眾開發(fā)者，在 AI 社區(qū)掀起了軒然大波。

如今微軟的支持，讓更多人堅信：Mistral 就是下一個 OpenAI。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mistral AI 是法國的 AI 初創(chuàng)公司，微軟與它的合作，無疑讓微軟在歐洲也建立起了自己的 AI 影響力。

兩家公司的合作，目標是彌補基礎(chǔ) AI 研究與實際解決方案之間的差距。如果在未來建立多年的合作伙伴關(guān)系，Mistral AI 就可以訪問微軟 Azure 的 AI 基礎(chǔ)設(shè)施了。

微軟的加持對 Mistral AI 意味著什么，不言而喻。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

不光 Mistral AI 下一代 LLM 的開發(fā)和部署會大大加速，并且會開辟出新的商機。以歐洲為基礎(chǔ)，Mistral AI 會向全球市場擴張自己的影響力！

具體來說，微軟和 Mistral AI 之間的合作集中在以下三個關(guān)鍵領(lǐng)域 ——

超算基礎(chǔ)結(jié)構(gòu)：微軟將通過 Azure AI 超算基礎(chǔ)結(jié)構(gòu)支持 Mistral AI，用于 AI 訓練和推理工作負載。
擴展市場：微軟和 Mistral AI 將通過 Azure AI Studio 中的 MaaS 和 Azure 機器學習模型目錄，向客戶提供 Mistral AI 的高級模型。
AI 研發(fā)：微軟和 Mistral AI 將探索合作，為指定的客戶開發(fā)專有模型，甚至包括歐洲公共部門的工作負載。

目前，兩家公司還沒有透露財務(wù)細節(jié)。

最近，Mistral AI 以近 20 億美元的估值，籌集了 4.5 億歐元，由科技投資者 Andreessen Horowitz 領(lǐng)投。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

不過，跟它在美國的競爭者比，Mistral AI 所獲得的資金顯然并不算多。

要知道，OpenAI 僅從微軟就獲得了超過 100 億美元的投資，而 Anthropic 從谷歌和亞馬遜獲得的資金，也高達 60 億美元。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

據(jù)《華爾街日報》報道，去年 10 月，谷歌承諾向 Anthropic 投資 20 億美元因此，此項合作一出，Mistral AI「歐洲版 OpenAI」的名頭，更加坐實了。

而對于微軟來說，這項投資也是好處多多 —— 這是它在歐洲 AI 領(lǐng)域站穩(wěn)腳跟的機會。

本來，作為 Azure 云中歐盟服務(wù)器上 OpenAI 模型的唯一提供商，微軟已經(jīng)在歐洲的 AI 競賽中處于領(lǐng)先地位。

不過 AI 在歐洲所受的待遇，并不像在美國那樣備受支持。歐洲許多國家對于 AI 的態(tài)度偏保守，他們持的是批判性的態(tài)度，尤其是在數(shù)據(jù)保護方面。而如果是歐洲服務(wù)器商的歐洲 AI 模型，或許能讓人放心，不失為一種不錯的補救措施。

成立 9 個月的傳奇 AI 初創(chuàng)企業(yè)，挑戰(zhàn)硅谷巨頭

Mistral 在種子輪融資時「6 人團隊，7 頁 PPT，8 億融資」的故事，值得好好講一講。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

2023 年初，還在谷歌工作的 Arthur Mensch，剛剛 30 歲。

一年之后，他離開谷歌創(chuàng)立自己的公司，只用了 9 個來月的時間，就已經(jīng)估值 20 億美元！

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mensch 于 2020 年初加入了谷歌，成為 DeepMind 的研究員，他的研究方向是提高 AI 和機器學習系統(tǒng)的效率。那時他 27 歲。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

后來，他和兩位之前一起參與了 Llama 模型研發(fā)的年輕人 Timothée Lacroix 和 Guillaume Lample 一起，決定成立一家公司，通過更加高效的方法構(gòu)建和部署 AI 模型。

他們相信，小團隊能力在靈活性上超越硅谷的大公司，而開源模型就是他們實現(xiàn)這一目標的利器。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

雖然已經(jīng)從各路投資者那里籌集了超過 5 億美元，他的公司 Mistral AI 相比于微軟支持的 OpenAI，谷歌，乃至 Anthropic，依然顯得有些「微不足道」。

這些巨頭，以及巨頭重金支持的巨型獨角獸投入了幾十億美元來構(gòu)建全世界最先進的 AI 系統(tǒng)。

但 Mensch 并不擔心與這些龐然大物競爭。

「我們的目標是成為 AI 領(lǐng)域中最節(jié)省資本的公司，」Mensch 表示。「這是我們成立的初衷?！?/p>

對于剛剛推出的 Mistral Large 模型，他認為，這款模型在執(zhí)行某些推理任務(wù)上能夠與 OpenAI 最先進的語言模型 GPT-4 和谷歌的新模型 Gemini Ultra 相匹敵。

Mensch 透露，開發(fā)這款新模型的成本不到 2000 萬歐元（約合 2200 萬美元）。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mistral 巴黎總部的辦公室

相比之下，OpenAI 的首席執(zhí)行官 Sam Altman 曾在去年發(fā)布 GPT-4 時表示，訓練他們公司的大型模型的成本接近 1 億美元。

而且隨著他們用行業(yè)內(nèi)最為高效的開源模型不斷震驚業(yè)界，他們也獲得了微軟，英偉達和 Salesforce 等大公司的背書。

巨頭們也通過現(xiàn)金或者算力的支持，獲取了 Mistral AI 的少量股份。伴隨著 Mistral Large 的發(fā)布，9 個月前他們用 7 頁 PPT 吹下的牛，已經(jīng)完全兌現(xiàn)了。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

撬動 8 億元投資的六人團隊

這六個人的團隊，是這樣組成的。

Arthur Mensch 在巴黎綜合理工學院和巴黎高等師范學院學習期間，結(jié)識了另兩位創(chuàng)始人 ——Timothée Lacroix 和 Guillaume Lample。

兩人都是 Meta AI 團隊的，Lample 甚至領(lǐng)導了 LLaMA 的開發(fā)。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

幾個三十出頭的年輕人，在 LLM 開發(fā)領(lǐng)域已經(jīng)有不少經(jīng)驗。

在當時，即使在全世界范圍內(nèi)，具備構(gòu)建、訓練和優(yōu)化 LLM 專業(yè)經(jīng)驗的人，也不超過 100 人。

而另外三位，分別是來自法國巴黎健康初創(chuàng)公司 Alan 的 CEO Jean-Charles Samuelian 和 CTO Charles Gorintin，以及前法國數(shù)字事務(wù)國務(wù)秘書 Cédric O。

AI 科學家，如何創(chuàng)立自己的獨角獸公司

Mensch 個頭高大，一頭濃密的深色頭發(fā)，他既不像典型的科技極客，也不像常見的 CEO。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

他的朋友和同事們說，他總是一邊喝啤酒一邊輕松地和朋友開玩笑。

作為一名運動愛好者，他在 2018 年提交博士論文前的幾個月，以不到三小時半的時間跑完了巴黎馬拉松。

Mensch 從小就在學術(shù)追求與創(chuàng)業(yè)之間徘徊。他出生在巴黎西郊，母親是物理老師，父親擁有一家小型科技公司。

這位未來的 CEO 畢業(yè)于法國頂級的數(shù)學和機器學習院校。他的導師們將他描述為一個熱情投入、能夠迅速掌握自己幾乎沒有基礎(chǔ)的項目的學生。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

「我確實熱愛探索新事物，」Mensch 表示?！肝液苋菀赘械絽捑搿！?/p>

在攻讀博士期間，Mensch 的研究方向是優(yōu)化軟件，分析核磁共振圖像（fMRI）系統(tǒng)的三維大腦圖像，讓軟件能夠處理高達數(shù)百萬的圖像量。

2020 年底，Mensch 加入了 DeepMind，在那里他參與開發(fā)了大語言模型。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

到了 2022 年，他以主要作者的身份發(fā)表了著名的「Chinchilla 論文」。

這項研究重新定義了人們對 AI 模型的大小、訓練它所需的數(shù)據(jù)量以及其性能之間關(guān)系的認識，被稱為 AI 縮放法則。

隨著 2022 年 AI 競賽的升溫，Mensch 對于大公司的 AI 實驗室減少了關(guān)于大語言模型研究成果的發(fā)表，減少了與研究社區(qū)的分享這一情況表示失望。

ChatGPT 發(fā)布后，谷歌決定加速追趕。

Mensch 所在的團隊從一個 10 人的小團隊變?yōu)?30 人，最后擴充成為了一個 70 人的大團隊。

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

「我覺得我在事情變得過于官僚化之前應該離開了，」Mensch 說?！肝也幌朐诖笮涂萍脊局虚_發(fā)那些不透明的技術(shù)?！?/p>

Mistral 在 2023 年春天向投資者提出的最初方案中，批評了由美國公司主導的「正在形成的寡頭壟斷」，這些公司開發(fā)的是專有閉源模型。

對于 Mensch 和他的合伙人來說，將他們的初始 AI 系統(tǒng)作為開源軟件發(fā)布，允許任何人免費使用或修改，這是一個重要的原則。

這也是吸引開發(fā)者和潛在客戶的一種方式，他們希望每個人對自己使用的 AI 有更多的控制權(quán)。

盡管 Mistral 現(xiàn)在的最先進模型 Mistral Large 并不開源，但 Mensch 表示：

「在構(gòu)建商業(yè)模式和堅持我們的開源價值觀之間找到一個平衡點是非常微妙的。我們希望創(chuàng)造新的事物、新的架構(gòu)，但是還想向我們的客戶提供一些額外的產(chǎn)品和服務(wù)。」

參考資料：

https://www.wsj.com/tech/ai/the-9-month-old-ai-startup-challenging-silicon-valleys-giants-ee2e4c48?st=htctyj5gooqlcll
https://mistral.ai/news/mistral-large/
https://old.reddit.com/r/LocalLLaMA/comments/1b0o41v/top_10_betrayals_in_anime_history/?continueFlag=e442fb10c2502e2fe0c601afe6270309

本文來自微信公眾號：新智元（ID：AI_era）

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mistral 不開源？網(wǎng)友慌了！

歐洲最強大模型來了！

推理能力與知識掌握

多語言能力

數(shù)學與編程能力

「小杯」也來了

和微軟官宣合作，Mistral AI 腰板更硬了

成立 9 個月的傳奇 AI 初創(chuàng)企業(yè)，挑戰(zhàn)硅谷巨頭

撬動 8 億元投資的六人團隊

AI 科學家，如何創(chuàng)立自己的獨角獸公司

相關(guān)文章

下一個 OpenAI 來了？Mistral 超大杯模型直逼 GPT-4，93 年創(chuàng)始人 6 人公司被微軟認領(lǐng)

Mistral 不開源？網(wǎng)友慌了！

歐洲最強大模型來了！

和微軟官宣合作，Mistral AI 腰板更硬了

成立 9 個月的傳奇 AI 初創(chuàng)企業(yè)，挑戰(zhàn)硅谷巨頭

AI 科學家，如何創(chuàng)立自己的獨角獸公司