首頁 > 智能時代>人工智能

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

新智元 2023/7/16 22:42:50 責編：遠洋

評論：

【新智元導讀】最近眾多網(wǎng)友反應 GPT-4 不好用了，后悔充值了。后來網(wǎng)友爆出 OpenAI 采用 MOE 重新設計了構(gòu)架，導致性能受到影響，但是官方一直沒有明確答復。

最近一段時間，很多 OpenAI 的用戶反應，GPT-4 變傻了！

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

大家普遍認為 GPT-4 從 5 月份開始，生成內(nèi)容的速度變快了，但是內(nèi)容的質(zhì)量下降很嚴重。

甚至有 OpenAI 論壇中的用戶把自己生成的內(nèi)容貼了出來，說對比 2 個月前相同的 prompt 生成的內(nèi)容，現(xiàn)在 GPT-4 的能力最多能叫 GPT-3.6。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

紛紛表態(tài)心疼自己出的這每個月的 20 刀。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

不過看完這么多 GPT-4 重度用戶的吐槽之后，小編突然開始感嘆：

GPT-4 確實是領先太多了。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

領先程度已經(jīng)到了，其他家的大模型都在加班加點的幾天出一個更新版本，希望盡快趕上 OpenAI。

他自己家倒好，悄悄「降本增效」「反向升級」，當起了大模型圈里的「反內(nèi)卷標兵」。

可能導致性能衰退的原因

對于 GPT-4 表現(xiàn)降級，用戶似乎都已經(jīng)達成共識，已經(jīng)開始討論 GPT-4「衰退」的原因了。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

根據(jù)外媒報道，有些語言模型領域內(nèi)的專家猜測，OpenAI 正在創(chuàng)建多個行為類似于大型模型但運行成本較低的小型 GPT-4 模型。

根據(jù)一個名叫 Sharon Zhou 的專家的說法，OpenAI 采用了一種稱為「混合專家模型」（Mixture of Experts，MOE）的構(gòu)架來搭建 GPT-4。

每個較小的專家模型都在不同的任務和主題領域進行訓練。

可能會有一個專門針對生物學的迷你 GPT-4 模型，或者其他專門針對物理、化學等領域的迷你模型。

當一個 GPT-4 用戶提問時，新系統(tǒng)判斷之后會把提示發(fā)送給某一個或者幾個專家模型。

「這個思路已經(jīng)存在一段時間了，這是一個自然的發(fā)展方向?！筞hou 說。

Zhou 將這種情況比作「忒修斯之船」，船上的各個部件被逐漸更換，整條船慢慢變成了一條新船。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

她說：「OpenAI 正在將 GPT-4 變成一支由小型船只組成的船隊。

從我的角度來看，這是一個新模型，但是可能很多人也不會在意這個變化?！?/p>

在本周網(wǎng)上泄露了關(guān)于 GPT-4 大量參數(shù)細節(jié)之后，很多大佬們也針對里面提到的 MoE 部分給出了自己的評價。

Allen 人工智能研究所創(chuàng)始首席執(zhí)行官 Oren Etzioni 在外媒的采訪中寫到：「我覺得這些猜測大致是準確的，雖然沒有辦法確切證實。」

他解釋說，使用 MOE 有兩個主要原因：更好的生成響應和更便宜、更快的響應。

Etzioni 補充說：「正確的搭配混合專家模型將同時保證這兩方面的優(yōu)勢，但和任何事情一樣，成本和質(zhì)量之間通常是需要取舍的。」

如果這種假設成立的話，OpenAI 在降低成本方面可能確實犧牲了一些質(zhì)量。

另一個佐證就是，OpenAI 的創(chuàng)始人 Greg Brockman 曾在自己共同參與的研究中提到了 MOE 這一技術(shù)路徑。

「通過混合專家模型的（MoE）方法，每次只使用網(wǎng)絡的一小部分來計算任何一個輸入的輸出。這可以在不增加計算成本的情況下增加更多參數(shù)?！笲rockman 和他的同事 Lilian Weng 在論文中寫道。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

性能下降可能和消除有害內(nèi)容有關(guān)

除了大佬從技術(shù)層面的解析外，網(wǎng)友也紛紛從各個角度進行揣測。

有些網(wǎng)友覺得可能是 OpenAI 相對保守的道德政策降低了模型回復的質(zhì)量。

在 OpenAI 官方論壇中 GPT 相關(guān)的子版塊，那些認為 ChatGPT 的性能遭到了「降級」的帖子中，許多人提到了 ChatGPT 在 OpenAI 采取新的內(nèi)容限制之前對于 Prompt 的包容性有了很大的變化。

側(cè)面支持了 OpenAI 可能出于安全性的考慮，控制了模型的輸出能力和范圍的觀點。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效

在 YCombinator 的討論中，有網(wǎng)友提出，從 OpenAI 開始宣布關(guān)注安全問題以后，模型的表現(xiàn)就越來越糟糕。

以 GPT-4 在最初發(fā)布報告中，讓 GPT-4 使用 TikZ（TikZ 可能是在 LaTex 中創(chuàng)建圖形元素的最復雜，最強大的工具）繪制獨角獸這一任務為例，在后續(xù)發(fā)布的 GPT-4 中難以復現(xiàn)報告上的結(jié)果，而且表現(xiàn)也越來越差。

GPT-4 突然降智：爆料 OpenAI 重新設計構(gòu)架，用 MOE 降本增效