Meta 推出 AI 語言模型 LLaMA，一個有著 650 億參數(shù)的大型語言模型

2023/2/25 7:01:30 來源：IT之家作者：問舟責編：問舟

評論：

IT之家 2 月 25 日消息，Meta 在當?shù)貢r間周五宣布，它將推出一種針對研究社區(qū)的基于人工智能 (AI) 的新型大型語言模型，與微軟、谷歌等一眾受到 ChatGPT 刺激的公司一同加入人工智能競賽。

Meta 的 LLaMA 是“大型語言模型 Meta AI” （Large Language Model Meta AI）的縮寫，它可以在非商業(yè)許可下提供給政府、社區(qū)和學術界的研究人員和實體工作者。

該公司將提供底層代碼供用戶使用，因此用戶可以自行調整模型，并將其用于與研究相關的用例。Meta 表示，該模型對算力的要求“低得多”。

據介紹，該公司正在開發(fā)多種參數(shù)（7B、13B、33B 和 65B）的 LLaMA。其中，LLaMA 65B 和 LLaMA 33B 在 1.4 萬億個 tokens 上訓練，而最小的模型 LLaMA 7B 也經過了 1 萬億個 tokens 的訓練。

與其他大型語言模型一樣，LLaMA 的工作原理是將一系列單詞作為“輸入”并預測下一個單詞以遞歸生成文本。為了這套模型，Meta 從使用人數(shù)最多的 20 種語言中選擇文本進行訓練，重點是拉丁語和西里爾字母。

當然，與其他模型一樣，LLaMA 也面臨著偏見、有毒評論和幻覺的挑戰(zhàn)，Meta 還需要做更多的研究來解決這類語言模型中的不足。

Meta 表示，LLaMA 作為一個基礎模型被設計成多功能的，可以應用于許多不同的用例，而不是為特定任務設計的微調模型。通過開源 LLaMA 的代碼，其他研究人員可以更輕松地找到限制或消除這些問題的新方法。Meta 還在本文中提供了一組評估模型偏差和毒性的基準評估標準，以顯示模型的局限性并支持研究人員在這一關鍵領域的進一步研究。

Meta 推出 AI 語言模型 LLaMA，一個有著 650 億參數(shù)的大型語言模型

值得一提的是，Meta 在去年 5 月也曾推出過大型語言模型 OPT-175B。該項目同樣也是針對研究人員的，這構成了其聊天機器人 blenterbot 新迭代的基礎。

后來，該公司還推出了一款名為“卡拉狄加”(Galactica) 的模型，據稱它可以撰寫科學文章和解決數(shù)學問題，但其演示版本后來被下架，因為它反復生成“聽起來很權威”的內容。

IT之家附官方鏈接：

官網介紹
Github
申請訪問 LLaMA

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：Meta，LLaMA，Ai語言模型

Meta 推出 AI 語言模型 LLaMA，一個有著 650 億參數(shù)的大型語言模型

相關文章

Meta 推出 AI 語言模型 LLaMA，一個有著 650 億參數(shù)的大型語言模型