IT之家 8 月 27 日消息,智譜 AI 今日宣布,GLM-4-Flash 大模型免費開放,通過智譜 AI 大模型開放平臺調(diào)用。
GLM-4-Flash 適用于完成簡單垂直、低成本、需要快速響應的任務,生成速度能達到 72.14 token/s,約等于 115 字符/s。
GLM-4-Flash 具備多輪對話、網(wǎng)頁瀏覽、Function Call(函數(shù)調(diào)用)和長文本推理(支持最大 128K 上下文)等功能,同時支持包括中文、英語、日語、韓語、德語等在內(nèi)的 26 種語言。
官方表示,通過采用自適應權(quán)重量化、多種并行化方式、批處理策略以及投機采樣等多種方法,在推理層面實現(xiàn)模型的延遲降低與速度提升,更大并發(fā)量和吞吐量不僅提升了效率,而且讓推理成本顯著降低,從而免費推出。
在預訓練方面,官方引入了大語言模型進入數(shù)據(jù)篩選流程,獲得 10T 高質(zhì)量多語言數(shù)據(jù),數(shù)據(jù)量是 ChatGLM3-6B 模型的 3 倍以上;同時采用了 FP8 技術(shù)進行預訓練,提高了訓練效率和計算量。
IT之家附相關鏈接如下:
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。