設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

火山豆包大模型價(jià)格清單公布:支持“預(yù)付 / 后付”雙模式,號(hào)稱“國內(nèi)最高并發(fā)標(biāo)準(zhǔn)”

2024/5/21 10:33:05 來源:IT之家 作者:漾仔 責(zé)編:漾仔

IT之家 5 月 21 日消息,字節(jié)跳動(dòng)在 5 月 15 日的“春季火山引擎 FORCE 原動(dòng)力大會(huì)”中推出了豆包大模型(原名“云雀”),該模型主要面向行業(yè)場景,能夠提供多種圖文音頻生成能力,IT之家整理如下:

  • 豆包通用模型 pro:字節(jié)跳動(dòng)自研 LLM 模型專業(yè)版,支持 128k 長文本,全系列可精調(diào),具備更強(qiáng)的理解、生成、邏輯等綜合能力,適配問答、總結(jié)、創(chuàng)作、分類等豐富場景;

  • 豆包通用模型 lite:字節(jié)跳動(dòng)自研 LLM 模型輕量版,對比專業(yè)版提供更低 token 成本、更低延遲,為企業(yè)提供靈活經(jīng)濟(jì)的模型選擇;

  • 豆包?角色扮演模型:個(gè)性化的角色創(chuàng)作能力,更強(qiáng)的上下文感知和劇情推動(dòng)能力,滿足靈活的角色扮演需求;

  • 豆包?語音合成模型:提供自然生動(dòng)的語音合成能力,善于表達(dá)多種情緒,演繹多種場景;

  • 豆包?聲音復(fù)刻模型:可在 5 秒內(nèi)實(shí)現(xiàn)聲音 1:1 克隆,對音色相似度和自然度進(jìn)行高度還原,支持聲音的跨語種遷移;

  • 豆包?語音識(shí)別模型:更高的準(zhǔn)確率及靈敏度,更低的語音識(shí)別延遲,支持多語種的正確識(shí)別;

  • 豆包?文生圖模型:更精準(zhǔn)的文字理解能力,圖文匹配更準(zhǔn)確,畫面效果更優(yōu)美,擅長對中國文化元素的創(chuàng)作;

  • 豆包?Function call 模型:提供更加準(zhǔn)確的功能識(shí)別和參數(shù)抽取能力,適合復(fù)雜工具調(diào)用的場景;

  • 豆包?向量化模型:聚焦向量檢索的使用場景,為 LLM 知識(shí)庫提供核心理解能力,支持多語言。

今日火山引擎官網(wǎng)更新了豆包大模型的定價(jià)詳情,號(hào)稱“在模型推理定價(jià)大幅低于行業(yè)價(jià)格的基礎(chǔ)上,豆包通用模型的 TPM、RPM 均達(dá)到國內(nèi)最高標(biāo)準(zhǔn)”、“價(jià)格比行業(yè)低 99%,TPM 限額則達(dá)同規(guī)格模型的 2.7 倍到 8 倍”;此外,相關(guān)模型還可使用“預(yù)付費(fèi)”、“后付費(fèi)”模式:

以豆包通用模型 pro-32k 為例: 按照 “預(yù)付費(fèi)”模型單元價(jià)格計(jì)算,10K TPM 的包月價(jià)格為 2000 元。10K*60*24*30=43200K。

即 432000K Tokens 的價(jià)格為 2000 元,平均價(jià)格為 0.0046 元 / 千 Tokens。按照“后付費(fèi)”模式計(jì)算:在模型推理的計(jì)算成本中,推理輸入通常占絕大部分比例,業(yè)界一般認(rèn)為推理輸入是輸出的 5 倍。

根據(jù)豆包通用模型 pro-32k 推理輸入 0.0008 元 / 千 Tokens、推理輸出 0.002 元 / 千 Tokens 計(jì)算,模型推理的綜合價(jià)格為 0.001 元 / 千 Tokens。

官方表示,國內(nèi)其他競品模型的 TPM 限額大多在 100K 到 300K 之間,RPM 則是在 60 到 120 區(qū)間,輕量級(jí)模型的 RPM 限額相對較高,但僅僅在 300 到 500 之間。按照 10K RPM 限額計(jì)算,企業(yè)客戶平均每秒可以同時(shí)調(diào)用 167 次豆包通用模型,從而滿足絕大多數(shù)業(yè)務(wù)場景在生產(chǎn)系統(tǒng)的大模型應(yīng)用需求。

官方同時(shí)強(qiáng)調(diào),相關(guān)標(biāo)準(zhǔn)已經(jīng)達(dá)到 OpenAI 為高級(jí)別客戶( Tier4 及 Tier5 等級(jí)客戶)提供的 RPM 上限。在算力挑戰(zhàn)更大的長文本模型上,豆包通用模型 pro 和 lite 的 128k 版本,模型限流為 1K RPM 和 400K TPM,同樣大幅高于國內(nèi)其他的 128k 長文本模型,能夠幫助企業(yè)以較低成本使用大模型、加速大模型應(yīng)用落地。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知