設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Anthropic 基于 Claude 3.5 Sonnet 擴(kuò)充 AI 開發(fā)工具:細(xì)化提示詞、增強評估和測試

2024/7/11 11:31:32 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 7 月 11 日消息,Anthropic 公司昨日(7 月 10 日)發(fā)布新聞稿,宣布推出了多項新工具,基于 Claude 3.5 Sonnet 大語言模型自動化、細(xì)化提示詞(prompt)。

IT之家附上完整演示視頻如下:

增強開發(fā)環(huán)境,可生成提示

Anthropic 控制面板新增“評估”(Evaluate)單元,借助 Claude 3.5 Sonnet 大語言模型,幫助開發(fā)者高效地生成、微調(diào)和測試提示(Prompt)。

這些增強功能旨在改進(jìn)語言模型對各種任務(wù)的響應(yīng),為使用 Claude 開發(fā)人工智能產(chǎn)品的企業(yè)提供寶貴的資源。

開發(fā)者只需描述任務(wù)(例如“分流處理客戶支持請求”),Claude 就會為你生成一個高質(zhì)量的提示。

有效測試和評估

開發(fā)者在“評估”選項卡中,可以根據(jù)各種場景測試其人工智能應(yīng)用程序的提示。

用戶可以上傳真實示例或者使用 Claude 生成案例,從而對比不同提示之間的有效性,答案以五分制進(jìn)行評估,便于開發(fā)者直觀評估。

在 1 個博客示例中,開發(fā)者只需調(diào)整一行,就能在所有測試中生成更長、更詳細(xì)的答案,從而節(jié)省時間和提高生產(chǎn)率。

測試機(jī)制

新工具支持手動和自動測試提示。開發(fā)人員可以生成輸入變量,查看 Claude 的響應(yīng)情況,并在需要時手動輸入測試用例。

根據(jù)多個真實輸入進(jìn)行測試有助于在生產(chǎn)部署前驗證提示質(zhì)量。開發(fā)人員可以手動添加或從 CSV 中導(dǎo)入新的測試用例,或請求 Claude 創(chuàng)建測試用例。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Claude,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知