Anthropic 基于 Claude 3.5 Sonnet 擴充 AI 開發(fā)工具：細化提示詞、增強評估和測試

2024/7/11 11:31:32 來源：IT之家作者：故淵責編：故淵

評論：

IT之家 7 月 11 日消息，Anthropic 公司昨日（7 月 10 日）發(fā)布新聞稿，宣布推出了多項新工具，基于 Claude 3.5 Sonnet 大語言模型自動化、細化提示詞（prompt）。

IT之家附上完整演示視頻如下：

Anthropic 控制面板新增“評估”（Evaluate）單元，借助 Claude 3.5 Sonnet 大語言模型，幫助開發(fā)者高效地生成、微調(diào)和測試提示（Prompt）。

Anthropic 基于 Claude 3.5 Sonnet 擴充 AI 開發(fā)工具：細化提示詞、增強評估和測試

這些增強功能旨在改進語言模型對各種任務(wù)的響應(yīng)，為使用 Claude 開發(fā)人工智能產(chǎn)品的企業(yè)提供寶貴的資源。

開發(fā)者只需描述任務(wù)（例如“分流處理客戶支持請求”），Claude 就會為你生成一個高質(zhì)量的提示。

Anthropic 基于 Claude 3.5 Sonnet 擴充 AI 開發(fā)工具：細化提示詞、增強評估和測試

開發(fā)者在“評估”選項卡中，可以根據(jù)各種場景測試其人工智能應(yīng)用程序的提示。

用戶可以上傳真實示例或者使用 Claude 生成案例，從而對比不同提示之間的有效性，答案以五分制進行評估，便于開發(fā)者直觀評估。

Anthropic 基于 Claude 3.5 Sonnet 擴充 AI 開發(fā)工具：細化提示詞、增強評估和測試

在 1 個博客示例中，開發(fā)者只需調(diào)整一行，就能在所有測試中生成更長、更詳細的答案，從而節(jié)省時間和提高生產(chǎn)率。

新工具支持手動和自動測試提示。開發(fā)人員可以生成輸入變量，查看 Claude 的響應(yīng)情況，并在需要時手動輸入測試用例。

根據(jù)多個真實輸入進行測試有助于在生產(chǎn)部署前驗證提示質(zhì)量。開發(fā)人員可以手動添加或從 CSV 中導入新的測試用例，或請求 Claude 創(chuàng)建測試用例。

Anthropic 基于 Claude 3.5 Sonnet 擴充 AI 開發(fā)工具：細化提示詞、增強評估和測試

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

Anthropic 基于 Claude 3.5 Sonnet 擴充 AI 開發(fā)工具：細化提示詞、增強評估和測試