宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

為了快速改進你的AI應用,Claude推出提示詞Playground

2024年07月11日 首頁 » 熱門科技

過去一年來,提示詞工程已經成為AI行業內的新興熱門崗位,而Anthropic則有意開發工具將它推向自動化——或者說,至少是一部分自動化。

根據Anthropic的博客文章,它在本周二公布了多項新功能,以幫助開發人員使用它的大語言模型Claude創建出更具實用性的應用程序。開發人員現在可以使用Claude 3.5 Sonnet來生成、測試和評估提示詞,使用提示詞工程技術進一步優化輸入內容,從而改進Claude在特定任務上的回答質量。

當我們要求語言模型執行某些任務時,它對於輸入內容一般比較寬容,但有時對提示措辭的微小變更則可能大大提升輸出結果的質量表現。以往我們必須親自調試措辭,或者聘請提示詞工程師專門負責此事,但這次公布的新功能提供快速反饋、能幫助用戶輕鬆找到符合預期的改進方向。

這些功能就旋轉在Anthropic控制台的新增Evaluate評估選項卡下。控制台是該公司專門為開發人員提供的測試平台,旨在吸引更多企業客戶使用Claude構建產品。其中一項功能正是Anthropic內置的提示詞生成器,已經於今年5月推出。這款生成器利用Anthropic內部原研的提示詞工程技術,可對任務做出簡短描述,也可構建出更長、更詳盡的提示內容。雖然Anthropic的工具可能還無法徹底取代提示詞工程師,但該公司表示它有助於降低新用戶的上手門檻,也能為經驗豐富的提示詞工程師們節約時間。

在評估選項卡中,開發人員可以測試自己的AI應用提示詞在各類場景下的實際效果。開發人員可以將真實示例上傳至該測試套件,也可以要求Claude提供一系列由AI生成的測試用例。之後,開發人員可以直接比較各類提示詞的有效性,並以五分制對示例答案進行評分。

為了快速改進你的AI應用,Claude推出提示詞Playground

Anthropic在文章中列舉的示例中,開發人員發現自己的應用程序在多個測試用例中都存在答案長度太短的問題。開發人員只需調整提示詞中的一行就能擴展答案長度,並將它同時應用於所有測試用例。這無疑將為開發人員節省大量時間和精力,特別是那些幾乎或者完全不具備提示詞工程經驗的開發人員。

Anthropic公司CEO兼聯合創始人Dario Amodei在今年早些時候在Google Cloud Next大會上接受採訪時表示,提示詞工程是企業廣泛採用生成式AI的關鍵因素、甚至說前提之一。Amodei總結稱:「這事看似簡單,但讓專業提示詞工程師上手30分鐘,往往可以決定一種應用到底能不能順利運行、達成目標。」

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新