Claude增新功能 生成測試AI提示

語言模型Claude增加新功能,協助工程師測試改進提示。Anthropic

去年提示工程師成為了人工智能(AI)行業的熱門工作,AI公司Anthropic正開發令其工作至少可以部分實現自動化的工具。

科技網站TechCrunch報道,Anthropic發布幾項新功能,幫助開發人員利用該公司的語言模型Claude創建更有用的應用程式,可使用Claude 3.5 Sonnet生成、測試和評估提示,利用提示工程技術創建更好的提示輸入,並改進Claude對專門任務的回答。

當用戶要求執行某些任務時,語言模型的寬容度很高,但有時對提示語措辭的微小改變,會給結果帶來巨大的改進。通常用戶自行尋找這種措辭,或聘請一位提示工程師來完成工作,Anthropic的新功能則提供快速反饋,讓用戶更輕鬆做出改進。

這些功能位於Anthropic Console的新「評估」(Evaluate)標簽下。Console是為開發者提供的「測試廚房」,旨在吸引希望用Claude構建產品的企業。其中一項功能是內置提示生成器,利用Anthropic提示工程技術,可將一項簡短的任務描述,生成更長、更充實的提示。開發人員可以測試其AI程式的提示在一系列場景中的有效性,將現實世界中的例子上傳到測試套件中,或者讓Claude生成一系列AI生成的測試案例。然後開發人員可以並排比較各種提示的有效性,並對樣本答案做出評級。本報訊

科技-三藩市版