若遇「極端情況」 Claude可終止對話

Claude聊天機器人有能力終結對話。Anthropic

人工智能(AI)公司Anthropic為旗下兩款Claude AI模型增添新的功能,可以在極端情況下結束與用戶對話。

該公司發布網誌稱,Claude Opus 4和4.1模型現在擁有結束與用戶對話的權限,僅在「極少數且極端的情況下,當使用者持續展現有害或辱罵行為時」,才會啟用,並解釋當在遇到有害對話時會中止互動,例如「用戶要求提供涉及未成年人的性內容,以及試圖索取可能導致大規模暴力或恐怖行為的資訊」。

Anthropic表示,該兩款模型只有在多次嘗試引導無效,並且已無望展開具建設性的互動時,才會採取結束對話的最後手段。不過,Anthropic 聲稱,即使在討論高度爭議的話題時,大多數用戶也不會遇到Claude切斷對話的情況,此功能只將保留用於「極端情況」。

一旦Claude主動結束對話,用戶將無法在該對話中發送任何新訊息,但可以立即開啟新的對話。Anthropic補充稱,即使某個對話被終止,也不會影響其他對話,使用者甚至可以返回先前的訊息進行編輯或重試,轉至其他對話方向。

鑑於AI聊天機器人可能傳播不良甚至暴力違法信息,對Anthropic來說,AI能夠退出「可能造成困擾的互動」,可謂一種低成本的風險管理方法。本報訊

科技-三藩市版