文:曾維燊
圖:美聯社
人工智能公司 Anthropic 周二(7日)表示,其最新研發的AI模型「Claude Mythos Preview」在網絡安全領域具備極高能力,甚至達到不宜全面公開的程度。公司決定暫不對公眾發布,僅向超過40間科技企業組成的聯盟開放使用,以加強防範網絡攻擊。
該聯盟名為「Project Glasswing」,成員包括 Apple、Amazon、Microsoft 等大型企業,以及 Cisco、Broadcom 等硬件供應商,亦涵蓋維護開源軟件的 Linux Foundation。Anthropic將提供最高達1億元的Claude使用額度,協助各方檢測及修補關鍵系統漏洞。
公司首席科學家 Jared Kaplan 表示,公布模型能力是為了提高外界警覺,讓防禦方能及早應對潛在威脅。他指出,現時AI技術正推動網絡安全進入新階段,傳統防護方式面臨重大考驗。
負責風險測試的團隊主管 Logan Graham 則形容,這款模型標誌業界「必須正視現實的時刻」。據稱,「Mythos」已可自主進行安全研究,包括掃描並利用「零日漏洞」(zero-day vulnerabilities),甚至能找出連軟件開發者都未察覺的缺陷。
Anthropic透露,該模型已在多個主流作業系統及瀏覽器中識別出數以千計漏洞,其中包括一個存在達27年的 OpenBSD 系統漏洞。另有一項影片軟件問題,曾經過500萬次自動測試仍未被發現,最終由該模型識別。
公司行政總裁 Dario Amodei 過去曾因AI用途問題與美國國防部出現分歧。該公司一方面積極開發高性能AI系統並推動商業化,另一方面亦多次公開警告技術潛在風險,立場備受關注。
類似做法並非首次出現。早於2019年,OpenAI 曾暫緩公開其GPT-2模型,理由是擔心被用於大規模製造虛假資訊。不過最終仍在完成安全測試後發布完整版本。
今次Anthropic的說法更為嚴峻。公司指,「Mythos」不單可發現漏洞,部分情況下更可編寫利用程式,能力甚至超越多年來人類研究員與自動化工具的成果。
網絡安全公司 CrowdStrike 技術總監 Elia Zaitsev 指出,該模型展示防禦方可如何大規模應對威脅,同時亦意味攻擊者同樣可能利用相同技術。他直言,過往需時數月的工作,現時可在數分鐘內完成。
隨着AI能力提升,業界憂慮攻防競賽將急速升級。部分專家認為,全球大量仍在運行舊版程式的關鍵系統,未來可能需要全面修補甚至重寫,否則難以抵禦新一代AI帶來的風險。
Anthropic預測,類似的網絡安全能力很快會在其他AI模型中普遍出現。公司強調,現時所見僅屬初步階段,未來技術發展速度與影響範圍,或遠超現有預期。

