Anthropic公開新AI模型「Mythos」能力指網絡安全進入關鍵轉折期

文：曾維燊
圖：美聯社

人工智能公司 Anthropic 周二（7日）表示，其最新研發的AI模型「Claude Mythos Preview」在網絡安全領域具備極高能力，甚至達到不宜全面公開的程度。公司決定暫不對公眾發布，僅向超過40間科技企業組成的聯盟開放使用，以加強防範網絡攻擊。

該聯盟名為「Project Glasswing」，成員包括 Apple、Amazon、Microsoft 等大型企業，以及 Cisco、Broadcom 等硬件供應商，亦涵蓋維護開源軟件的 Linux Foundation。Anthropic將提供最高達1億元的Claude使用額度，協助各方檢測及修補關鍵系統漏洞。

公司首席科學家 Jared Kaplan 表示，公布模型能力是為了提高外界警覺，讓防禦方能及早應對潛在威脅。他指出，現時AI技術正推動網絡安全進入新階段，傳統防護方式面臨重大考驗。

負責風險測試的團隊主管 Logan Graham 則形容，這款模型標誌業界「必須正視現實的時刻」。據稱，「Mythos」已可自主進行安全研究，包括掃描並利用「零日漏洞」（zero-day vulnerabilities），甚至能找出連軟件開發者都未察覺的缺陷。

Anthropic透露，該模型已在多個主流作業系統及瀏覽器中識別出數以千計漏洞，其中包括一個存在達27年的 OpenBSD 系統漏洞。另有一項影片軟件問題，曾經過500萬次自動測試仍未被發現，最終由該模型識別。

公司行政總裁 Dario Amodei 過去曾因AI用途問題與美國國防部出現分歧。該公司一方面積極開發高性能AI系統並推動商業化，另一方面亦多次公開警告技術潛在風險，立場備受關注。

類似做法並非首次出現。早於2019年，OpenAI 曾暫緩公開其GPT-2模型，理由是擔心被用於大規模製造虛假資訊。不過最終仍在完成安全測試後發布完整版本。

今次Anthropic的說法更為嚴峻。公司指，「Mythos」不單可發現漏洞，部分情況下更可編寫利用程式，能力甚至超越多年來人類研究員與自動化工具的成果。

網絡安全公司 CrowdStrike 技術總監 Elia Zaitsev 指出，該模型展示防禦方可如何大規模應對威脅，同時亦意味攻擊者同樣可能利用相同技術。他直言，過往需時數月的工作，現時可在數分鐘內完成。

隨着AI能力提升，業界憂慮攻防競賽將急速升級。部分專家認為，全球大量仍在運行舊版程式的關鍵系統，未來可能需要全面修補甚至重寫，否則難以抵禦新一代AI帶來的風險。

Anthropic預測，類似的網絡安全能力很快會在其他AI模型中普遍出現。公司強調，現時所見僅屬初步階段，未來技術發展速度與影響範圍，或遠超現有預期。

Anthropic公開新AI模型「Mythos」能力指網絡安全進入關鍵轉折期

紐約

三藩市

洛杉磯

Anthropic公開新AI模型「Mythos」能力 指網絡安全進入關鍵轉折期

紐約

三藩市

洛杉磯

Anthropic公開新AI模型「Mythos」能力指網絡安全進入關鍵轉折期