
谷歌剛發布號稱迄今最強大的AI模型系列「雙子座」(Gemini),就被指在其性能方面撒謊。彭博社專欄文章指出,谷歌在最近一段視頻中歪曲了Genimi的性能。專欄作者奧爾森(Parmy Olson)說,谷歌本周播放了一段令人印象深刻的「what the quack」的手把手視頻,Gemini在視頻中看起來能力非凡。
據The Verge報道,這段6分鐘的視頻展示了Gemini的多模態功能。Gemini似乎能快速識別圖像,甚至是連線圖片,在幾秒鐘內做出反應,並實時跟蹤杯球遊戲中的紙團。
不過,在YouTube上的視頻描述中,谷歌有一個重要的免責聲明:「為了演示的目的,已經減少了延遲,縮短了Gemini的輸出,以求簡潔」。
這正是奧爾森不滿的地方。她發文稱,谷歌被要求為此置評時承認,視頻演示並不是通過語音提示實時進行的,而是使用了原始視頻中的靜止圖像幀,然後寫出文字提示,讓Gemini做出回應。
奧爾森寫道:「這與谷歌似乎在表明的內容,即人可以與Gemini進行流暢的語音對話,同時AI會實時觀察並回應周圍的世界,大相徑庭」。奧爾森認為谷歌是在「作秀」,目的是誤導人們,以掩飾Gemini仍然落後於OpenAI的GPT。
谷歌對此並不認同。當被問及演示的有效性時,谷歌指出谷歌DeepMind研究副總裁兼深度學習負責人溫亞茲(Oriol Vinyals)的一篇文章解釋了團隊是如何製作視頻的。
「視頻中的所有用戶提示和輸出都是真實的,為了簡潔起見進行了縮短」,溫亞茲說,「視頻展示了使用Gemini構建的多模態用戶體驗可能是怎樣的。我們製作它是為了激勵開發人員」。
The Verge指出,這當然是處理這種情況的一種方法,但對谷歌來說可能並不合適。至少在公眾看來,谷歌已被OpenAI的巨大成功嚇了一跳。如果谷歌想激勵開發者,就不能通過精心剪輯的可能會歪曲AI能力的宣傳片,而是通過讓記者和開發人員在小型公開測試版中實際體驗Gemini,看看它到底有多強大。本報訊