Gemini Live善辨識音 用戶互動更流暢

Gemini Live將改善聊天機器人與用戶互動方式。谷歌

谷歌正在為這是一款可與使用者進行即時對話的人工智能(AI)助理Gemini Live帶來一系列新功能。從下周開始,Gemini Live將能在使用者共享相機時,直接在螢幕上標示內容,讓AI助理更容易指出特定項目。

例如,如果你正在為某個專案尋找合適的工具,可以將智能手機的相機對準一組工具,Gemini Live就會在螢幕上標示正確的那個。此功能將於8月28日隨著新發布的Pixel 10手機推出。谷歌也將同時開始向其他Android安卓裝置推出視覺引導功能,並在未來幾周擴展到iOS系統。

谷歌還將推出新的整合功能,允許Gemini Live與更多程式進行互動,包括訊息、電話和時鐘。假設你正在與Gemini討論前往目的地的路線,突然發現快遲到了,可以發指令打斷:「這條路線似乎不錯。現在幫我傳訊息給Alex,告訴他我大概會晚10分鐘。」Gemini就會幫你草擬要傳給朋友的簡訊。

谷歌也將為Gemini Live推出升級版的音訊模型,號稱將「顯著改善」聊天機器人「運用人類語音關鍵元素的能力,例如語調、節奏和音高」。不久後,Gemini就能夠依據對話主題改變語氣,例如在您詢問與壓力相關的主題時,會以比較平和的聲音回答。

你還將能夠調整Gemini的說話速度,這聽起來有點類似於用戶在ChatGPT語音模式中調整語氣風格。如果要求Gemini從某個角色或歷史人物的角度,以戲劇性的方式重述一個故事,Gemini可能會採用適當的口音,從而呈現「豐富且引人入勝」的敘述。本報訊

科技-三藩市版