谷歌作曲機器人 研究成功不發佈

谷歌開發可以根據文本提示創造音樂的機器人,例子之一是從描述繪畫作品的文字中創造音樂。谷歌Github

谷歌宣布開發了一個可以根據文本提示創造音樂的機器人,但不要指望很快就能使用它。

谷歌研究人員日前發表一篇論文,將該機器人MusicLM描述為「一個從文本描述中生成高保真音樂的模型」,例如「舒緩的小提琴旋律伴著扭曲的吉他聲」。

論文寫道,「我們證明MusicLM可以被文本和旋律訓練,因為它可以根據文字圖說中描述的風格來轉換口哨和哼唱的旋律。」

根據這項研究,用戶可以輸入諸如「帶有令人難忘的薩克斯獨奏的迷人的爵士樂獨唱」或「帶有低沉的低音和強勁的踢踏聲的柏林90年代電子樂」之類的描述,獲得相應的結果。在谷歌的代碼平台Github頁面上分享了類似例子和相應音頻。

MusicLM的首次亮相恰值OpenAI的熱門聊天機器人ChatGPT迅速崛起期間,促使谷歌內部發出「紅色代碼」,《紐約時報》去年12月報道,此舉意味著該科技巨頭「拉響火警警報」,為了競爭,谷歌正在加緊發布20種新產品,以及具有AI聊天機器人功能的谷歌搜索。

不過,谷歌表示不打算向公眾發佈MusicLM,並舉出了各種風險,包括可能導致缺乏代表性和文化挪用、編程偏見、技術故障以及「盜用創意內容的可能」。

根據該研究,在大約1%的例子中發現了可識別的現有歌曲,顯示會有潛在的版權侵權。研究報告稱,「我們著力強調,在解決這些與音樂生成相關的風險方面,未來需要更多的工作。我們目前沒有計劃發布模型。」

該研究還指出了該技術現有的局限性,包括文字提示中使用的否定詞和時間排序,以及聲音質量。展望未來,研究人員稱他們打算致力於「為高層次的歌曲結構建模,如引子、主歌和副歌」。本報訊

科技-三藩市版