聊天機器人橫空出世 科技新領域惡戰難免

周涵寧博士。周涵寧提供

程進興博士。程進興提供

胡宇曉博士。胡宇曉提供

(本報記者王蔚矽谷報道)

ChatGPT這個智能聊天機器人究竟有哪些特別的先進技術呢?GPT是Generative Pre-trained Transformer的縮寫,中文意思是生成性預訓練變換模型。

G是指能生成語言,比如可以根據需要創建動物的圖像或文本描述,也可以生成詩歌、文章和藝術品等。P意為預訓練的語言模型,如同用這個模型訓練小孩掌握各方面的知識和能力,在監督和反饋中使他發展生成出更多的能力。T是底層的人工智能的算法架構,及神經元網絡的一種模型、算法。Chat即是指基於GPT的語言模型又加上了對話,不僅可以輸入一句回答一句,而且能做一系列的對話,與以往搜索引擎提供一堆結果讓用戶自己篩選的做法有很大不同。

胡宇曉:大數據是關鍵

曾在必應搜索、微軟研究院等公司擔任人工智能相關領域的研究員和工程師的胡宇曉博士,用形象的比喻對本報記者講解了ChatGPT的技術構成要素。他說,如果把ChatGPT看成是一個做飯機器人,G是指它不僅會根據圖片和菜譜選做已有的菜品,還能自創新菜,推陳出新;P是說它通過預先大量瀏覽菜譜,遍嚐百味,已經具備了基本的烹飪能力,不需要詳細的烹飪指令;T是指利用了一種最近流行的烹飪方式比如帶煤氣灶和微波爐的廚房;chat是說它可以通過跟顧客聊天來懂得顧客的想法,做到因人而異甚至量身定製。

ChatGPT是基於一個很大的語言模型,其算法融會貫通了大量數據,不是簡單的存儲數據資料,而是能像人腦一樣用自然的具有理解力的語言來回答人的指令,帶給人們的是完全不同於以往的搜索體驗。

周涵寧:帶來極大變革

在矽谷亞馬遜負責搜索體驗的智能優化的高級研發經理周涵寧博士接受本報記者採訪時表示,ChatGPT帶來的變革完全可以比肩2006年那場移動科技的革命。他說,我們都記得蘋果手機1.0的出現給人類社會帶來的巨大變化,它創造了無數新的就業機會,分化了矽谷的贏家和輸家,使人們的生活進入了移動通訊的新時代。這次ChatGPT也會從多方面改變人的生活方式,我們人類一部分知識將來自於這種機器人,而人原有的能力、競爭力等都要被重新定義,比如記性好不再是優勢因素。胡宇曉博士認為,這個聊天機器人成熟到可以混淆或代替人的智能的程度了,這就會使我們以前不可能做或做得不好的事情現在變得可能或更好,因此會帶來行業的重新洗牌,有些行業將會被機器替代。周涵寧博士指出,這次的變革實質上帶來了生產力的革命,遠非互聯網泡沫可比。比如學生可以省去查資料、寫總結等工作,把更多的時間精力用於創新和深度的學習上。周博士甚至認為,ChatGPT還會帶來管理、治理模式的改變,減少一層層的代理人環節,使決策層更高效,減少內耗。

程進興:競爭異常激烈

ChatGPT先聲奪人,是否今後會在美國相關領域佔據龍頭地位呢?本報記者還採訪了另一位矽谷的人工智能專家程進興博士。程進興是斯坦福大學計算機科學與工程博士, 曾在矽谷的微軟、Yahoo等公司從事機器學習和人工智能等方面的研發和技術管理工作。

程博士說,其實Google的AI團隊早在2018年就開發了具有GPT這種底層架構的語言模型,但是OpenAI公司後來居上,交出了ChatGPT聊天機器人這個漂亮的答卷,置Google於被動局面。一週前Google展示其聊天機器人時犯了低級錯誤,輿論大譁,其股票應聲下跌。難道Google會輸掉這場AI大戰嗎?程進興博士認為鹿死誰手很難預料,Google有很大的可能性迎頭趕超,重要的原因是,Google輸不起這場決戰。 ChatGPT背後的公司是微軟,其Bing搜索的市場份額相對較小,只有3%,而Google佔搜索應用的90%多的份額,如果智能搜索上失去優勢,那會給Google帶來顛覆性的挫敗,因此Google必須要贏得這場AI大戰。程博士認為Google具備了趕上ChatGPT的實力,財力自不待言,而人才優勢更不容小覷;據說近來還招募了一些離開了OpenAI公司的專業人士。程博士預測,未來美國的智能聊天機器人領域的競爭格局將會是,語言模型的基層架構會被掌握在幾大巨頭公司和一些非營利機構手上,中小公司的發展方向主要集中在落地應用的環節上。

中國暫時稍為落後

ChatGPT近來也激起了中國民眾的高度熱情,幾乎人人爭說ChatGPT。西方媒體近日也在關注有關阿里巴巴和百度準備在聊天機器人領域要大展身手的消息。那麼中國的發展態勢會怎樣?有沒有競爭優勢?程進興博士分析認為,中國目前的發展水平還落後於美國,無論是雲計算還是人才方面都有差距。主要是中國在ChatGPT方面的研發起步較晚,前幾年雖然有頭部公司從事大語言模型方面的研發, 但是到最近才提升重視到戰略級別。雖然近年來中國加快了這個領域的投資,但是要趕上美國的水平起碼需要幾年的時間。不過,在智能機器人的特定場景、中文的繪畫理解、電子商務的應用等方面,可能會有趕上美國的能力。尤其是在落地應用、使用型態的設計上,在中文訓練會話語料、產品交互等方面,中國可能有自身的優勢。

胡宇曉博士認為,中國不缺算法,但大數據可能是短板,主要是高質量中文語料相對少, 算力方面方面由於禁售和缺芯,未來也可能會成為瓶頸。不過,中文語料的標註/整理是中國的強項,主要是標註人力充足、成本低。但是中文語料在很多領域的完整性、一致性、專業性可能有問題。程進興博士說,的確,互聯網上高質量的語料還是以英文為主;不過, 如果國內首期目標是中文通用人工智能的話, 這個可能並不是問題。

另外對於在中國智能機器人領域的政策監管方面,周涵寧和程進興都認為存在潛在的風險,但究竟怎樣目前尚不確定。

灣區