人工智能新創公司OpenAI推出能夠解決複雜推理的新版ChatGPT,定名OpenAI o1。這款新模型能以人類思考方式回答問題,專門應付需要邏輯推理的任務,像是數學和科學。
專門應付邏輯推理任務
OpenAI指出,OpenAI o1在國際數學奧林匹亞(IMO)競賽中能正確解答83%的題目,相較之下,今年5月上線的GPT-4o僅能正確解答13%的題目。
OpenAI新模型能以人類思考方式回答問題。路透社
新模型能夠解決複雜推理問題。網上圖片
OpenAI o1在國際數學奧林匹亞(IMO)競賽中能正確解答83%的題目。網上圖片
研究人員示範用OpenAI o1技術解決數學問題。網上圖片
OpenAI o1是「草莓」系列人工智能模型。
GPT-4o在資訊檢索方面的表現較為出色,而OpenAI o1則是專門應付需要邏輯推理的任務,而且在回答問題前會花更多時間思考題目,「就像人類一樣」。
助醫療研究及電腦開發
OpenAI表示,新的推理功能可用於醫療保健研究人員註釋細胞測序數據,物理學家生成複雜公式,或電腦開發人員構建和執行多步驟設計。
OpenAI首席科學家帕喬基和技術研究人員席多在一次展示中,示範用OpenAI o1技術解決一個博士級的化學問題,並根據患者的症狀和病史詳細報告,診斷出一種疾病。
回答需要時間
帕喬基進一步闡述:「使用像是ChatGPT這種早期模型時,你問它一個問題,它會立即開始回答。但推理模型OpenAI o1需要時間,它能夠用英文思考問題,嘗試將問題拆解,並尋找解決角度,努力提供最佳解答。」
OpenAI的ChatGPT在2022年底問世,此款對答機械人會出現幻覺和捏造事實的情況,OpenAI一直在嘗試解決缺陷;不過席多仍表示,OpenAI o1並不是完美的,這款新的推理模型只是更有可能產生正確答案。
OpenAI在內部使用代號Strawberry(草莓)來指稱這個項目,同時將今次宣布的新模型命名為o1和o1-mini。
自周四起,用戶可以透過ChatGPT、付費版ChatGPT Plus、Team都能夠使用OpenAI o1的預覽版本。