ChatGPT將推出新的語音和圖像功能

9,882 次觀看・5 個月前
9月26日消息,OpenAI宣佈,在接下來的兩周內將在ChatGPT中向Plus和Enterprise使用者推出語音和圖像。語音將在iOS和Android上推出,圖像將在所有平臺上提供。 據OpenAI介紹,新的語音功能由一個新的文本到語音模型提供支援,該模型能夠從文本和幾秒鐘的語音樣本生成“類似人類的音訊”。OpenAI似乎還認為該模型的潛力不止於此,其正在與流媒體音樂服務平臺Spotify合作,將播客翻譯成其他語言,同時保持播音者的聲音。合成語音有許多有趣的用途,而OpenAI可能會成為該行業的重要組成部分。 圖像搜索方面,有點類似於Google Lens的功能,用戶拍攝自己感興趣的任何東西的照片,ChatGPT去嘗試瞭解用戶在詢問什麼,並做出相應的回應。使用者還可以使用應用程式的繪圖工具説明明晰自己的訴求,或配合圖像進行說話或寫入問題。 除OpenAI之外,8月31日起,百度文心一言、訊飛星火等大模型正式向公眾開放。9月5日,WPS AI正式面向社會開放,率先應用在WPS智慧文檔。9月21日,微軟舉行了秋季發佈會,宣佈將發佈Windows 11的下一個大更新23H2,據介紹本次系統更新將會有超過150項新功能,包括新的人工智慧驅動的Windows Copilot功能。