ChatGPT將推出新的語音和圖像功能

ChatGPT將推出新的語音和圖像功能

9,884 次觀看・10 個月前

9月26日消息，OpenAI宣佈，在接下來的兩周內將在ChatGPT中向Plus和Enterprise使用者推出語音和圖像。語音將在iOS和Android上推出，圖像將在所有平臺上提供。據OpenAI介紹，新的語音功能由一個新的文本到語音模型提供支援，該模型能夠從文本和幾秒鐘的語音樣本生成“類似人類的音訊”。OpenAI似乎還認為該模型的潛力不止於此，其正在與流媒體音樂服務平臺Spotify合作，將播客翻譯成其他語言，同時保持播音者的聲音。合成語音有許多有趣的用途，而OpenAI可能會成為該行業的重要組成部分。圖像搜索方面，有點類似於Google Lens的功能，用戶拍攝自己感興趣的任何東西的照片，ChatGPT去嘗試瞭解用戶在詢問什麼，並做出相應的回應。使用者還可以使用應用程式的繪圖工具説明明晰自己的訴求，或配合圖像進行說話或寫入問題。除OpenAI之外，8月31日起，百度文心一言、訊飛星火等大模型正式向公眾開放。9月5日，WPS AI正式面向社會開放，率先應用在WPS智慧文檔。9月21日，微軟舉行了秋季發佈會，宣佈將發佈Windows 11的下一個大更新23H2，據介紹本次系統更新將會有超過150項新功能，包括新的人工智慧驅動的Windows Copilot功能。

相關影片推薦

熱門必看