在過去的一年中,OpenAI 快速開發了其 ChatGPT 生成式 AI 聊天機器人和 Sora AI 影片創建器,現在它又推出了一種新的 AI 工具: 語音合成器 ,它只需 15 秒的音訊就能創造出 合成 的 語音 。
在一個部落格文章中,OpenAI 表示它一直在執行 語音 引擎的「小規模預覽」,該引擎自 2022 年底以來一直在開發中。它實際上已經用於 ChatGPT 應用程式的朗讀功能中,該功能會朗讀答案給您聽。
一旦您從 15 秒的範例訓練語音,您就可以讓它以「富有情感且逼真」的方式朗讀您喜歡的任何文字。OpenAI 表示,它可用於教育目的、將播客翻譯成新語言、接觸偏遠社區,以及支援非語言人士。
當下這新功能還未公開使用,但您可以去聆聽語音引擎建立的文字範例。OpenAI 發布的片段聽起來相當令人印象深刻,儘管它們仍有丁點兒生硬。
擔心遭到濫用是語音引擎目前還未公開使用主要原因:OpenAI 表示,它希望進一步研究如何保護此類工具免於被用於散布錯誤資訊和未經同意複製聲音。
OpenAI 表示:「我們希望就合成語音的負責任部署展開對話,以及社會如何適應這些新功能。根據這些對話和小規模測試的結果,我們將對是否以及如何大規模部署這項技術做出更明智的決定。」
由於今年美國和英國將舉行重大選舉,而生成式 AI 工具也不斷進步,這對各種 AI 內容(音訊、文字和影片)都構成了一項隱憂,而且越來越難以知道該相信什麼。