OpenAI 在 5 月發表 GPT-4o 時,同時介紹了 ChatGPT 的高階語音模式,以更自然的聲線,實時回應用戶的查詢,像真程度令人驚嘆。今日 OpenAI 就宣布向小部分付費的 Plus 會員發放這高階語音模式作 Alpha 測試,讓更多人去測試它的安全性和對話品質。
高階語音模式使用 GPT-4o 模型,不用像過去的語音模式那樣要先將語音謄寫成文字處理後再由文字轉回語音,所以反應更快,而且能理解和回應幽默和諷刺的說話,用戶亦能打斷 ChatGPT 的回應。
獲邀的用戶將會收到 OpenAI 發出的電郵,登入 ChatGPT 手機應用時也會有通知。OpenAI 將會陸續增加參與測試的用戶,預計會在今年秋季向所有付費用戶推出高階語音模式。
今次 Alpha 測試會集中於安全性和對話的品質。OpenAI 安排了超過 100 名外界的紅隊人員參與測試 GPT-4o 的語音功能,涵蓋 45 種語言。而為了保障私隱,OpenAI 訓練模型只用四種預設口音來說話,並且建立了一套系統去攔截不是這四種口音的輸出。過去示範時,GPT-4o 的聲線被指跟紅星 Scarlett Johansson 施嘉莉.祖安遜極之相似,而 OpenAI CEO Sam Altman 在過去亦曾多次找過她,想用她的聲線在 AI 上,不過都比她推辭。所以聲線極像 Scarlett Johansson 的 GPT-4o 示範影片一出,即遭到 Scarlett 方面發律師信要求刪除。
除此之外,OpenAI 亦實施了防護措施,防止用戶要求 AI 作出暴力和含有版權內容的回應。
不過這次 Alpha 測試並沒有開放影像功能,AI 不能「看到」畫面上的內容,或鏡頭下的景物。OpenAI 表示這些功能要日後才推出,他們計劃在 8 月初發布有關 GPT-4o 功能、限制和安全評估的報告。