宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版

2024年09月25日 首頁 » 熱門科技
千呼萬喚始出來,,本周內向所有 Plus 和 Team 用戶全量推送。
然而,「本周內」也是猶抱琵琶半遮面的泛指,仍然是一部分人先用起來。
如果你也還沒被推送到,不妨在等待之餘,看看幸運網友們是怎麼整活和刁難 AI 的。
喘氣、哭泣、表演口技,你看 ChatGPT 有幾分像人
角色扮演,往往是考驗語音 AI 的第一課。
讓 ChatGPT 用聲音表演不同情緒,興奮的、平靜的、戲精的,它都信手捏來,情緒飽滿且自然,不知道哪裡進修的表演班。
情緒激動時甚至有點過頭,對話者連說好幾個 OK,才把它的表演欲給摁住。

影片來自:X@WorldEverett

除了說話的語氣,我們的笑、哭、喘氣等狀態,也體現了文字不能道盡的心情。如果 AI 能夠完美地復刻,那就更加擬人了。
這難不倒 ChatGPT,它邊傷心啜泣,邊讚美自己的語音模式有多厲害,衝擊力堪比短影片的 AI 紫薇,好像隨時都能過呼吸。

影片來自:X@DavidTaylor_MD
當 ChatGPT 代入一位奪得金牌的運動員,模仿同樣惟妙惟肖,說話大喘氣,表現出既興奮又疲憊的精神狀態。

影片來自:X@wongmjane
讓 ChatGPT 嘗試 Vtuber(虛擬主播)賽道,也不是不可以,不過這個聲音有點尖細,不夠自然,建議聽洛天依和初音未來洗洗耳朵。

影片來自:X@wongmjane
京中有擅口技者,僅一桌、一椅、一扇、一撫尺,ChatGPT 模仿各種聲音的能力不比人類藝術家,倒也馬馬虎虎。

影片來自:YouTube@MattVidPro AI
你要求邊講故事邊配音效,AI 就能現演開門的吱嘎聲、蟲子的嘰喳聲,儘管功力還不夠純熟。
把思路打開,高級語音模式很適合給孩子們講睡前故事,故事內容、旁白、音效一手包辦,一個 AI 就是一個團隊。
自娛自樂之餘,實用主義者們已經開始拿 ChatGPT 幹活,做些有價值的事情了。
ChatGPT 會說 50 多種語言,懂各種腔調的英語,很多小語種,甚至方言。
所以也就很容易想到,讓 AI 當外語老師,切換語言和我們對話。據說英語母語人士最難學的語言之一馬耳他語,也不在話下。

影片來自:X@anthonyspiteri
巧的是,語言學習軟體多鄰國,也在周二的年度大會 Duocon 推出了 AI 影片通話,用戶可以和多鄰國角色「拽姐」練習口語。不過,目前只適用於英語、西班牙語和法語。
ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版
看來,教培行業假設了,有了 AI 之後,我們不是不用學外語,而是更隨時隨地學各種各樣的外語。
AI 不僅可以當外語老師,X 網友 @Lyle_AI 通過 ChatGPT 高級語音模式,改進自己的銷售話術,整個操作流程非常值得借鑑。
ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版
他讓 AI 扮演一名銷售專家,然後向 AI 推銷,讓 AI 反饋自己的話術說服力強不強、夠不夠清晰,以及有沒有價值。AI 反饋之後,他還會追問,並讓 AI 給出示範。
練習、反饋、提問、模仿,推而廣之,這套流程可以用到面試、演講等場景,讓 AI 幫社恐的人類更擅長口語表達。
AI 能說,但能不能聽?一位網友另闢蹊徑,讓 ChatGPT 給吉他調音。

影片來自:x@skirano
他邊彈邊問行不行,隨時打斷 AI,ChatGPT 表現得很內行,但不知道它的耳朵有沒有調音器准。
總之,決定 AI 發揮的上限大概有兩方面。
一個是模型的能力,低延遲和隨時打斷讓對話有來有往,不考驗用戶的耐心。
另一個是網友的想像力,讓語音場景有無限的可能性。
姍姍來遲的高級語音,還不能做你的日常搭子
滿打滿算,從發布 Demo 到正式推送,已經過去了 4 個月,OpenAI 高級語音模式仍然未能完美,和發布會時相比也打了個折扣。
時長限制是最讓話癆的人類遺憾的,暫時別想和 AI 深夜煲電話粥了,CNBC 和 X 網友 @MattVidPro 的體驗都發現,只能和 ChatGPT 聊 45 分鐘左右。
OpenAI 的官方回答是,每天的限制時間可能都不一樣,當天還剩 15 分鐘時,會進行提醒。
影片和螢幕共享功能也沒能實現,AI 沒有「眼睛」,意味著不能像 Demo 那樣,讓它實時解題、給代碼糾錯,或者誇誇我們的寵物。
ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版
另外就是一些細節上面的問題了,OpenAI 的官方例子裡,在模擬因為遲到給奶奶道歉的場景時,ChatGPT 的普通話語氣很真誠,但仍然有些譯製腔,不如國產 AI。
並且,它給出的話術也比較僵硬,誰會對自己的奶奶說,「我可以怎麼補償您呢」。
以上種種說明 AI 還沒能修成人形,同時,OpenAI 也給它增加了一些額外的禁制。
YouTuber 博主@MattVidPro AI 在直播體驗時,意外踩到了 OpenAI 的雷。
他讓 ChatGPT 模仿醉鬼,它剛說了個開頭,停頓了一下之後如夢初醒,切換回了正常語氣,說規則不允許它這樣做,把他嚇了一大跳。

影片來自:YouTube@MattVidPro AI
類似地,讓 ChatGPT 模仿口吃,它也會表示拒絕,因為這樣可能會冒犯他人。為了尊重音樂創作者的版權,ChatGPT 也不能唱歌。
以規則的形式賦予 AI「三觀」,某種程度上讓它更像一個「社會人」了。但也有用戶覺得,過猶不及。
這是不是像阿西莫夫的機器人三定律一樣,讓 AI 更好地融入社會,服務於更多人呢?
所看到的高級語音模式體驗中,我更偏愛的,恰恰是那些融入生活的日常場景。
ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版
X 用戶@spencergardner,讓自己兩歲半的孩子和 ChatGPT 一起數數、玩文字遊戲。他還能介入其中,主持他們的談話,改變話題,或者提不同的問題。
期間有很多次的打斷、猶豫、語氣的變化,但也因此很隨意和輕鬆。
ChatGPT 的高級語音模式現在還支持設定自定義指令,讓模型知道用戶的名字和一些基本資訊,感覺就是為了陪伴場景準備的。
ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版
之前 ChatGPT 的 Dan 模式火過一陣子,用戶用提示詞的方式讓 ChatGPT 越獄,談談情說說愛擦擦邊,他們還會用自定義指令,放上自己的名字、愛好等,調教 AI 記住自己。
就像播客是一種陪伴媒介,語音總能在情感賽道上一騎絕塵,所以高級語音模式對人心的慰藉,絕對是個賣點,等待進一步的落地。
以「閹割版」發布的 ChatGPT 高級語音模式,讓我們看到了把 AI 作為學習、生活、工作搭子的未來。不和它說話,它就保持沉默,和它聊天,它不會讓你覺得熱臉貼冷屁股。
ChatGPT 高級語音模式首批體驗來了!網友玩壞了,但還是個閹割版
未來很近,但還沒有抵達。
神隱很久的 OpenAI 總裁 Greg Brockman,這次也罕見地發聲:
通過 ChatGPT 實現流暢的語音對話,可以讓我們意識到,在電腦中輸入內容是多麼不自然。
沒錯,只在聊天框打字是挺無聊的,但讓絲滑的語音對話真正走入日常,先從 OpenAI 把高級語音模式推送到更多人,支持多模態和全天候聊天開始吧。
宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新