致力開發AI翻譯的德國創業公司DeepL,宣稱翻譯品質優於GPT-4、Google翻譯,讓這家公司擁有超過10萬付費客戶,估值達到20億美元。新推出的DeepL Voice解決方案,象徵公司正式進軍語音翻譯市場。
DeepL Voice是DeepL首款支持即時語音互動的語音翻譯解決方案,同步提供2項產品──Voice for Meetings(會議語音)、Voice for Conversations(對話語音),讓跨語言的影片會議和面對面即時翻譯成為可能,並以文本呈現、而非語音。
Voice for Meetings可消除影片會議的語言障礙,每位與會者可使用自己偏好的語言溝通,提升參與度,其他人則在螢幕增至到即時翻譯字幕。不過,目前唯一支持Voice for Meetings產生即時翻譯字幕的影片會議服務為Microsoft Teams,是否集成Zoom或Google Meet還沒有進一步消息。
Voice for Conversations支持移動設備,場景適用於面對面對話,通過即時翻譯字幕協助不同語言進行溝通,並提供2種字幕顯示模式,方便雙方在同一設備查看翻譯內容。
DeepL Voice進一步擴展DeepL平台上的語言與通信工具組件,為了確保達到DeepL翻譯的高品質和準確度,全新語音翻譯技術採用多樣數據訓練而成的AI模型,能夠處理不同的口音和環境,滿足商業應用所需。
DeepL Voice全面推出下,企業客戶都能使用,初期支持英語、德語、日語、韓語、瑞典語、荷蘭語、法語、土耳其語、波蘭語、葡萄牙語、俄語、西班牙語及義大利語,未來將會陸續添加更多語言。此外,DeepL翻譯器支持的33種語言均能提供字幕翻譯。
「DeepL在書面翻譯領域處於領導地位,但即時語音翻譯是完全不同的挑戰」,DeepL首席執行官暨創辦人Jarek Kutylowski指出,即時翻譯必須處理不完整的語音輸入、發音問題及延遲等因素,這些可能導致誤譯,影響翻譯體驗。這些挑戰在日常人際對話經常出現,容易導致誤解,因此DeepL一開始就有對此考量,設計出幫助企業跨語言溝通的解決方案。
「語音是明年翻譯的重點」,Jarek Kutylowski接受外媒TechCrunch採訪表示。事實上,Google逐步將即時翻譯字幕納入Google Meet,還有許多AI創業公司也在創建語音翻譯相關服務,如ElevenLabs和Panjaya等。
DeepL Voice的推出是DeepL首次進軍語音翻譯領域,將領先業界的翻譯品質和安全性導入對話交流。光是2024年,DeepL推出DeepL Write Pro並更新詞彙表功能,也發布新一代大型語言模型,宣稱翻譯品質超越GPT-4、Google翻譯。此外,今年5月DeepL獲得Index Ventures領投的3億美元融資,公司估值達到20億美元,併入選福布斯2024年雲計算100強榜單。
(首圖來源:DeepL)