隨著AI技術的不斷成熟,越來越多金融機構將虛擬數字人應用到業務場景中。虛擬數字人能夠打破時空限制、實現降本增效、提高服務體驗,有望進一步助力金融機構數字化轉型、提升運營效率。
以興業小知為例,與此前諸多的虛擬數字人不同,小知是興業證券攜手火山引擎打造的業內首款以自有員工為原型、集「播報 服務」於一體的全真數字分身。作為智慧主播,數智服務官小知將在優理寶App、興業證券App以及興業其他新媒體平台為用戶解讀股市行情、播報市場資訊。
興業證券首位數智服務官小知
整體來看,小知不僅從外形上深度還原了興業證券明星投顧的形象,更重要的是其口唇形、微表情與動作也都達到了較高的仿真度與自然度。作為火山引擎金融虛擬數字人解決方案的技術提供方,火山語音通過使用行業領先的非自回歸模型的唇形生成網路,合成與輸入文本或語音完全匹配的唇形,準確率高達98.55%;基於創新的Motion Graph技術,數字人可以輕鬆做到毫秒級動作切換延遲且自然無感知。
值得一提的是,數智服務官小知在火山語音領先的端到端語音合成技術加持下,還具有開心、驚訝、憤怒等豐富的情感演繹能力,還可通過控制音色的重音、停頓等,賦予多樣的語氣,實現笑聲、哭腔等非語言現象建模能力,貼近真人的同時為用戶提供更有溫度的服務。可以說,小知是興業證券在數智化轉型的一次重要探索和實踐。
據了解,在火山語音的「AI虛擬員工解決方案」支持下,火山引擎已建立了包括2D、3D卡通和3D超寫實在內的虛擬數字人產品矩陣;從場景適配出發,包括「播報型數字人」和「交互型數字人」兩種類型。其中播報型數字人,即輸入文本或語音,就可生成自然生動的數字人播報影片;交互數字人作為播報型數字人的形態升級,依託於火山語音長期積累的成熟語音交互技術,可以做到「善聽」、「會說」、「能想」,與用戶面對面實時交互。
數字人產品矩陣
交互數字人集成了全雙工語音交互鏈路,前向兼容語音以及文本輸入,後向兼容2D與3D數字人表現力,整體端到端交互延遲在500ms左右,性能效果達到業內領先水平。
多模態交互數字人技術環路
目前該方案已經具備標準平台的快速交付能力,面向金融、大消費、泛互等行業提供涵蓋「金融客服」、「智慧導覽」、「智能助理」、「虛擬直播」等場景細分解決方案,為用戶帶來全新的互動服務和便捷體驗。2022年6月,火山引擎虛擬人數字平台已獲得信通院首批數字人系統基礎能力認證。
在數字化浪潮之下,各行各業的虛擬數字人「大戰」已蓄勢待發。此次興業證券推出的虛擬數字人便是打響了新年「第一槍」。在火山引擎等科技公司的加持下,讓這場沒有硝煙的「戰爭」變得更加精彩。面對這一片新藍海,最終誰將脫穎而出,誰又將「笑到最後」,需等待時間檢驗。