OpenAI昨(30)日宣布可提供即時擬真AI語音的Realtime API降價,部分服務降價最高80%,並添加5種聲音選擇。
10月初公布預覽版的Realtime API提供原生語音輸入、語音輸出的人聲生成,中間無需文本轉換,讓開發人員得以打造支持多模態能力的AI聊天機器人。目前支持文本、語音的輸出、輸入,也支持函數調用。Realtime API可讓開發商創造的AI聊天機器人和用戶流暢對答就像真人。OpenAI Realtime原有5種人聲,今天再增加5種新選擇,強調提供AI助理更豐富表現力。
本周OpenAI還進一步降價Realtime API中緩存文本輸入(cached text input)費用50%,緩存聲音輸入(cached audio input)更降價80%。緩存輸入是Realtime API的一部分,可將提示中重複使用輸入的字詞緩存起來,可加速對談過程中的提示處理速度、降低延遲性,而且節省API使用成本,不過只有輸入1024字詞以上的提示才適用緩存。
根據OpenAI的定價,使用緩存的Realtime API費用是未緩存的50%,詳細價格則依訪問的模型版本而異,降價前的價格從GPT-4o-mini的$0.075/百萬字詞,到o1-preview的$7.50/百萬字詞。