OpenAI即時AI語音API Realtime降價最高80%

OpenAI昨（30）日宣布可提供即時擬真AI語音的Realtime API降價，部分服務降價最高80%，並添加5種聲音選擇。

贊助商廣告

10月初公布預覽版的Realtime API提供原生語音輸入、語音輸出的人聲生成，中間無需文本轉換，讓開發人員得以打造支持多模態能力的AI聊天機器人。目前支持文本、語音的輸出、輸入，也支持函數調用。Realtime API可讓開發商創造的AI聊天機器人和用戶流暢對答就像真人。OpenAI Realtime原有5種人聲，今天再增加5種新選擇，強調提供AI助理更豐富表現力。

本周OpenAI還進一步降價Realtime API中緩存文本輸入（cached text input）費用50%，緩存聲音輸入（cached audio input）更降價80%。緩存輸入是Realtime API的一部分，可將提示中重複使用輸入的字詞緩存起來，可加速對談過程中的提示處理速度、降低延遲性，而且節省API使用成本，不過只有輸入1024字詞以上的提示才適用緩存。

根據OpenAI的定價，使用緩存的Realtime API費用是未緩存的50%，詳細價格則依訪問的模型版本而異，降價前的價格從GPT-4o-mini的$0.075/百萬字詞，到o1-preview的$7.50/百萬字詞。