币界网消息,Grok推出声音克隆功能,用户只需录制一分钟的声音即可生成自己的AI声线。 この機能により、ユーザーはxaiコントロールパネルで声を録音し、voice\_idを生成し、GrokのTTSまたはvoice agent APIに接続できます。 カスタマーサポート、コンテンツ制作、ゲームキャラクター、オーディオブックのナレーションなどのシーンに適しています。 ユーザーは検証用の短いフレーズを朗読し、システムはSTTを使ってリアルタイムで書き起こし、録音の特徴と比較します。 話者を確認した後に声線を生成し、他人の声をクローンするのを防ぎます。 現在、custom voices機能はアメリカのみで利用可能で、イリノイ州を除きます。 コントロールパネルでは最大30のカスタム声を無料で作成でき、APIによる作成機能は企業チームのみ利用可能です。 カスタム声は追加料金なしで利用できますが、音声APIの呼び出しは従量制です。 リアルタイムは$3.00/時間、テキストから音声への変換は$4.20/百万文字です。
Grokが音声クローンをリリース:1分間の録音で自分だけのAI声線を作成
币界网消息,Grok推出声音克隆功能,用户只需录制一分钟的声音即可生成自己的AI声线。
この機能により、ユーザーはxaiコントロールパネルで声を録音し、voice_idを生成し、GrokのTTSまたはvoice agent APIに接続できます。
カスタマーサポート、コンテンツ制作、ゲームキャラクター、オーディオブックのナレーションなどのシーンに適しています。
ユーザーは検証用の短いフレーズを朗読し、システムはSTTを使ってリアルタイムで書き起こし、録音の特徴と比較します。
話者を確認した後に声線を生成し、他人の声をクローンするのを防ぎます。
現在、custom voices機能はアメリカのみで利用可能で、イリノイ州を除きます。
コントロールパネルでは最大30のカスタム声を無料で作成でき、APIによる作成機能は企業チームのみ利用可能です。
カスタム声は追加料金なしで利用できますが、音声APIの呼び出しは従量制です。
リアルタイムは$3.00/時間、テキストから音声への変換は$4.20/百万文字です。