Grokが音声クローンをリリース:1分間の録音で自分だけのAI声線を作成

robot
概要作成中

币界网消息,Grok推出声音克隆功能,用户只需录制一分钟的声音即可生成自己的AI声线。
この機能により、ユーザーはxaiコントロールパネルで声を録音し、voice_idを生成し、GrokのTTSまたはvoice agent APIに接続できます。
カスタマーサポート、コンテンツ制作、ゲームキャラクター、オーディオブックのナレーションなどのシーンに適しています。
ユーザーは検証用の短いフレーズを朗読し、システムはSTTを使ってリアルタイムで書き起こし、録音の特徴と比較します。
話者を確認した後に声線を生成し、他人の声をクローンするのを防ぎます。
現在、custom voices機能はアメリカのみで利用可能で、イリノイ州を除きます。
コントロールパネルでは最大30のカスタム声を無料で作成でき、APIによる作成機能は企業チームのみ利用可能です。
カスタム声は追加料金なしで利用できますが、音声APIの呼び出しは従量制です。
リアルタイムは$3.00/時間、テキストから音声への変換は$4.20/百万文字です。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし