Google AI 開発者リレーション責任者のLogan Kilpatrickは、4月15日にGemini 3.1 Flash TTSの提供開始を発表しました。これはGoogleの最新のテキスト読み上げ(TTS)モデルです。このモデルは70種類の言語、シーンディレクション(場面指示)、話者レベルのきめ細かな制御、音声タグに対応しており、現在Google AI Studioの音声プレイグラウンドおよびGemini APIで利用可能になっています。
4つのコア機能
Gemini 3.1 Flash TTSは、先代と比べて4つの顕著なアップグレードがあります:
シーンディレクション(Scene Direction)— 音声の状況を設定できます。たとえば「騒がしいカフェで小声で話す」や「わくわくしながら良い知らせを告げる」です。モデルは場面に応じてイントネーション、話速、感情を調整します
話者レベルの制御(Speaker-Level Specificity)— 複数の登場人物による対話では、各キャラクターに異なる声の特徴を設定できます
音声タグ(Audio Tags)— テキストに音響効果の指示を挿入して、間(ポーズ)、語気の変化などの細部を制御できます
70種類の言語対応 — 多言語のカバー範囲を大幅に拡張し、中国語を含みます
より自然で、表現力のある声
Googleは、このモデルの音声の自然さにおける進歩を強調しています。従来のTTSモデルの出力はしばしば「AIっぽく聞こえる」と批判されてきました。Gemini 3.1 Flash TTSは、より豊かな韻律の変化と感情表現によって、人間の音声との差を縮めようとしています。Kilpatrickは、Gemini 2.5から3.1への進歩は「非常に目覚ましい」と述べています。
開発者はどう使うか
開発者は次の2つの方法で利用できます:
Google AI Studio 音声プレイグラウンド — Webのインターフェースで直接テストし、音声効果をプレビュー
Gemini API — アプリケーションに統合して、音声アシスタント、オーディオブック、Podcastの自動生成、多言語カスタマーサポートなどのシーンで活用
Geminiの製品ラインは継続して拡張中
Flash TTSは、Gemini 3.1シリーズの直近の集中的なリリースの一環です。これまでGoogleは、Gemini Robotics ER 1.6(ロボットのビジョン推論)、Tab Tab Tab(Vibe Coding promptの補完)、およびデザインプレビューなどの機能を提供してきました。Googleは、Geminiを「チャットモデル」から、テキスト、音声、視覚、ロボットを含む全モーダルのAIプラットフォームへと拡張しています。
この記事「GoogleがGemini 3.1 Flash TTSをリリース:70種類の言語とシーンディレクションに対応、より自然なAI音声」は最初に 鏈新聞 ABMedia に掲載されました。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
Judge Dismisses Fraud Claims in Elon Musk's OpenAI Lawsuit; Case Advances to Trial with Two Remaining Allegations
Gate News message, April 24 — A federal judge has dismissed fraud claims from Elon Musk's lawsuit against OpenAI, Sam Altman, Greg Brockman, and Microsoft, clearing the way for the case to proceed to trial on two remaining allegations: breach of charitable trust and unjust enrichment. U.S.
GateNews1時間前
OpenAI CEOのサム・アルトマン、学校銃撃犯の出禁アカウントを警察に通報できなかったことについて謝罪
Gate Newsメッセージ、4月25日 — OpenAIの最高経営責任者(CEO)サム・アルトマンは、カナダのタンボリン・コミュニティに対し、同社がジェシー・ヴァン・ルートセラールに関連する出禁アカウントについて警察に通報できなかったことを謝罪した。ルートセラールは2月に学校で8人を殺害し、その後自ら命を絶っていた。OpenAI
GateNews2時間前
UAEは今後2年間でAI政府モデルへの移行を発表
モハメド・ビン・ラシッド・アル・マクトゥーム殿下は、目標は政府の分野の50%を自律的なエージェント型AIを通じて運用することだと述べました。移行には「AIをマスターする」ための連邦職員の訓練も含まれ、シェイク・マンスール・ビン・ザイードが監督します。
要点:
Coinpedia2時間前
Ethereal Venturesが主導する資金調達でFere AIが$1.3Mを調達:AI取引プラットフォーム
Gate Newsメッセージ、4月25日 — Globenewswireによると、AIを活用したデジタル資産取引プラットフォームであるFere AIは、Ethereal Venturesが主導した資金調達ラウンド($1.3 million)の完了を発表した。Galaxy Vision HillおよびKosmos Venturesが参加した。
このプラットフォームは
GateNews3時間前
GoogleはAnthropicに400億ドルを追加投資:まず100億ドルを前払いし、業績に応じて300億ドルを放出。5GWのTPU計算リソースも配分
アルファベットがAnthropicに400億ドルまで追加投資、2段階で実施:最初の100億ドルを現金として注入、評価額3,800億ドル;残りの300億ドルは業績目標達成後に段階的に放出。Google Cloudは5年以内に5GWのTPU計算リソースを提供;同時期にAmazonも最大250億ドルの投資を発表しており、Anthropicの計算能力と資本支援が歩調を合わせて強化されていることを示している。
ChainNewsAbmedia3時間前
SpaceX、OpenAI、AnthropicのIPOは$240 Billion超を集める可能性があり、暗号資産市場の流動性に影響を与えるかもしれない
ゲートニュース・メッセージ、4月25日――市場レポートによると、SpaceXは6月に上場する見通しで、資金調達目標はサウジアラムコの記録的$29 billionのIPOを上回る一方、OpenAIとAnthropicは2026年後半に上場を計画している。3社は
GateNews4時間前