Theo theo dõi Beating, xAI ra mắt thư viện âm thanh và giọng nói tùy chỉnh Grok, người dùng có thể ghi âm âm thanh trên bảng điều khiển để tạo voice_id, kết nối với API TTS hoặc đại lý giọng nói của Grok, dùng cho các tình huống như dịch vụ khách hàng, sáng tạo nội dung. Để tránh sao chép, cần đọc xác thực câu ngắn, hệ thống sẽ chuyển đổi và so sánh đặc điểm nói chuyện theo thời gian thực, xác nhận cùng một người trước khi tạo ra giọng nói. Hiện chỉ mở tại Mỹ, trừ Illinois. Bảng điều khiển có thể tạo tối đa 30 giọng nói tùy chỉnh miễn phí, API chỉ dành cho doanh nghiệp. Giọng nói tùy chỉnh không tính phí bổ sung, nhưng gọi API tính phí theo lượng: 3 USD/giờ theo thời gian thực, 4,2 USD/triệu ký tự cho TTS.

BlockBeatNews

2026-05-02 06:51:16

Đang tạo bản tóm tắt

Theo giám sát Beating, xAI đã ra mắt Grok Custom Voices và Voice Library.
Người dùng có thể ghi lại một đoạn âm thanh trên bảng điều khiển xAI, tạo ra voice_id của riêng mình, sau đó tích hợp vào API Grok TTS hoặc Voice Agent, dùng cho các kịch bản như tổng đài viên, sáng tạo nội dung, nhân vật trò chơi, thuyết minh sách nói, v.v.

Chức năng này không đơn giản chỉ tải lên âm thanh để sao chép.
Người dùng cần đọc to câu xác thực, hệ thống sẽ sử dụng STT để chuyển đổi thành văn bản theo thời gian thực, và so sánh đặc điểm giọng nói của bản ghi xác thực và bản ghi đầy đủ, xác nhận là cùng một người trước khi tạo ra giọng nói.
xAI cho biết, cách này có thể ngăn chặn việc sao chép giọng nói của người khác bằng các bản ghi sẵn có.

Hiện tại, Custom Voices chỉ mở tại Mỹ, trừ bang Illinois.
Bảng điều khiển tối đa có thể tạo miễn phí 30 giọng nói tùy chỉnh, khả năng tạo qua API chỉ dành cho đội ngũ Doanh nghiệp.
Giọng nói tùy chỉnh không tính phí riêng, nhưng việc gọi API giọng nói vẫn tính theo lượng: Realtime là 3,00 USD/giờ, Text to Speech là 4,20 USD trên triệu ký tự.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
485.09K Phổ biến
#
USSeeksStrategicBitcoinReserve
58.72M Phổ biến
#
IsraelStrikesIranBTCPlunges
37.69K Phổ biến
#
BitcoinETFOptionLimitQuadruples
1M Phổ biến
#
#FedHoldsRateButDividesDeepen
32.11K Phổ biến

Ghim

sơ đồ trang web

Grok ra mắt chức năng sao chép giọng nói: ghi âm một phút, có thể tạo ra giọng AI của riêng bạn

Chủ đề thịnh hành

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Ghim