Grok ra mắt chức năng sao chép giọng nói: ghi âm một phút, có thể tạo ra giọng AI của riêng bạn

robot
Đang tạo bản tóm tắt

Theo giám sát Beating, xAI đã ra mắt Grok Custom Voices và Voice Library.
Người dùng có thể ghi lại một đoạn âm thanh trên bảng điều khiển xAI, tạo ra voice_id của riêng mình, sau đó tích hợp vào API Grok TTS hoặc Voice Agent, dùng cho các kịch bản như tổng đài viên, sáng tạo nội dung, nhân vật trò chơi, thuyết minh sách nói, v.v.

Chức năng này không đơn giản chỉ tải lên âm thanh để sao chép.
Người dùng cần đọc to câu xác thực, hệ thống sẽ sử dụng STT để chuyển đổi thành văn bản theo thời gian thực, và so sánh đặc điểm giọng nói của bản ghi xác thực và bản ghi đầy đủ, xác nhận là cùng một người trước khi tạo ra giọng nói.
xAI cho biết, cách này có thể ngăn chặn việc sao chép giọng nói của người khác bằng các bản ghi sẵn có.

Hiện tại, Custom Voices chỉ mở tại Mỹ, trừ bang Illinois.
Bảng điều khiển tối đa có thể tạo miễn phí 30 giọng nói tùy chỉnh, khả năng tạo qua API chỉ dành cho đội ngũ Doanh nghiệp.
Giọng nói tùy chỉnh không tính phí riêng, nhưng việc gọi API giọng nói vẫn tính theo lượng: Realtime là 3,00 USD/giờ, Text to Speech là 4,20 USD trên triệu ký tự.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim