Sebastien Rousseau

OPENVOICE

OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói

Tổng hợp giọng nói tức thì từ một mẫu vài giây

4 min read
Banner for: OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói

Nhân bản giọng nói AI.class="img-fluid clearfix"

TL;DR. OpenVoice là một hệ thống nhân bản giọng nói mã nguồn mở của MyShell có khả năng sao chép giọng nói của một người từ chỉ một mẫu vài giây và tổng hợp lời nói mới với giọng đó.

Điểm chính

  • Ý tưởng. Học các đặc điểm giọng nói (timbre, ngữ điệu) một cách độc lập, cho phép kiểm soát chính xác.
  • Đổi mới. Hỗ trợ đa ngôn ngữ và kiểm soát cảm xúc trong giọng nói tổng hợp.
  • Trường hợp sử dụng. Hỗ trợ tiếp cận, lồng tiếng, sách nói, hỗ trợ khách hàng.
  • Rủi ro. Deepfake giọng nói, lừa đảo, vi phạm bản quyền nghệ sĩ.

Bối cảnh

Sự ra đời của nhân bản giọng nói

Cho đến gần đây, nhân bản giọng nói chất lượng yêu cầu hàng giờ ghi âm và tính toán mạnh mẽ. OpenVoice (và các sản phẩm tương tự như ElevenLabs) đã giảm điều này xuống còn vài giây và một laptop.

Kiến trúc

Học đặc điểm tách rời

OpenVoice tách giọng nói thành các thành phần:

Mỗi thành phần có thể được kiểm soát độc lập, cho phép tổng hợp một câu mới với giọng của Alice, ngữ điệu vui vẻ và bằng tiếng Việt.

Trường hợp sử dụng

Hỗ trợ tiếp cận

Doanh nghiệp

Vấn đề đạo đức

Rủi ro

Phòng vệ

Tác động với ngân hàng

Phòng chống lừa đảo

Các ngân hàng phải nâng cấp xác minh giọng nói. Mật khẩu giọng nói tĩnh không còn an toàn — kẻ tấn công có thể tổng hợp chúng. Các phương pháp tiếp cận mới:

Kết luận

OpenVoice là một bước nhảy vọt công nghệ với những hậu quả đạo đức sâu sắc. Đối với các ứng dụng hợp pháp (hỗ trợ tiếp cận, sách nói), đó là một phước lành. Đối với các ứng dụng độc hại (lừa đảo, tin giả), nó tăng cường các mối đe doạ hiện có. Các ngân hàng phải lên kế hoạch cho cả hai.

Cập nhật lần cuối .

Đăng lại bài viết này

Sao chép định dạng cho Medium

# OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau

> Originally published at [https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/](https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/)

OpenVoice của MyShell mở khoá việc nhân bản giọng nói chất lượng cao từ một mẫu ngắn. Cách nó hoạt động, các trường hợp sử dụng và các vấn đề đạo đức.

Read the full article on sebastienrousseau.com: https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/

Sao chép định dạng cho Mastodon

OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau

OpenVoice của MyShell mở khoá việc nhân bản giọng nói chất lượng cao từ một mẫu ngắn. Cách nó hoạt động, các trường hợp sử dụng và các vấn đề đạo đức.

https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/
Trích dẫn bài này

OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau

OpenVoice của MyShell mở khoá việc nhân bản giọng nói chất lượng cao từ một mẫu ngắn. Cách nó hoạt động, các trường hợp sử dụng và các vấn đề đạo đức.

BibTeX

@online{rousseau2024openvoice,
  author  = {Rousseau, Sebastien},
  title   = {{OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau}},
  year    = {2024},
  url     = {https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/},
  urldate = {2024}
}

RIS

TY  - GEN
AU  - Rousseau, Sebastien
TI  - OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau
PY  - 2024
UR  - https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/
ER  -

Vancouver

Rousseau S. OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau. sebastienrousseau.com. 2024 Apr 1. Available from: https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/

Chicago

Rousseau, Sebastien. "OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau." sebastienrousseau.com. April 1, 2024. https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/.

APA

Rousseau, S. (2024, April 1). OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau. sebastienrousseau.com. https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/

Đăng lại bài này

OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau

OpenVoice của MyShell mở khoá việc nhân bản giọng nói chất lượng cao từ một mẫu ngắn. Cách nó hoạt động, các trường hợp sử dụng và các vấn đề đạo đức.

Bài viết này được cấp phép theo Creative Commons Attribution 4.0 International. Đăng lại yêu cầu ghi nguồn đến URL chính tắc.

OpenVoice: đổi mới hàng đầu trong công nghệ nhân bản giọng nói — Sebastien Rousseau

OpenVoice của MyShell mở khoá việc nhân bản giọng nói chất lượng cao từ một mẫu ngắn. Cách nó hoạt động, các trường hợp sử dụng và các vấn đề đạo đức.

Originally published at https://sebastienrousseau.com/vi/2024-04-01-openvoice-doi-moi-hang-dau-trong-nhan-ban-giong-noi/ by Sebastien Rousseau.
Licensed under CC-BY-4.0.