Nhu cầu nghe sách của độc giả ngày càng gia tăng, thôi thúc các công ty tìm đến giọng đọc AI - phương thức tạo ra thành phẩm nhanh và rẻ hơn. Cụ thể, vào tháng 5, Audible, nền tảng sách nói của Amazon, cho phép tác giả và nhà xuất bản chọn hơn 100 giọng AI dẫn truyện bằng ngôn ngữ như tiếng Anh, Tây Ban Nha, Pháp và Italy. Trước đó, Spotify thông báo chấp nhận sách nói AI để giúp người sáng tác giảm thiểu khó khăn, thu hút nhiều bạn đọc trên đa dạng kênh.
Theo Audible, dùng giọng đọc ảo là để bổ sung, không phải thay thế con người. Tại Mỹ, nhằm nâng cao chất lượng audiobook, nền tảng này cũng thử nghiệm tạo ra bản sao giọng nói của những nghệ sĩ trong ngành thu âm.
Hannah Kent, nhà văn Australia kiện Meta vì sử dụng trái phép tác phẩm có bản quyền để huấn luyện hệ thống AI, nêu lên tò mò về bước tiến của Audible. Bà thừa nhận phản ứng ban đầu với việc đưa AI vào không gian sáng tạo là "từ chối và phẫn nộ". Nhưng giờ đây, bà mong chờ kế hoạch triển khai cho AI dịch, đọc văn bản bằng các thứ tiếng.

Thính giả trải nghiệm sách nói tại đường sách Tết Ất Tỵ (TP HCM). Ảnh:Quỳnh Trần
Tuy nhiên, xu hướng trên gây ra mối lo ngại về vấn đề thất nghiệp. Trong bản đệ trình lên Ủy ban Quốc hội năm 2024, Hiệp hội Diễn viên lồng tiếng Australia (Australian Association of Voice Actors) cho biết 5.000 suất việc làm trong ngành diễn xuất bằng giọng nói tại quốc gia này bị đe dọa. Ông Simon Kennedy, Chủ tịch hiệp hội, nhấn mạnh, "luôn có cuộc chiến về mức lương mà một người dẫn truyện xứng đáng được nhận ở Australia".
Ngoài ra, nhiều nghệ sĩ đặt câu hỏi về tính minh bạch và chất lượng của giọng đọc AI. Annabelle Tudo, người đã thu âm 48 cuốn sách, chưa tin AI làm tốt công việc này. Bởi, cô cho rằng, giọng nói tiết lộ cảm xúc, điều có thể kết nối người đọc và thính giả. Mặt khác, theo cô, có những cảm xúc, âm thanh trong nhiều tình huống như "cảnh sinh nở" mà AI không thể bắt chước được.
Dorje Swallow, giọng đọc chính của các tiểu thuyết tội phạm ăn khách do nhà văn người Australia Chris Hammer sáng tác, tin rằng, việc để AI dẫn truyện là phương pháp được tạo ra bởi những người "không hiểu giá trị, kỹ thuật và kỹ năng" cần thiết về lĩnh vực audiobook. Anh nói: "Chúng tôi đã phải nỗ lực rất nhiều để có được vị trí hiện tại và nếu bạn nghĩ rằng chỉ cần nhấn một nút là sẽ có được thứ gì đó với chất lượng tương tự hoặc đủ tốt, thì thật là nực cười".
Ông Simon Kennedy, nhận xét thông báo của Audible là "động thái khá ngu ngốc". Về cơ hội nhân bản giọng nói của các nghệ sĩ thu âm, ông cho rằng họ có quyền tham gia, nhưng không nên mong đợi mức lương tương đương và phải chấp nhận nguy cơ biến mất thương hiệu, "trở thành giọng robot được sản xuất hàng loạt mà người nghe sẽ nhanh chóng phát ngán".
Ngoài ra, chuyên gia đồng thời nhắc đến sự thiếu hụt các quy định về AI tại Australia: "Không có luật ngăn chặn việc khai thác và sử dụng hợp lý dữ liệu, giọng nói nhân bản khi thiếu đi sự đồng thuận của tác giả hoặc sản xuất các video giả mạo (deepfake); luật ghi nhãn, đánh dấu định danh (watermarking) đối với nội dung do AI tạo ra; luật yêu cầu sự minh bạch trong quá trình huấn luyện AI", ông Simon Kennedy nói.
Khánh Linh (theo The Guardian)