Giải pháp tiên phong và nhân văn
Là một trong những sản phẩm tham gia Giải thưởng Nhân tài Đất Việt 2018 khá muộn, nhưng Giải pháp ứng dụng công nghệ trí tuệ nhân tạo chuyển đổi văn bản tiếng Việt sang giọng nói tự nhiên Vbee (Vietnamese text to speech – Vbee TTS) đã tạo được ấn tượng với Ban giám khảo với nhiều chuyên gia hàng đầu trong lĩnh vực để giành được đồng giải Nhì – giải cao nhất của hạng mục CNTT của giải thưởng uy tín này.
Trong hồ sơ giới thiệu sản phẩm, Vbee TTS được giới thiệu với vài dòng ngắn ngủi, rằng đây là giải pháp giọng nói nhân tạo tiếng Việt có cảm xúc đầu tiên được công bố rộng rãi tại thị trường Việt Nam. Sử dụng giải pháp Vbee TTS cho phép cộng đồng xây dựng nội dung số bằng tiếng nói một cách tự động, nhanh và tiết kiệm. Bởi thế, khi nhắc giải pháp Vbee TTS, không ít người nghĩ: “À biết rồi, đây là giải pháp nhân văn, giúp cộng đồng người khuyết tật tiếp cận được với thông tin như người bình thường”.
“Hỗ trợ người khiếm thị có thể tiếp cận thông tin tốt hơn” rõ ràng là mong muốn đầu tiên mà Nguyễn Thị Thu Trang – đồng sáng lập Vbee – khi bắt tay vào nghiên cứu giải pháp chuyển văn bản tiếng Việt thành giọng nói. Được nghiên cứu khoảng vài chục năm trước, đặc biệt phát triển mạnh trong 10-15 năm gần đây, công nghệ này đã phát triển gần như hoàn thiện ở nước ngoài, đặc biệt tại các nước sử dụng tiếng Anh. Khi ứng dụng vào cuộc sống, công nghệ này mang lại lợi ích lớn cho cộng đồng người khuyết tật, như người khiếm thị, những người mất khả năng đọc, mất khả năng nói hoặc diễn đạt.
Chị Nguyễn Thị Thu Trang chia sẻ: “Mô hình text to speech đã được nghiên cứu và phổ biến trên thế giới nhiều năm, được áp dụng rộng rãi trong các dịch vụ như tổng đài tư vấn, tương tác khách hàng, nhà thông minh, giao thông thông minh... Thế nhưng, Vbee lại là công nghệ đầu tiên phát triển ở Việt Nam dành cho ngôn ngữ tiếng Việt. Bởi đặc thù ngôn ngữ của chúng ta nhiều thanh, vần điệu, vùng miền… phức tạp nên khó áp dụng hơn rất nhiều và đây thực sự là bước ngoặt trong dịch vụ công nghệ áp dụng giọng nói nhân tạo cho thị trường Việt Nam”.
Mong muốn có một giọng nói nhân tạo có cảm xúc và đồng điệu như giọng nói của con người Việt là điểm khác biệt mà đội ngũ Vbee để tâm. Ví dụ, về giọng đọc, nhóm mất khá nhiều thời gian để tạo ra giọng có ngữ điệu thu hút và gần gũi nhất với người dùng, khác với ngôn ngữ máy đọc thông thường là đều đều, không tự nhiên mà Google hay Microsoft đang hỗ trợ cho tiếng Việt.
Chị Nguyễn Thị Thu Trang – đồng sáng lập Vbee |
Chính thức ra mắt thị trường vào tháng 1/2018 sau hơn 12 năm ấp ủ và dày công nghiên cứu, không chỉ đơn giản dừng lại ở việc phát âm thanh, Vbee còn nghiên cứu và ra mắt các giọng nói theo vùng miền Bắc Trung Nam. Điều đặc biệt mà Vbee sở hữu là khả năng học một giọng nói bất kỳ trong vòng 4 giờ đồng hồ.
Công nghệ phục vụ con người
Sau thời gian cung cấp sản phẩm với khách hàng phục vụ chủ yếu là người khiếm thị để tiếp cận thông tin một cách dễ dàng hơn, những người sáng lập của Vbee nhanh chóng nhận thấy nhu cầu sử dụng giọng đọc nhân tạo ngày một lớn ở nhiều lĩnh vực trên thị trường. “Khi triển khai các ứng dụng, chúng tôi phát hiện rằng, công nghệ này còn có thể ứng dụng rộng rãi hơn, ở nhiều lĩnh vực trong tương lai” – chị Thu Trang chia sẻ.
Do đó, Vbee được đóng gói và cung cấp trong các dịch vụ hoàn chỉnh cho thị trường Việt Nam. Với các giải pháp Nhà thông minh cho phép con người có thể “giao tiếp” với thiết bị bằng giọng nói của chính mình, giải pháp trợ lý ảo tổng đài thông minh cho phép các tổng đài thay thế các tổng đài viên để chăm sóc khách hàng 24/7 và nhiều các giải pháp cho lĩnh vực nội dung trên nền tảng trí tuệ nhân tạo như lồng tiếng phim tự động, sách nói, báo nói…
Một trong những ứng dụng sử dụng Vbee TTS được nhiều người biết là ứng dụng Vadi - “trợ lý ảo” lái xe với tính năng báo nói và giao thông thông minh. Vadi là ứng dụng báo nói đầu tiên sử dụng giọng nói trí tuệ nhân tạo tại Việt Nam. Với Vadi, người dùng sẽ được trải nghiệm các tính năng tương tác giọng nói của chính mình và phần mềm thay thế cho các phím bấm như các dịch vụ truyền thống hiện tại. Ứng dụng hiện có khoản 22.000 người dùng, và nhóm nghiên cứu đã hoàn thiện tính năng điều khiển bằng giọng nói cho Vadi, giúp thuận tiện trong sử dụng, đặc biệt khi đang lái xe.
Anh Hồ Minh Đức - đồng sáng lập Vbee - cho hay, thị trường áp dụng Vbee thực sự đang rất tiềm năng ở Việt Nam, phù hợp với xu thế chuyển đổi số mà cả đất nước chúng ta đang chuyển đổi. Vbee có mặt ở mọi lĩnh vực như Nhà thông minh, giao thông thông minh, y tế, tổng đài thông minh và các lĩnh vực giáo dục dựa trên nền tảng tiếng Việt nhân tạo.
Anh Hồ Minh Đức – đồng sáng lập Vbee |
“Chúng tôi mong muốn đóng góp các giải pháp sử dụng giọng nói trí tuệ nhân tạo của Vbee để đưa ra thị trường, giúp các doanh nghiệp và người sử dụng có thêm những giải pháp mới phục vụ khách hàng tốt hơn và tiết kiệm chi phí hơn” – anh Hồ Minh Đức cho biết.
Báo nói và việc tạo những trào lưu mới
Ai đã từng “nghe thử” báo nói, sách nói Vbee, sẽ thấy sản phẩm này rất thân thiện. Tính năng lõi tổng hợp tiếng nói tiếng Việt cho phép chuyển đổi tự động từ văn bản thành tiếng nói tiếng Việt tự nhiên theo ngữ cảnh, đặc trưng vùng miền… Giải pháp này còn “biết” dự đoán cách đọc từ nước ngoài có trong văn bản tiếng Việt, với cách đọc từ nước ngoài theo kiểu Việt Nam, nên khá dễ hiểu, gần gũi với người Việt.
Không những thế, hỗ trợ SSML (Speech Synthesis Markup Language) cho phép tuỳ biến cách đọc, thay đổi ngữ điệu, tốc độ, ngắt nghỉ và các tham số tiếng nói khác cho âm thanh đầu ra, với giọng đọc nam nữ đa dạng vùng miền. Điều đặc biệt, sau 12 năm nghiên cứu Vbee đã thành công với khả năng tự học và “nói” được chính giọng nói của bất kỳ ai với hơn 4 tiếng thu âm của giọng chính người đó.
Riêng trong lĩnh vực báo chí, sự tham gia của Vbee đã đánh dấu một trào lưu báo chí trong Cách mạng công nghiệp (CMCN) 4.0 – đó là báo nói, ứng dụng trí tuệ nhân tạo để đọc báo cho độc giả. Phát triển mạnh mẽ như ảnh hưởng của công nghệ trong các ngõ ngách đời sống, trào lưu mới này đang tác động đến từng cơ quan báo chí, tác động đến thói quen nghe-đọc báo của độc giả và tác động vào thị hiếu của một lớp người trẻ.
“Là công ty khởi nghiệp về công nghệ, cùng đội ngũ sáng tạo không ngừng để cho ra những sản phẩm của người Việt, phù hợp với nhu cầu người Việt, Vbee cho rằng chúng tôi có cơ hội tạo dấu ấn trong đời sống và sẽ thuyết phục được người dùng” – anh Hồ Minh Đức nói.
Với niềm đam mê, trí tuệ, khát vọng và sự sáng tạo, chắc rằng Vbee và ứng dụng trí tuệ nhân tạo chuyển văn bản thành ngôn ngữ nói chắc chắn sẽ còn tạo ra những trào lưu mới, bắt công nghệ phục vụ cuộc sống và mở ra những đổi thay không tưởng trong bối cảnh CMCN 4.0.