Tháng 09, 2019
Thứ hai
Thứ Ba, ngày 08/10/2019 11:42 AM (GMT+7)

Nghiên cứu tiếng Việt vì người Việt

Thực hiện các nghiên cứu tiên phong về trí tuệ nhân tạo gắn với tiếng Việt, phục vụ người Việt, phòng thí nghiệm trí tuệ nhân tạo (AILab - ĐH QG TP.HCM) luôn kiên trì với sứ mệnh duy nhất đó.

“Hút” sinh viên ứng dụng công nghệ AI sáng tạo

Tham gia AILab từ những năm sinh viên, Huỳnh Hanh Thông, hiện là kỹ sư phần mềm Công ty KMS Technology, cùng tham gia nhóm nghiên cứu dự án “trang web tìm kiếm Gia sư trực tuyến” (Vnu Tutor). Đây là “đứa con tinh thần” trẻ nhất vừa mới ra mắt của AILab. Vnu Tutor ra đời nhằm hỗ trợ sinh viên tìm việc dạy thêm, hoàn toàn miễn phí. Đồng thời, dự án này cũng giúp các phụ huynh có thể tìm được các gia sư chất lượng từ chính nguồn sinh viên của trường ĐH QG TP.HCM.

Nghiên cứu tiếng Việt vì người Việt - 1

Nhóm nghiên cứu dự án “trang web tìm kiếm Gia sư trực tuyến” tại AILab. Ảnh Thiên An.

Với vai trò là mentor (người hướng dẫn) cho nhóm nghiên cứu Vnu Tutor, Huỳnh Hanh Thông cho biết: “Có rất nhiều trung tâm về gia sư, nhưng vấn đề ở chỗ là họ đều tính phí đối với sinh viên, thấp nhất là 10% cho đến 30% lương tháng đầu tiên. Nói chung sinh viên rất khó khăn. Do đó, trang web dành cho sinh viên đăng ký, phụ huynh liên kết trực tiếp với gia sư dễ hơn. Trong giai đoạn đầu, trang web không tính phí cho mọi người. Trong tương lai, dự kiến sẽ tính phí ở phía phụ huynh chứ không liên quan đến sinh viên ”.

Trang web Gia sư trực tuyến chỉ là một trong rất nhiều dự án, đề tài mà các nhóm nghiên cứu tại AILab đang thực hiện. AILab cũng đang tập trung nghiên cứu về lĩnh vực xử lý tiếng nói, với hai hướng nghiên cứu chính: Text-to-Speech (chuyển văn bản thành tiếng nói) và Speech-to-Text (chuyển đổi giọng nói thành văn bản).

Trong quá trình nghiên cứu hơn 10 năm qua, nhóm nghiên cứu đã cho ra nhiều phiên bản khác nhau, với nhiều ứng dụng khác nhau.

Đỗ Trí Nhân, sinh viên năm 2 ngành công nghệ thông tin, tham gia nghiên cứu về hệ thống chuyển đổi Text-to-Speech chia sẻ thêm, riêng mảng tiếng Việt, vấn đề về xử lý âm thanh, văn bản tiếng Việt vẫn còn hạn chế, vì vậy nhóm tập trung nghiên cứu vấn đề này để tương lai ứng dụng cho người Việt nhiều hơn.

“Ở mảng nghiên cứu chuyển đổi văn bản thành giọng nói, quy mô ứng dụng của nó vào trong các doanh nghiệp như máy tự động của xe buýt chẳng hạn. Nhiệm vụ của nhóm mình là làm cho giọng nói trở nên thân thuộc với người Việt của mình hơn, giống thật hơn, để ứng dụng vào thực tế nhiều hơn”, Đỗ Trí Nhân chia sẻ.

Còn sinh viên Nguyễn Thụ Hồng Ân, ngành công nghệ thông tin cho hay, những kiến thức chuyên sâu về trí tuệ nhân tạo đã thu hút em đến với AILab.

Hồng Ân cho biết: “Hiện Trí tuệ nhân tạo là ngành học bắt buộc, ở lớp hướng đi theo về lĩnh vực Trí tuệ nhân tạo nên em cũng biết sơ trước khi tham gia ở Phòng Thí nghiệm. Em tham gia vào AILab nhờ một sinh viên khóa trên giới thiệu. Lúc mới vào, em cũng không nghĩ là sẽ được học về trí tuệ nhân tạo chuyên sâu đến như vậy, khi vào thì em học được thêm nhiều kiến thức lĩnh vực khác”.

Xây dựng bộ dữ liệu tiếng việt

Đặc biệt, AILab đang triển khai VNVoice, dự án hướng đến xây dựng bộ dữ liệu tiếng việt, giúp mọi người tiếp cận được công nghệ nhận dạng giọng nói. Đây là dự án chung tay cùng cộng đồng trong cuộc cách mạng khoa học kỹ thuật 4.0

VNVoice cũng là dự án tâm huyết mà Phó Giáo sư Tiến sĩ Vũ Hải Quân, Phó Giám đốc Đại học Quốc gia thành phố Hồ Chí Minh, đồng thời là Trưởng phòng Phòng thí nghiệm Trí tuệ nhân tạo này, đã theo đuổi trong suốt sự nghiệp nghiên cứu khoa học của mình.

Nghiên cứu tiếng Việt vì người Việt - 2

Phó Giáo sư Vũ Hải Quân đang trao đổi với các nhóm nghiên cứu tại AILab.

Chia sẻ về dự án VNVoice, Phó Giáo sư Tiến sĩ Vũ Hải Quân cho hay, nghiên cứu về trí tuệ nhân tạo nói chung, nhất là trong lĩnh vực xử lý tiếng nói phải cần nhiều dữ liệu. Như vậy, mấu chốt chính là làm sao để có thể có nhiều dữ liệu phục vụ cho nghiên cứu về trí tuệ nhân tạo, cụ thể là xử lý tiếng nói. Vì vậy, AILab đã xây dựng Dự án tạo ra 1.000 giờ nói tiếng Việt cho hầu hết các vùng miền ở Việt Nam, để phục vụ cho việc nghiên cứu về nhận dạng và tổng hợp tiếng nói:

Phó Giáo sư Vũ Hải Quân cho hay: “VNVoice là một dự án để cho cộng đồng đóng góp tiếng nói, ai cũng có thể vào để đóng góp được. Có hai hình thức: hình thức miễn phí, ai cũng có thể vào và đọc câu có sẵn trên màn hình hoặc sửa câu đó. Hình thức thứ hai, tiến hành cho toàn bộ sinh viên ở Ký túc xá Đại học Quốc gia thành phố Hồ Chí Minh. Cụ thể, các em đọc khoảng 200 câu, sẽ trả cho các em qua điện thoại phí là 50.000 đồng. Chúng tôi hy vọng, với khoảng 30.000 sinh viên ở ký túc xá, nếu có khoảng vài nghìn sinh viên tham gia vào dự án thì sẽ có được một lượng dữ liệu rất quý, các giọng đều là đối tượng trẻ và đến từ nhiều vùng miền khác nhau”.

Phó Giáo sư Vũ Hải Quân cho biết thêm, một trong những phương pháp tiếp cận mới nhất, đó là dựa trên phương pháp học sâu – Deep Learning. Để làm được phương pháp này, cần có nhiều tiếng nói. Để có được nhiều tiếng nói,  chính nhờ Dự án VNVoice hy vọng sẽ thu thập được 1.000 giờ cho đến cuối năm nay để thực hiện mục tiêu này.

AILab có thể được xem là phòng thí nghiệm về trí tuệ nhân tạo đầu tiên ở phía Nam. Phó Giáo sư Tiến sĩ Vũ Hải Quân, Phó Giám đốc Đại học Quốc gia thành phố Hồ Chí Minh, đồng thời là Trưởng phòng Phòng thí nghiệm Trí tuệ nhân tạo.

Thời điểm năm 2007, khi Phó Giáo sư Tiến sĩ Vũ Hải Quân mới về nước. Ông là người bắt tay viết dự án xin đầu tư Phòng thí nghiệm trí tuệ nhân tạo, dự án được Đại học Quốc gia thành phố Hồ Chí Minh phê duyệt, cấp kinh phí gần 7 tỷ đồng.

Hiện AILab đã đạt được một số kết quả nghiên cứu tiêu biểu như: Hệ thống tổng hợp tiếng nói phương nam (VOS), hệ thống trả lời điện thoại tự động bằng giọng nói (Vis) đã được thương mại hóa và chuyển giao công nghệ…Phòng thí nghiệm AILab cũng thành lập ra Câu lạc bộ Robotics-IoT. Hàng năm, Câu lạc bộ này đều mở các lớp robot và lập trình sáng tạo dành cho học sinh, sinh viên để các em bước đầu làm quen với trí tuệ nhân tạo một cách dễ nhất. Thông qua các chương trình học như: kỹ sư nhí WEDO (lắp ráp, lập trình Robot LEGO); Kỹ sư nhí SCRATCH (lập trình tư duy trên máy vi tính); Lập trình Python căn bản (ngôn ngữ lập trình phổ biến hiện nay) và Lập trình sáng tạo Arduino (lập trình điều khiển thiết bị thông minh).

Thiên An

Tin đọc nhiều

Tốt nghiệp ĐH Ngoại thương, 9X 'rẽ lối' khởi nghiệp với 'nhà thuốc' công nghệ 4.0 Bắt tay khởi nghiệp ở một lĩnh vực còn khá mới mẻ ở Việt...
Quay màn hình trên Windows 10 mà không cần phần mềm Nếu đang sử dụng Windows 10, bạn có thể tận dụng nhanh thanh...
Khắc phục lỗi không thể download các tập tin trên mạng Nếu bạn gặp hiện tượng khi nhấn vào liên kết để tải về một...
3 sáng kiến cho người khuyết tật sử dụng AI được chọn dự cuộc thi quốc tế Microsoft Việt Nam vừa công bố chọn 3 sáng kiến xuất sắc sử...