Với mong muốn thiết kế một chiếc kính có thể hỗ trợ người khiếm thị dễ dàng trong việc đọc văn bản (thông qua nhận diện chữ viết và chuyển thành âm thanh cho người đeo), hai bạn học sinh trường THPT Lê Hồng Phong, TPHCM đã xuất sắc giải quyết trở ngại đọc của người khiếm thị với độ chính xác đến 89%.
Minh Khôi và Phương Thảo (áo xanh) vinh dự nhận giải Nhất toàn quốc cho dự án nghiên cứu của mình từ tay ông Phan Văn Đa (giữa)- Phó chủ tịch UBND tỉnh Lâm Đồng
Đề tài nghiên cứu khoa học (Kính hỗ trợ đọc văn bản dành cho người khiếm thị ) vừa đạt giải Nhất cuộc thi khoa học kỹ thuật cấp Quốc gia học sinh trung học khu vực phía Nam của Nguyễn Hoàng Minh Khôi và Vũ Phương Thảo (lớp 12) đã gây ấn tượng mạnh mẽ cho Ban giám khảo.
Từ ý tưởng nhân văn
Chia sẻ về ý tưởng khiến hai đứa quyết tâm thực hiện bằng được chiếc kính, Phương Thảo cho biết: ý tưởng đến với hai bạn hết sức tình cờ.
Trong những lần tham gia các hoạt động xã hội, thiện nguyện hay đến giao lưu với các bạn đồng trang lứa tại trường Phổ thông đặc biệt Nguyễn Đình Chiểu nhận thấy sự khó khăn của các bạn nơi đây trong việc tiếp cận văn bản, sách báo hai bạn đã nảy sinh ý nghĩ: Sao không biến những chiếc kính các bạn đang đeo (để che khiếm khuyết) thành công cụ hỗ trợ đọc.
Nghĩ là làm, cả hai bắt tay vào việc tìm hiểu và phác thảo ý tưởng của mình. Ban đầu là xây dựng phần mềm, các cảm biến ánh sáng và mô hình nhận dạng hình ảnh trên các ký tự tiếng Việt. Kế tiếp là kết hợp các trị số môi trường, camera thu nhận hình ảnh…
“ Chiếc kính sự kết hợp hoàn hảo giữa công nghệ cảm biến, nhận diện hình ảnh và phân tích cơ sở dữ liệu thành âm thanh. Quy trình hoạt động của kính bắt đầu bằng các cảm biến ánh sáng và khoảng cách thu nhận các trị số môi trường để hỗ trợ hình ảnh tốt nhất.
Sau đó, camera thu nhận hình ảnh văn bản chuyển về điện thoại để phân tích, nhận diện chữ viết với Google Vision kết hợp với Tasseract (kỹ thuật giúp nhận dạng các ký tự trên một bức ảnh), từ đó phát ra âm đọc cho người khiếm thị”- Phương Thảo cho biết.
Thảo chia sẻ thêm, điểm nổi bật của dự án là hai bạn đã nghiên cứu và xây dựng được mô hình nhận dạng hình ảnh trên các ký tự Tiếng Việt, xử lý và khử nhiễu trên nền tảng ngôn ngữ và lập trình. Nhờ đó, các ký tự được nhận diện chính xác hơn, trên nhiều loại văn bản hơn. Nhóm cũng đã ứng dụng các công nghệ 4.0 như máy học và mạng nơ ron nhân tạo để huấn luyện cơ sở dữ liệu ký tự tiếng Việt nhằm cải thiện độ chính xác. Các dữ liệu này cũng được cập nhật liên tục.
Với hàng chục buổi thử nghiệm, cuối cùng hai bạn trẻ đã nhận được phản hồi khá tốt từ những người khiếm thị khi độ chính xác được đo lường khoảng 89%.
Minh Khôi và Phương Thảo với dự án nghiên cứu của mình tại cuộc thi Khoa học kỹ thuật cấp quốc gia cho học sinh trung học khu vực phía Nam
Đến tính thực tế cao
Thực tế, tính hữu ích của dự án “Kính hỗ trợ đọc văn bản cho người khiếm thị” không cần các con số cũng cho thấy khả năng ứng dụng và chuyển giao của dự án là rất cao. Trước khi thực hiện nghiên cứu khoa học của mình, Phương Thảo và Minh Khôi cũng đã tỉ mẩn tìm tòi, dẫn ra khảo sát của Quỹ dân số Liên Hợp Quốc tại Việt Nam như một luận cứ khoa học cho thấy công trình của mình.
Khảo sát cho biết, 19% người khiếm thị xem đọc là một sở thích mới, trong khi 81% còn lại cho rằng đây là sở thích thường xuyên bởi họ có nhiều thời gian. Còn theo Bộ Y tế, tính đến năm 2014, Việt Nam có hơn 3 triệu người mù và khiếm thị. Trong đó, tỉ lệ người có nhu cầu đọc sách và tiếp cận ngôn ngữ viết là rất lớn.
“Chiếc kính vẫn còn nhiều hạn chế như: chưa gọn, nặng, các linh kiện tốn diện tích và tỏa nhiệt gây khó chịu. Các thuật toán của phần mềm chưa tối ưu, phần mềm chỉ chạy được trên hệ điều hành Android nên phải sử dụng điện thoại. Điều này rất bất tiện cho người mù.
Hiện chúng em vẫn tiếp tục nghiên cứu để cải thiện bộ nhận diện, mở rộng thêm nhiều loại ngôn ngữ khác và hướng tới nhận diện cả chữ viết tay, khi nào chiếc kính thật hoàn thiện mới nghĩ đến việc chuyển giao.”- Phương Thảo đánh giá về sản phẩm của mình.
Anh Tú
https://baomoi.com/hoc-sinh-che-tao-kinh-biet-doc-cho-nguoi-khiem-thi/c/25506205.epi