Nhận dạng chữ viết tay là một lĩnh vực ngày càng quan trọng giúp chuyển đổi tài liệu viết tay sang dạng số hóa, tăng cường năng suất và hiệu quả làm việc. Đặc biệt đối với tiếng Việt, ngôn ngữ có sự đa dạng, sự độc đáo về ngữ nghĩa, ngữ cảnh và cách viết tay khác nhau ở mỗi người. Từ đó, việc nhận dạng chữ viết tay thông qua ứng dụng công nghệ được chú trọng phát triển nhằm mang lại nhiều lợi ích đáng kể cho lĩnh vực này.
SỰ CẦN THIẾT CỦA ỨNG DỤNG NHẬN DIỆN CHỮ VIẾT TAY
Các trích xuất và xử lý thông tin trên giấy tờ là bài toán nan giải đối với nhiều doanh nghiệp và khó khăn hơn đối với những ngành có khối lượng giấy tờ khổng lồ phải giải quyết mỗi ngày. Tưởng chừng đó là việc đơn giản nhưng chiếm khá nhiều thời gian thực hiện. Bên cạnh đó, còn tạo gánh nặng bởi chi phí cao và những sai sót trong quá trình nhập dữ liệu thủ công truyền thống có thể gây ra các rắc rối không đáng về sau cho doanh nghiệp.
Hiểu được điều này, nhóm học viên Võ Khánh Linh – Phạm Cao Sang – Trần Nguyễn Thảo Nguyên – Trần Ngọc Anh lớp DT2106L & DT2111L đã thực hiện đồ án “Vietnamese Handwriting Recognition By Line”. Đồ án này là minh chứng cho việc tận dụng tối đa lợi thế của ngành CNTT vào lĩnh vực nhận dạng chữ viết tay ứng dụng công nghệ từ các học viên Aptech D5 Bình Thạnh – Aptech Nguyễn Kiệm. Từ đó, đóng góp quan trọng vào việc phát triển hiệu quả công nghệ chữ viết tay và linh hoạt trong môi trường ngôn ngữ đa dạng và phức tạp như tiếng Việt..
TÍNH ỨNG DỤNG CỦA VIỆC NHẬN DIỆN CHỮ VIẾT TAY
Trong tiếng Việt, vấn đề nhận dạng chữ viết trở nên thách thức do sự đa dạng về kiểu chữ, phong cách viết và sự biến đổi trong cùng một từ khi được viết bởi nhiều người khác nhau. Ứng dụng “Vietnamese Handwriting Recognition By Line” xác định các từ, ký tự viết bằng tay ở cấp độ theo dòng. Bên cạnh đó, còn xác định cả cấu trúc hình ảnh và ngữ cảnh ngôn ngữ để chuyển đổi các hình ảnh chứa văn bản viết tay thành thông tin chính xác, có ý nghĩa.
Về khía cạnh kỹ thuật, “Vietnamese Handwriting Recognition By Line” ứng dụng công nghệ OCR (Optical Character Recognition – Nhận dạng ký tự quang học), kết hợp đồng thời hai lĩnh vực quan trọng trong AI là Xử lý ảnh (Computer Vision) và Xử lý Ngôn ngữ tự nhiên (NLP). Bộ dữ liệu sử dụng trong ứng dụng này được thu thập từ hai bộ dữ liệu của Cinnamon AI và TUAT Nakagawa Lab.
Ứng dụng sử dụng một khung nhận diện dựa trên mô hình học máy (Machine Learning) để chuyển đổi hình ảnh về văn bản có thể xử lý được, bao gồm hai công đoạn chính là phát hiện văn bản và nhận dạng văn bản.
Ngoài ra, nhóm còn ứng dụng mô hình Transformer vào việc bổ sung và suy luận ngữ nghĩa cho các từ ngữ nhận dạng không đầy đủ để đảm bảo độ chính xác và đầy đủ ngữ nghĩa của các chuỗi văn bản nhận dạng được.
Bằng các kỹ thuật trên, ứng dụng được sử dụng để số hóa các tài liệu viết tay, tự động hóa quá trình nhập liệu từ các biểu mẫu viết tay giúp người dùng và doanh nghiệp dễ dàng lưu trữ thông tin, tiết kiệm thời gian và chi phí. Ngoài ra còn để tìm kiếm dữ liệu trong các tài liệu viết tay, giúp dễ dàng truy cập thông tin cần thiết.
Theo đánh giá của Hội đồng phản phản biện, đồ án “Vietnamese Handwriting Recognition By Line” được đánh giá cao bởi tính ứng dụng vào lĩnh vực nhận diện chữ viết tay cho các doanh nghiệp để tự động hóa quy trình nhập liệu nhanh chóng và chính xác. Được sự hướng dẫn tận tình của thầy Trần Hữu Nhân, Aptech hy vọng đồ án này sẽ ngày càng phát triển và được ứng dụng rộng rãi hơn trong tương lai.
TẠM KẾT
Công nghệ nhận dạng chữ viết tay là một bước đột phá đáng chú ý trong lĩnh vực số hóa dữ liệu để tự động hóa các trích xuất dữ liệu phức tạp. Đồ án “Vietnamese Handwriting Recognition By Line” không chỉ mở ra cánh cửa cho việc cải thiện hiệu suất làm việc, thấu hiểu về đặc trưng ngôn ngữ và văn hóa trong chữ viết tiếng Việt mà còn thấy được tiềm năng vô hạn của CNTT có thể ứng dụng vào đa lĩnh vực, đa ngành nghề.
Buổi bảo vệ đồ án học kỳ 03 trong chương trình đào tạo Khoa học dữ liệu & Trí tuệ nhân tạo (Data Science & AI/Machine Learning) tại Aptech đã kết thúc rất thành công. Đồ án của các bạn học viên Aptech được hoàn thành chỉn chu và có tính ứng dụng cao. Điều này khẳng định chất lượng đào tạo của Aptech ngày càng hoàn thiện từng ngày để các học viên được học và trải nghiệm thực tế các dự án lập trình chất lượng. Nếu bạn đam mê công nghệ và muốn đóng góp vào phát triển của xã hội, các chuyên ngành Công nghệ phần mềm (Lập trình viên) và Khoa học dữ liệu & Trí tuệ nhân tạo (Data Science & AI/Machine Learning) tại Aptech là lựa chọn thích hợp dành cho bạn. Hãy tham gia cùng Aptech để khám phá, sáng tạo và phát triển thế giới bằng CNTT nhé.
Có mặt tại Việt Nam từ năm 1999, Aptech đã và đang đào tạo biết bao thế hệ Lập trình viên tài năng cho ngành CNTT tại Việt Nam. Aptech là địa chỉ học tập uy tín cho các bạn trẻ Việt Nam, từ các bạn học sinh THPT, sinh viên cho đến người đi làm ở tất cả các ngành. Với phương pháp đào tạo từ cơ bản đến nâng cao, Aptech hiện đang đào tạo 2 chuyên ngành chính là Công nghệ phần mềm và Khoa học dữ liệu – Trí tuệ nhân tạo. Sau khi tốt nghiệp, các bạn có thể tự tin làm việc tại nhiều vị trí như: Kỹ sư Lập trình Web – App – Game – Software, chuyên viên Phân Tích Dữ liệu (Data Analyst), chuyên gia Khoa học dữ liệu (Data Scientist),… Nhân dịp kỷ niệm 25 năm Aptech phát triển tại Việt Nam, chúng tôi mang đến những học bổng đặc biệt cho sinh viên khóa 2k6 khi bạn nhập học tại Aptech. Bằng việc lựa chọn nhập học sớm tại Aptech ngay bây giờ, bạn và gia đình không chỉ đang đưa ra một quyết định đúng đắn cho tương lai của mình trong lĩnh vực CNTT, mà còn cơ hội nhận một loạt các học bổng hữu ích. Xem thông tin chi tiết về chương trình tuyển sinh CNTT của Aptech tại đây: Chuyên ngành Công nghệ phần mềm: https://aptechvietnam.com.vn/laptrinhsunghiep/ Chuyên ngành Khoa học máy tính: https://aptechvietnam.com.vn/khoahocdatascience-ai/ |