Công nghệ nhận dạng ký tự quang học (OCR) vừa có một bước tiến mới với ứng dụng Textract.

Trí tuệ nhân tạo chẩn đoán bệnh Alzheimer tốt hơn bác sĩ

TQ tuyển thanh thiếu niên phát triển vũ khí trí tuệ nhân tạo

Trí tuệ nhân tạo giúp nhà làm phim tìm đối tượng khán giả phù hợp

OCR là một thuật ngữ khá quen thuộc được viết tắt từ cụm từ Optical Character Recognitio, tạm dịch là nhận dạng ký tự bằng quang học. Đây là công nghệ được áp dụng để “đọc” nội dung trên một file ảnh thành định dạng văn bản số.

Từ trước đến nay, công nghệ này có khá nhiều hạn chế dù đã xuất hiện từ rất lâu như:

  - Phần lớn phần mềm sử dụng OCR chỉ nhận dạng được khoảng 80 - 90% trên hình ảnh rõ nét.
  - Đối với những hình ảnh có màu nền mà màu chữ không có nhiều chênh lệch, hay các hình chụp chữ viết tay thì kết quả nhận dạng không khả quan cho lắm.
  - Đến thời điểm hiện tại thì OCR chưa thể hỗ trợ tất cả các ngôn ngữ.
Chính vì những giới hạn này, nhiều công ty vẫn buộc phải sử dụng nhân viên để nhập nhiều loại dữ liệu vào máy tính. Tuy nhiên, vấn đề có thể được giải quyết trong tương lai gần với phần mềm Amazon Textract.

Theo Giám đốc điều hành của AWS là Andy Jassy thì công nghệ OCR từ lâu đã trở nên rất lạc hậu do không có nhiều cải tiến. Ông hy vọng Textract sẽ thay đổi điều đó. Công cụ được tích hợp trí tuệ nhân tạo vào công cụ quét giúp nhận diện được nhiều tài liệu khác nhau.

Nếu như trước đây phần lớn các công cụ quét OCR đề trả về kết quả là những đoạn văn bản đơn thuần cho dù chúng quét qua các bảng biểu, danh sách,... thì Textract có thể hiểu được. Kết quả là Textract có thể quét và đưa ra rất nhiều biểu mẫu theo đúng định dạng. Nó được thiết kế để nhận biết các thành phần của trang như bảng và kéo dữ liệu theo cách hợp lý nhất.

 
Amazon đưa AI vào công nghệ nhận dạng ký tự quang học
Amazon đem AI đến với công nghệ nhận dạng ký tự quang học

Textract cũng đủ thông minh để hiểu các loại dữ liệu phổ biến như số an sinh xã hội, ngày tháng năm sinh và địa chỉ, và “diễn giải” chúng một cách chính xác cho dù chúng nằm ở đâu trên trang được quét.

Hiện tại Textract chỉ mới được giới thiệu thử nghiệm và chỉ hoạt động tốt trên phiên bản tiếng Anh. Nhóm nghiên cứu vẫn đang đưa vào nhiều dữ liệu để máy tự phân tích và rút kinh nghiệm, giúp kết quả quét ra ngày càng tốt hơn. Tuy nhiên có thể thấy những gì Textract làm được tốt hơn nhiều so với các công cụ OCR quét văn bản đơn điệu.

An Nhiên(Theo TechCrunch)