BIỂU MẪU-TÀI LIỆU

ÁP DỤNG GIẢI PHÁP NHẬN DẠNG KÝ TỰ QUANG HỌC (OCR) TRONG BIÊN MỤC TÀI LIỆU LƯU TRỮ

ÁP DỤNG GIẢI PHÁP NHẬN DẠNG KÝ TỰ QUANG HỌC (OCR) TRONG BIÊN MỤC TÀI LIỆU LƯU TRỮ

ÁP DỤNG OCR TRONG BIÊN MỤC TÀI LIỆU LƯU TRỮ.png

I. OCR là gì?

OCR:nhận dạng ký tự quang học (Optical Character Recognition). Đây là ứng dụng công nghệ OCR chuyên dùng để đọc text ở file ảnh. Được biết đến là một công cụ scan kỹ thuật số chuyên nhận dạng các ký tự, chữ viết tay, hay chữ đánh máy. Công nghệ này chuyên dùng để truyền tải, nhập liệu dữ liệu. Đặc biệt, ở OCR có khả năng kỹ thuật số nhiều dưới nhiều dạng tài liệu khác nhau: hóa đơn, hộ chiếu, danh thiếp, tài liệu…

II. Cách thức hoạt động của nhận dạng ký tự quang học OCR

Với OCR khi 1 trang in hay viết tay được quét sẽ được lưu dưới định dạng tệp dưới dạng TIF. Bạn có thể dễ dàng đọc hình ảnh này dưới màn hình hiển thị. Tuy nhiên, tùy thuộc vào máy tính, nó sẽ tồn tại một loạt hình ảnh có chấm trắng hoặc chấm đen. Lúc này, công nghệ nhìn vào từng dòng của hình ảnh để xác định các dấu có khớp nhau hay không.

III. Ứng dụng thực tiễn của công nghệ nhận dạng ký tự quang học OCR

Untitled design (1).png

  1. Hỗ trợ cuộc sống của người già, người khiếm thị

Vào những năm 1970, công ty Kurzweil Computer Products Inc của Mỹ đã cho ra đời hệ thống phông chữ Omni đầu tiên trên thế giới. Phần mềm OCR có khả năng nhận dạng phông chữ này. Ngay lập tức, công nghệ OCR đã được tích hợp với công nghệ tổng hợp giọng nói (giọng máy). Giúp máy có khả năng đọc hiểu văn bản.

Nói cách khác, văn bản không chỉ được phần mềm nhận dạng ký tự quang học OCR giải mã, mà còn được công cụ tổng hợp giọng nói đọc ra thành tiếng. Giọng nói vi tính hóa đã được ứng dụng vào việc đọc văn bản. Giúp người cao tuổi, khiếm thính đọc sách, báo làm cuộc sống của họ trở nên nhẹ nhàng hơn.

  1. Sắp xếp tài liệu trong các công ty luật và toà án

Đặc thù ngành nghề, mỗi luật sư hay tòa án phải thụ lý rất nhiều giấy tờ, hồ sơ. Để dễ dàng cho công tác quản lý, tìm kiếm và sắp sếp hồ sơ, công nghệ OCR giúp các luật sư không bỏ sót bất kỳ giấy tờ, chi tiết nào. Nhất là những thông tin quan trọng cần lưu trữ qua nhiều năm.

Khi cần, họ dễ dàng truy cập, tìm kiếm theo các từ khóa, ngày tháng, tên tệp…

  1. Bảo tồn các văn bản có giá trị

Tại các bảo tàng, thư viện cổ hay các trung tâm văn hóa lịch sử, cần lưu trữ rất nhiều tài liệu, hồi ý, bản thảo… Các tài liệu này rất dễ bị mối mọt theo thời gian. Quá trình lưu trữ cần rất nhiều thời gian, công sức và không hề đơn giản.

Việc sắp xếp, lưu trữ hoặc tìm kiếm thủ công với lượng văn bản giấy khổng lồ là vô cùng vất vả và tốn nhiều nhân lực thực hiện.

Tuy nhiên, công nghệ nhận dạng ký tự quang học OCR ra đời đã giúp nhiều tổ chức giải quyết bài toán đó một cách đơn giản hơn. Các văn bản, tài liệu quan trọng được chuyển đổi từ dạng giấy sang file mềm. Giúp việc lưu trữ và bảo tồn nhiều di sản văn học trở nên dễ dàng hơn.

  1. Nhận dạng cá nhân

Với phần mềm nhận dạng ký tự quang học OCR, các tài liệu pháp lí như CMND, hộ chiếu, bằng lái xe và nhiều loại giấy tờ khác đều có thể được quét nhanh chóng. Hỗ trợ các văn phòng công chứng, phòng cảnh sát, sân bay và nhiều tổ chức, dịch vụ cần xử lí thông tin cá nhân. Giảm thiểu thời gian nhập liệu.

Hơn thế nữa, việc nhận dạng và trích xuất thông tin bằng máy giúp các cơ quan, đơn vị, tổ chức dễ dàng lưu trữ thông tin. Có thể truy xuất thông tin người dùng bất cứ lúc nào.

  1. Xử lí hóa đơn và nhiều loại chứng từ

Tất cả các cơ quan, tổ chức đều có hàng nghìn các loại giấy tờ, tài liệu, với nhiều định dạng khác nhau. Như các văn bản in/viết tay trên giấy, file PDF, JPG… Các nhân viên khó có thể nhập tất cả các dữ liệu đó vào hệ thống. Hoặc phải tốn rất nhiều thời gian để xử lí khối lượng giấy tờ không hồi kết đó. Hơn thế, xác suất sai sót trong nhập liệu khá lớn.

Nhiều cơ quan, tổ chức chọn giải pháp chuyển đổi các hợp đồng, hóa đơn, chứng từ... thành văn bản kĩ thuật số. Tiện sử dụng dữ liệu đó cho các báo cáo tài chính, lưu trữ hay trao đổi tài liệu. Và phần mềm OCR là sự lựa chọn tuyệt vời.

Hiện nay, hơn 60% các công ty lớn trên toàn thế giới đã sử dụng OCR. Họ dùng để nhập dữ liệu cho nhiều bước trong quy trình hoạt động của doanh nghiệp. Công nghệ nhận dạng ký tự quang học OCR cho phép các công ty tự động lưu trữ dữ liệu vào hệ thống. Dễ dàng tích hợp, chuyển đổi hay liên kết đến một nền tảng khác; như qua email, fax hoặc EDI truyền thống.

IV. Những hạn chế của công nghệ OCR

Bên cạnh những lợi ích to lớn mà OCR mang lại, tuy nhiên chỉ đạt được hiệu quả đối với các file có chất lượng tốt. Đặc biệt với tiếng Việt – loại hình ngôn ngữ có “dấu” (sắc, huyền, hỏi, ngã, nặng). Các giải pháp OCR hiện tại bộc lộ rất nhiều hạn chế, cụ thể:

  1. Việc nhận dạng dấu trong tiếng Việt đạt hiệu quả thấp. Khi ứng dụng thường bị đảo vị trí hoặc nhận sai.
  2. Các văn bản tiếng Việt thường rất đa dạng về ký tự, chữ đánh máy, viết tay, số, tiếng Việt lẫn ngoại ngữ,… Hoặc trên cùng văn bản tồn tại nhiều font chữ. Nhiều kiểu định dạng khác nhau, khiến các phần mền khó xử lý hoặc nhận dạng lỗi.
  3. Các loại hình văn bản hành chính thường có con dấu, chữ ký, chữ ký nháy,… Đặt ra yêu câu phải khoanh vùng nhận diện, xử lý bóc tách thông tin. Đây là thách thức đối với các giải pháp OCR.
  4. Một hạn chế rất lớn mà OCR hiện nay gặp phải là thiếu tính năng rút trích thông tin (IE) từ văn bản, biểu mẫu. Hầu hết các phần mềm mới chỉ dừng lại việc nhận dạng toàn văn. Không thể rút trích thông tin theo các mẫu/định dạng, các trường theo nhu cầu của người sử dụng.
  5. Với những hình ảnh truy cập có màu nền và màu chữ khá tương đồng (không có sự chênh lệch lớn) điều này khiến OCR gặp khó khăn trong nhận dạng.
  6. Công nghệ nhận dạng ký tự quang học OCR lại chưa thể đáp ứng đa ngôn ngữ 

Nguồn: Sưu tầm

Bài viết liên quan: