AutoIt - Share UDF
Bạn có muốn phản ứng với tin nhắn này? Vui lòng đăng ký diễn đàn trong một vài cú nhấp chuột hoặc đăng nhập để tiếp tục.

UDF libTesseract - Nhận dạng ký tự (Ocr) mạnh mẽ dựa vào thư viện libTesseract.dll

Go down

UDF libTesseract - Nhận dạng ký tự (Ocr) mạnh mẽ dựa vào thư viện libTesseract.dll Empty UDF libTesseract - Nhận dạng ký tự (Ocr) mạnh mẽ dựa vào thư viện libTesseract.dll

Bài gửi by Admin Wed Nov 18, 2020 12:13 am

Mô tả
- Nhận dạng lý tự thông qua Tesseract.exe thì hẳn đã quen thuộc với người dùng AutoIt nhưng tính năng của nó khá hạn chế cũng như muốn ocr thì ảnh phải năm trong ổ cứng.
- Khi bạn cài đặt Tesseract thì ngoài Tesseract.exe, bộ cài đã bao gồm bộ thư viện rất mạnh là libTesseract.dll và Leptonica.dll/libLept.dll (Leptonica là bộ thư viện xử lý ảnh hỗ trợ cho libTesseract), vậy tại sao ta không tận dụng bộ thư viện này để thực hiện ocr khi nó cung cấp những tính năng mà Tesseract.exe không có được, ocr ảnh từ buffer nhớ mà không cần phải có/lưu ảnh từ ổ cứng...
- UDF libTesseract.au3 giúp tương tác với thư viện libTesseract với những tính năng cơ bản đã được viết hoàn chỉnh, bạn có thể đọc tài liệu về libTesseract và Leptonica để phát triển tiếp cho bộ thư viện.
     + Tài liệu api Leptonica: https://metacpan.org/release/Image-Leptonica
     + Tài liệu api libTesseract: http://tess4j.sourceforge.net/docs/docs-1.5/net/sourceforge/tess4j/TessAPI.html


Sử dụng
  + Các hàm chính của UDF: 
       Tess_InstallDir(...): Nếu script nằm cùng thư mục với tesseract.exe (nói đơn giản là thư mục cài Tesseract) thì không cần khai báo Tess_InstallDir, nhưng nếu chúng nằm khác thư mục thì phải khai báo Tess_InstallDir
       Tess_NewSession(...): Tạo phiên ocr mới
       Tess_ChangeLanguage(...): Thay đổi ngôn ngữ ocr
       Tess_SetRectangle(...): Giới hạn phạm vi ocr ảnh, ví dụ ảnh dài 300, cao 300, nhưng mình chỉ muốn ocr ảnh ở vị trí left=0, top=0, dài=300, cao=150 thì sử dụng hàm này
       Tess_Recognize(...): Thực hiện ocr ảnh, đầu vào có thể là 1 tệp ảnh trên ổ cứng hoặc Binary Data của ảnh (request trên mạng về hoặc từ quá trình xử lý ảnh GDI+) hoặc một URL
       Tess_SetVar(...): Cài đặt variables cho ocr. Chi tiết tìm kiếm google từ khoá TessBaseAPISetVariable. Tổng hợp tất cả các variables nằm trong tệp tin "variables list.txt"
       Tess_ClearSession(...): Xoá cài đặt Language, OEM, variables... và giải phóng bộ nhớ đã sử dụng cho phiên ocr đã tạo

  + UDF đã bao gồm thư viện Tesseract 4.0 được build bởi nhà phát triển cppan, dành cho những ai chưa cài Tesseract có thể test nhanh.

  + UDF tương thích với Tesseract 3.0+. Tổng hợp tất cả các bản Tesseract: https://digi.bib.uni-mannheim.de/tesseract/


Tải về:
http://bblink.com/AutoIt-libTesseractOCR


UDF libTesseract - Nhận dạng ký tự (Ocr) mạnh mẽ dựa vào thư viện libTesseract.dll Ft23Sdc

UDF libTesseract - Nhận dạng ký tự (Ocr) mạnh mẽ dựa vào thư viện libTesseract.dll PZlxwKp
Admin
Admin
Admin

Tổng số bài gửi : 6
Join date : 12/11/2020

Xem lý lịch thành viên https://autoit-udf.forumvi.com

Về Đầu Trang Go down

Về Đầu Trang


 
Permissions in this forum:
Bạn không có quyền trả lời bài viết