Saturday, December 29, 2012

Một số phần mềm hỗ trợ tạo Box file cho Trainning trong Tesseract!



Phần mềm liên quan đến tạo file Box chuẩn bị cho training trong Tesseract
Mục tiêu là từ 1 file ảnh, ta tạo ra 1 file *.box có nhiều dòng, mỗi dòng có dạng:
耡 0 164 25 196
Trong đó, ký tự đầu tiên là chữ cái hay mã ký tự nào đó trong file ảnh, 4 số sau tương ứng là 4 giá trị định vị hình chữ nhật chữa ký tự đó.
Như vậy, về mặt lý thuyết ta phải tự làm thủ công việc này để đảm bảo độ chính xác cho dữ liệu huấn luyện, nhưng rất may đã có một số công cụ hỗ trợ việc này. Ngay trong Tesseract, có dòng lệnh để tạo ra file Box từ ảnh nhưng độ chính xác không cao, chúng ta cần hiệu chỉnh lại bằng tay. Để hỗ trợ có thêm 2 phần mềm: qt-box-editor  và owlboxer-1.02 (http://owlboxer.googlecode.com/files/owlboxer-1.02.exe).
qt-box-editor cung cấp khả năng tạo ra file Box từ ảnh, tiến hành nhận dạng, có chức năng nối và tách 2 vùng liền kề, tạo box mới,sửa ký tự cho đúng mã… nhưng việc điều chỉnh các Box cho sát với ký tự thì nó ít hỗ trợ, nó cho phép điều chỉnh số nên gây khó khăn, chậm và thiếu chính xác.
Bổ sung cho những thiếu sót đó, owlboxer-1.02 có khả năng hiệu chỉnh kết quả khá hiệu quả với 1 hệ thống các phím tắt.



Khi cài đặt có thể báo thiếu file mingwm10.dll, ta download bổ sung từ http://www.dll-files.com/mingwm10.zip?0WHiUHaFfP, sau đó giải nén đưa vào thư mục system hoặc system32 sau đó chạy bình thường!


Related Posts:

  • Tại sao bài báo khoa học bị từ chối?Năm 2009, các nhà khoa học VN chỉ công bố được khoảng 960 bài báo khoa học trên các tập san quốc tế. Con số này cực kì khiêm tốn khi so với các nước trong vùng. Đằng sau con số này là hàng trăm bài báo bị các tập san từ chối … Read More
  • Các lỗ hổng trên phần mềm nhúngTheo http://electronicdesign.com/, trên phần mềm nhúng có các lỗ hổng sau: Loại 1 gồm - Chèn mã kiểu SQL Injection - Lỗ hổng định dạng kiểu Format-String Vulnerabilities Loại 2 Lộ thông tin thông qua Normal Cha… Read More
  • [Kỹ năng cơ bản] Tạo Blog cá nhân bằng Blogspot Bạn muốn làm 1 trang Blog để chia sẻ những cảm nghĩ về cuộc sống hoặc những câu chuyện đời của bạn. Hoặc bạn muốn chia sẽ những kiến thức của mình vào 1 nơi nào đó trên Internet như trang Blog tacchienmang.blogspot.com c… Read More
  • [kỹ năng cơ bản] Tạo tài khoản Facebook Facebook hiện nay là mạng xã hội số 1 trên thế giới cũng như ở Việt Nam. Sức ảnh hưởng của Facebook hiện rõ trong cuộc sống thường nhật với các xu hướng ăn Facebook, ngủ Facebook… Bạn đã có tài… Read More
  • Các công nghệ đảm bảo an toàn phần mềm 1. Address Space Layout Randomization (ASLR) ASLR là tính năng bảo mật khiến vị trí dữ liệu của chương trình được sắp xếp một cách ngẫu nhiên trong bộ nhớ. Trước ASLR, vị trí dữ liệu của chương trình trong bộ nhớ có thể dự… Read More

0 comments:

Post a Comment