Saturday, December 29, 2012

Một số phần mềm hỗ trợ tạo Box file cho Trainning trong Tesseract!



Phần mềm liên quan đến tạo file Box chuẩn bị cho training trong Tesseract
Mục tiêu là từ 1 file ảnh, ta tạo ra 1 file *.box có nhiều dòng, mỗi dòng có dạng:
耡 0 164 25 196
Trong đó, ký tự đầu tiên là chữ cái hay mã ký tự nào đó trong file ảnh, 4 số sau tương ứng là 4 giá trị định vị hình chữ nhật chữa ký tự đó.
Như vậy, về mặt lý thuyết ta phải tự làm thủ công việc này để đảm bảo độ chính xác cho dữ liệu huấn luyện, nhưng rất may đã có một số công cụ hỗ trợ việc này. Ngay trong Tesseract, có dòng lệnh để tạo ra file Box từ ảnh nhưng độ chính xác không cao, chúng ta cần hiệu chỉnh lại bằng tay. Để hỗ trợ có thêm 2 phần mềm: qt-box-editor  và owlboxer-1.02 (http://owlboxer.googlecode.com/files/owlboxer-1.02.exe).
qt-box-editor cung cấp khả năng tạo ra file Box từ ảnh, tiến hành nhận dạng, có chức năng nối và tách 2 vùng liền kề, tạo box mới,sửa ký tự cho đúng mã… nhưng việc điều chỉnh các Box cho sát với ký tự thì nó ít hỗ trợ, nó cho phép điều chỉnh số nên gây khó khăn, chậm và thiếu chính xác.
Bổ sung cho những thiếu sót đó, owlboxer-1.02 có khả năng hiệu chỉnh kết quả khá hiệu quả với 1 hệ thống các phím tắt.



Khi cài đặt có thể báo thiếu file mingwm10.dll, ta download bổ sung từ http://www.dll-files.com/mingwm10.zip?0WHiUHaFfP, sau đó giải nén đưa vào thư mục system hoặc system32 sau đó chạy bình thường!


Tuesday, December 18, 2012

Mô hình Fondue



Về khái niệm thuộc UML:
Struct Diagram = Class + Ọnect + Package + Component + Composite + Deployment
Behaviour = Use Case + Activity + State Machine + Interaction
Interaction = Sequence + Communication + Timing

1. Giới thiệu bài toán
Có thể dùng Class và Activity Diagram để miêu ta bài toán.
2. Xác định yêu cầu: dùng Use Case và Domain
+ Use Case: gồm UC Diagram và Description.
+ Domain Model ( UML Class Diagram): miêu tả các đối tượng liên quan dến hệ thống.
3. Phân tích:
a) Về mặt cấu trúc:
+ Environment Model ( Communication Diagram): miêu tả giao diện hệ thống, giới hạn, message vào, ra.
+ Concept Model (UML Class Diagram): miêu tả các khái niệm thuộc hệ thống.
b) Vể mặt hành vi:
+ Operation Model ( OCL Pre, Post Condition): miêu tả hoạt động của một Sýtem Operation với khía cạnh thay đổi giá trị thuộc Concept Model
+ Protocol Model ( UML State, Sequence Diagram): dãy biến đối trạng tháu của hệ thống khi System Openration xảy ra.
4. Thiết kế
- Interaction Model (Communication hoặc Sequence Digrams): Mô tả cách System Operation thực thi bằng kết nối các đối tượng trong lúc chạy chương trình.
- Dependency Model ( UML Class Diagram) thể hiện sự phụ thuộc phía trong của các lớp
- Design Class Model ( UML Class Diagram): Miêu tả cấu trúc tĩnh của lớp thiết kế.
- Inheritance Model ( UML Class Diagram): Miêu tả quan hệ kế thừa của các lớp trong thiết kế.