프로그램 사용/tesseract ocr

번호판 인식(tesseract)

구차니 2021. 10. 14. 11:42

처음 패키지가 본체(?)고 그 위에는 한글언어 인식 데이터 패키지

$ sudo apt install tesseract-ocr tesseract-ocr-kor tesseract-ocr-script-hang tesseract-ocr-script-hang-vert

 

도움말을 보는데 도움은 안된다(응?)

리눅스에서 실행시 outputbase를 stdout으로 하면 콘솔에 텍스트로 출력된다.

$ tesseract --help
Usage:
  tesseract --help | --help-extra | --version
  tesseract --list-langs
  tesseract imagename outputbase [options...] [configfile...]

OCR options:
  -l LANG[+LANG]        Specify language(s) used for OCR.
NOTE: These options must occur before any configfile.

Single options:
  --help                Show this help message.
  --help-extra          Show extra help for advanced users.
  --version             Show version information.
  --list-langs          List available languages for tesseract engine.

$ tesseract --list-langs
List of available languages (5):
Hangul
Hangul_vert
eng
kor
osd

 

LSTM 학습

[링크 : https://hongjong.tistory.com/19]

[링크 : https://diyworld.tistory.com/114]

[링크 : https://davelogs.tistory.com/70]

[링크 : https://davelogs.tistory.com/72]

[링크 : https://tesseract-ocr.github.io/tessdoc/]