pdf 읽어오고 변환하는건 python이나 node.js 그리고 java 등에 모두 존재는 하는 듯
그래도 라이센스가 문제인데..
[링크 : https://pdfbox.apache.org/]
[링크 : https://www.tutorialkart.com/pdfbox/extract-text-line-by-line-from-pdf/]
[링크 : https://itextpdf.com/en]
[링크 : https://stackoverflow.com/questions/4028240/extract-columns-of-text-from-a-pdf-file-using-itext]
[링크 : https://www.npmjs.com/package/pdfreader]
[링크 : https://www.npmjs.com/package/pdf-lib]
[링크 : http://www.unixuser.org/~euske/python/pdfminer/]
PDFMiner 모듈은 Python 2 버젼에서만 사용 가능
[링크 : https://dgkim5360.tistory.com/entry/python-pdfminer-convert-pdf-to-html-txt]
'Programming > node.js' 카테고리의 다른 글
electron.js (0) | 2019.06.03 |
---|---|
npm-run-all 병렬 빌드 (실패) (0) | 2019.05.29 |
node.js express 301 redirect (0) | 2019.05.15 |
node.js 항목 확인 (0) | 2019.04.23 |
proxy error: Error: write after end (0) | 2019.04.23 |