Computer >> 컴퓨터 >  >> 소프트웨어 >> Office

OCRFeeder - 이미지가 텍스트로 이동하는 위치

최근 정말 멋지고 새롭고 고유한 Linux 소프트웨어를 찾는 것이 어려운 작업이 되었습니다. 집안일. 그리고 최근에는 데스크톱 공간에서 열정과 혁신이 서서히 쇠퇴하기 시작한 이후에도 실제로 지난 4~5년을 의미했습니다. 결국, 한정된 양의 지식에 얼마나 많은 좋은 것들이 존재할 수 있는지에는 한계가 있지만, 초점이 모바일로 잘못 이동한 것과 Linux의 꿈이 산산이 부서진 것을 잊지 말자.

이것은 OCRFeeder라는 이름의 4년 된 소프트웨어 테스트를 유효하게 만든다고 생각합니다. 두 가지 이유가 있습니다. 좋다면 좋은 것이다. 둘째, 저는 항상 광학 문자 인식의 발전과 우리의 도구(읽기 AI)가 여기서 합당한 일을 할 수 있는지에 관심이 있었습니다. 얼마 전에 이것에 대해 자세히 썼고, 2015년에 YAGF를 리뷰했습니다. 이제 OCRFeeder와 그것이 무엇을 할 수 있는지 살펴보겠습니다. 나 다음은 용감한 Linux 전사들입니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

단어는 jpg로 쉽게 나오지 않습니다

프로그램을 설치했습니다. 잡아야 할 라이브러리가 꽤 많습니다. Ubuntu 18.04에서 목록은 꽤 많은 줄에 걸쳐 실행되었습니다. Tesseract OCR 엔진이 이 프로그램의 기본 키트로 제공됩니다.

다음과 같은 추가 패키지가 설치됩니다. chardet python-enchant python-html5lib python-lxml python-numpy python-olefile python-pil python-renderpm python-reportlab python-reportlab-accel python-sane python-tk python-webencodings tesseract-ocr tesseract-ocr-eng tesseract-ocr -osd tk8.6-blt2.5 unpaper yelp yelp-xsl

추천 패키지:
blt-demo python-gobject python-wxgtk3.0 python-genshi python-lxml-dbg python- lxml-doc gfortran python-dev python-nose python-numpy-dbg python-numpy-doc python-pil-doc python-pil-dbg python-renderpm-dbg python-egenix-mxtexttools python-reportlab-doc python-sane-dbg tix 파이썬-tk-dbg

그것을 시작했습니다. 인터페이스는 약간 실용적입니다. 먼저 하나 이상의 이미지를 로드해야 합니다. 그런 다음 OCR 엔진을 공급하는 데 사용할 이미지를 사용하고 다른 쪽 끝에 합리적 정확도의 텍스트를 생성할 수 있기를 바랍니다. 이 작업을 마치면 텍스트를 LibreOffice로 내보낼 수 있습니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCR 엔진

언급했듯이 기본적으로 OCRFeeder는 Tesseract를 사용하지만 원하는 다른 엔진을 추가할 수 있습니다. 실제로 CuneiForm, GOCR 및 Ocrad를 사용해 보았고 프로그램이 모두 올바르게 감지하고 로드했습니다. 아주 깔끔합니다. 이러한 엔진 중 일부를 사용하면 운이 더 좋을 수 있으므로 이를 통해 여러 가지 방법으로 문서를 시험해 볼 수 있습니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

sudo apt-get 설치 설형 문자 gocr ocrad

OCRFeeder - 이미지가 텍스트로 이동하는 위치

이미지를 텍스트로 변환

이제 중요한 부분입니다. 여기서 조금 고생했습니다. 프로그램이 사용 가능한 모든 이미지에서 텍스트를 자동 감지(모든 페이지 인식)하도록 했고 이상한 색상으로 표시된 출력을 얻었습니다. 이 작업은 세 개의 로드된 PNG 파일에 대해 완료하는 데 약 3분이 걸렸고, 그 시간 동안 OCRFeeder CPU 사용률은 약 17%였으며 Tesseract는 약 4-5%를 사용했습니다. 따라서 응용 프로그램이 모든 프로세서 코어를 더 잘 사용한다면 시간을 확실히 단축할 수 있습니다. 그런 다음 이상한 출력. 어떻게 해야 할지 잘 모르겠습니다. 이상한. 전혀 진전이 없는 것 같았습니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

그런 다음 마우스를 사용하여 표시된 이미지의 일부를 드래그 앤 선택하면 원하는 OCR 엔진을 선택하고 실제 변환을 실행할 수 있는 별도의 창이 열립니다. 시각적 결함은 차치하고라도 이 방법은 상당히 잘 작동했으며 각 이미지를 처리하는 데 몇 초밖에 걸리지 않았습니다.

교육이나 기본값에 대한 변경이 없으면 사용 가능한 4가지 엔진 간의 결과 편차가 엄청났습니다. Tesseract는 최고이자 허용 가능한 변환만 표시했습니다. 나머지는 전혀 사용을 고려하기에 충분하지 않았습니다. 이유는 모르겠지만 그냥 그대로입니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

또한 회색 배경 이미지로 더 나은 결과를 얻었습니다. 과거에 Tesseract는 어려움을 겪었기 때문에 이 엔진에 어떤 개선이 이루어졌든 환영할 만합니다. 그러나 이것은 엄격하게 OCRFeeder가 아니며 원하는 경우 명령줄에서 Tesseract를 직접 실행할 수 있습니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

뒤틀림 보정 및 용지 제거

OCRFeeder에는 두 가지 유용한 기능이 있습니다. 기울어진 이미지 스캔에서 텍스트를 자동 회전하는 기능과 노이즈를 줄이고 보다 정확한 변환을 위해 용지 배경을 제거하는 기능입니다. 두 가지 옵션을 모두 시도해 보았고 기울기 보정은 잘 작동했습니다. Unpapering, 그렇게. 하지만 텍스트를 회전시킨 후(김프 제어 이미지에서 예전에 했던 작업) 변환 결과가 훨씬 더 좋아졌습니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

ODT로 내보내기

이것은 약간 까다로웠습니다. 나는 이것을 몇 번 시도했고 많은 오류가 발생했습니다. 결국에는 효과가 있었습니다. 출력이 가장 예쁘지는 않지만 좋은 점은 다양한 이미지에 대해 서로 다른 엔진을 사용한 것을 포함하여 동시에 여러 변환을 내보낼 수 있다는 것입니다. 아주 훌륭합니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

OCRFeeder - 이미지가 텍스트로 이동하는 위치

환경설정

마지막으로 프로그램의 동작을 변경할 수 있는 옵션이 있습니다. 그다지 중요하지는 않지만 감지 및 정확성에 도움이 될 수 있습니다. 대부분 텍스트 열 너비, 여백, 언어 선택 등을 감지하는 방법에 달려 있습니다. 대부분의 사람들에게 기본값은 합리적인 시작점이 될 것입니다.

OCRFeeder - 이미지가 텍스트로 이동하는 위치

결론

OCRFeeder는 합리적이고 유연한 소프트웨어입니다. 여러 엔진을 사용할 수 있으며 이미지 수정 알고리즘이 추가되었습니다. 이것은 OCRFeeder를 아마도 자유 시장에서 이런 종류의 가장 유망한 소프트웨어로 만들지만, 누군가 이것을 선택하지 않는 한 곧 업데이트를 볼 가능성이 없기 때문에 당신의 희망은 즉시 무너져야 합니다. 여기에는 시장이 있지만 Linux 세계는 권태와 무관심 사이에서 어려운 위치에 갇혀 있기 때문입니다.

그 외에도 나이와 업데이트는 제쳐두고 대부분 OCRFeeder가 제공했습니다. 변환 품질은 나쁘지 않았고 UI를 사용하여 작업을 수행해도 손실되는 것이 없으며 내보내기 기능을 사용하면 추가 편집 등을 위해 멋진 문서를 만들 수 있습니다. 또한 Tesseract의 개선 사항에 만족합니다. 따라서 텍스트에 만족하는 이미지가 많이 있고 고대 형식의 손으로 쓴 텍스트를 현대적이고 사용 가능한 것으로 변환하려는 경우 이렇게 할 수 있습니다. OCRFeeder는 스캐너에서 직접 읽을 뿐만 아니라 PDF를 지원합니다. 실험할만한 가치가 있습니다. 이제 갈 시간입니다. 안녕히 계십시오.

건배.