Как установить OCR Tesseract?

Dromedary

New member
Сообщения
24
#1
При попытке установки Tesseract-а - после сообщения об окончании его установки и появлении соответствующего указания в менеджере пакетов Sinaptec - в разделе "Графика" ничего подобного не появилось: Screenshot_20190826_070356.png
Попытка убрать и установить по новой - ничего не изменила. В чем дело, где он находится и как им можно пользоваться?
 

Olej

New member
Сообщения
1 307
#2
в разделе "Графика" ничего подобного не появилось:
В Linux при установке любого пакета он вовсе не обязан обязательно появляться в меню системы.
Многие программы после установки запускаются по имени в терминале. Потом, если захотите, "по следам" (по синтаксису) такого запуска можете сами сделать значок на рабочем столе, или ручным редактированием нового пункта меню.
 

Olej

New member
Сообщения
1 307
#3
Попытка убрать и установить по новой - ничего не изменила.
tesseract вообще является консольной программой и для него нет никакого GUI и он и не может нигде "появиться".
Для него есть несколько GUI обёрток, таких как YAGF и др. ... но это уже совсем другие пакеты.

Про сканирование и распознавание текста (OCR в Linux) почитайте по ссылке. Там же есть примеры того как работать с tesseract.
 
Последнее редактирование:

Olej

New member
Сообщения
1 307
#4
Для выньдаунов ;), людей переходящих "из винды" в Linux просто необходимо такое маленькое введение:
- Windows и Linux совершенно разные ОС по своим базовым основам...
- в Windows графическое окно программы является базовым понятием (программирования), на котором стоит вся система - не может быть программы без её "главного окна программы";
- в Linux, наоборот, всё что графика - является необязательной надстройкой, её можно просто не устанавливать в системе вообще;
- смысл и место графики в этих ОС - совершенно различно ... даже если и выглядит похоже ;)
- подавляющее большинство графических программ (GUI) в Linux - это только тонкие обёртки, из-под которых выполняются как дочерние процессы отдельные консольные команды Linux.

P.S. Если вы не освоите технику командной строки в Linux, то вы никогда толком не сможете понимать что здесь происходит "под капотом" и гибко и профессионально пользоваться Linux. Для бухгалтера за компьютером это вполне допустимо. Для инженера IT - ни в коем случае! Выбирайте сами кому что...
 

star

New member
Сообщения
6
#6
Непонятно по какому принципу заполняется репозиторий пакетами. Потребовалось распознать лист русского текста. Решил поставить распознаватель текста tessera; добавил его русскоязычный пакет и yagf. Запускаю yagf. Для сканирования требует утилиту XSane, которой в репозитории нет! Ладно есть утилита сканирования в стандартном наборе. Делаю скан и пытаюсь распознать. Окно моментально сворачивается. Запускаю распознавание из консоли. Вот результат "из под капота":
anat@astras:~$ yagf
libpng warning: iCCP: known incorrect sRGB profile
QIcon: Cannot load icon system from theme.
Ошибка сегментирования
Чего не хватает? В Альт -линуксе давно уже распознавалка прекрасно работала, возможно на cuneform, но в репозитории и его нет.
другой опыт из консоли:
tesseract Image-0001.jpeg out_Rfile -l rus
Tesseract Open Source OCR Engine v3.04.01 with Leptonica
ERROR: Can not open input file Image-0001.jpeg
Error during processing.
А конвертировать в древнее расширение файла .tif, с которым работает tesseract не знаю чем.
 
Последнее редактирование:

Olej

New member
Сообщения
1 307
#7
Непонятно по какому принципу заполняется репозиторий пакетами. Потребовалось распознать лист русского текста. Решил поставить распознаватель текста tessera; добавил его русскоязычный пакет и yagf. Запускаю yagf. Для сканирования требует утилиту XSane, которой в репозитории нет! Ладно есть утилита сканирования в стандартном наборе. Делаю скан и пытаюсь распознать.
Не нужно "понимать по какому принципу", а нужно читать, читать и читать...
Вы в разделе "Astra Linux Common Edition" - это самый обычный Debian, где огромный репозиторий, который подключается и всё там есть.
Более того: всё замечательно работает и всё замечательно распознаётся.
Я уже показывал ссылку: сканирование и распознавание текста - там и объяснения и примеры.

Это руки, Карл...
:cry: