Контекстный поиск Recoll не находит документы

Яков

New member
Сообщения
3
#1
Смоленск 1.6.
Создал каталог, поместил туда файлы txt, doc, docx, xls, pdf, в которых содержится искомое слово.
Пытаюсь искать через Recoll, но он их не находит, за исключением pdf файлов. В чем причина? Может требуется какие-то пакеты дополнительные установить?
 

andr14142

New member
Сообщения
1
#3
Проблема в кодировке русских букв. В Astra Linux кодировка русских букв UTF-8, а в старых версиях Windows была CP1251. Совсем старые тексты под DOS были в кодировке CP866. Если документы в формате txt создавать в Astra Linux в кодировке UTF-8, то их утилита Recoll прекрасно находит. А если документы с русским текстом были созданы в других кодировках, то не находит.
С форматом pdf дело обстоит по-другому. Образы букв распознаются и получаются сразу в текущй кодировке операционной системы.
Ещё программа правильно находит файлы htm, если в теге в заголовке указана кодировка.
 

ALSE_User

New member
Сообщения
374
#4
PDF он разный бывает - это же контейнер, и туда можно поместить jpg, png, tiff и проч. И в этом случае распознаваться ничего не будет