Сравнительно недавно вышла новая версия программы, которая является оболочкой к OCR-системам: Cuneiform и Tesseract - YAGF.
Эта графическая оболочка на протяжении уже нескольких лет разрабатывается одним человеком. Этот человек русский и зовут его Андрей Боровский.
Благодаря YAGF, у большого количество пользователей компьютеров появилась возможность абсолютно бесплатно распознавать печатнный текст с изображений и PDF-файлов. Конечно же YAGF+Tesseract или YAGF+Cuneiform не cмогут соперничать с таким «софтверным» гигантом, как FineReader, но составить ему альтернативу в тех областях, где требуется распознавать документы, соблюдая юридическую «чистоту», вполне может быть.
Уже сейчас в возможности YAGF входит:
- распознавание как одного документа, так и нескольких;
- распознавать можно как из уже отсканированного изображения, так и непосредственно со сканера (для этого должно быть установлено ПО xSane);
- распознавать можно из PDF-файла;
- до запуска процесса распознавания, можно выполнить простые действия по редактированию изображения: повороты, наклоны и выделение части изображения;
- совместная работа с двумя OCR-системами по переменно, выбирая систему в настройках вручную. Две OCR-системы: Tesseract и Cuneiform;
- результат распознавания можно подвергнуть процессу проверки орфографии;
- результат распознавания может быть сохранен либо в HTML, либо скопирован в буфер обмена.
Изменения в версии YAGF 0.8.9:
- увеличена стабильность работы приложения, при наклоне страницы;
- добавлена вставка изображений в буфер обмена;
- немного доработан интерфейс пользователя;
- добавлено автоматическое выделение предполагаемой «полезной» области изображения.
Комментарии (0)