Графическая оболочка YAGF для системы распознавания текста, "доросла" до версии 0.8.9

Сравнительно недавно вышла новая версия программы, которая является оболочкой к OCR-системам: Cuneiform и Tesseract - YAGF.

Эта графическая оболочка на протяжении уже нескольких лет разрабатывается одним человеком. Этот человек русский и зовут его Андрей Боровский.

Благодаря YAGF, у большого количество пользователей компьютеров появилась возможность абсолютно бесплатно распознавать печатнный текст с изображений и PDF-файлов. Конечно же YAGF+Tesseract или YAGF+Cuneiform не cмогут соперничать с таким «софтверным» гигантом, как FineReader, но составить ему альтернативу в тех областях, где требуется распознавать документы, соблюдая юридическую «чистоту», вполне может быть.

Уже сейчас в возможности YAGF входит:

  • распознавание как одного документа, так и нескольких;
  • распознавать можно как из уже отсканированного изображения, так и непосредственно со сканера (для этого должно быть установлено ПО xSane);
  • распознавать можно из PDF-файла;
  • до запуска процесса распознавания, можно выполнить простые действия по редактированию изображения: повороты, наклоны и выделение части изображения;
  • совместная работа с двумя OCR-системами по переменно, выбирая систему в настройках вручную. Две OCR-системы: Tesseract и Cuneiform;
  • результат распознавания можно подвергнуть процессу проверки орфографии;
  • результат распознавания может быть сохранен либо в HTML, либо скопирован в буфер обмена.

Изменения в версии YAGF 0.8.9:

  • увеличена стабильность работы приложения, при наклоне страницы;
  • добавлена вставка изображений в буфер обмена;
  • немного доработан интерфейс пользователя;
  • добавлено автоматическое выделение предполагаемой «полезной» области изображения.

Зарубин Иван Эксперт по Linux и Windows

Парашютист со стажем. Много читаю и слушаю подкасты. Люблю посиделки у костра, песни под гитару и приближающиеся дедлайны. Люблю путешествовать.

Комментарии (0)