Програми для розпізнавання тексту
У цій статті ми зібрали 8 найкращих програм розпізнавання тексту із зображень та відсканованих документів. Вони з легкістю переведуть pdf, jpg, png або «паперовий файл» в редагований формат для Word і інших офісних додатків.
Загальні відомості:
Функції сканування розпізнавання:
Додаткові можливості:
Програма ABBYY FineReader - визнаний флагман галузі і лідер за кількістю і якістю задіяних технологій оптичного розпізнавання, стиснення і перекладу. Додаток працює зі сканером, підтримує формат зображень jpg, jpeg, png, gif, bmp, переводить pdf в Word, Excell і навіть упаковує свіжі скани в редаговану ПДФ-ку, HTML сторінку. У нього всього два недоліки – це вартість і системні вимоги. В іншому, рівних Файн рідеру просто немає.
Переваги продукту ABBYY FineReader:
- Робота з великою кількістю різноманітних джерел тексту;
- Практично необмежена кількість мов розпізнавання (більше 170);
- Вбудована перевірка правопису;
- Здатність стискати оригінальні файли зображень без видимої втрати якості;
- Підтримується розпізнавання багатосторінкових документів;
- У пробній версії повністю функціональна.
OCR CuneiForm , мабуть, найкраща безкоштовна програма – аналог FineReader. Вона менш вимоглива, менш складна, але і не настільки розвинена. Це проста, зручна утиліта захоплення тексту з інтуїтивно зрозумілим інтерфейсом і приємним зовнішнім виглядом. Вміє сканувати документ в Microsoft Word або інший додаток з офісного пакету, обробляти відразу кілька файлів форматів jpeg, TIFF і т.д., перевіряти редагований текст на помилки. Кращого безкоштовного рішення для будинку просто немає.
Особливості OCR CuneiForm:
- Працює як програма сканування і розпізнавання тексту (в будь-якому з режимів);
- Хороша реалізація оптичного розпізнавання символів, низький відсоток браку;
- Програма підтримує невелику кількість мов (близько 20), включаючи російську;
- Текст відразу готовий для подальшого редагування, адже передається в офісний додаток;
- Відмінно «відсіває» текст на зображенні від плям, що утворилися в процесі Ксерокопіювання.
Readiris Pro - надзвичайно потужна, але і недешева програма розпізнавання тексту зі сканера, документа pdf, DJVU, tiff, jpeg. Єдина серед аналогів включає інтелектуальну систему розпізнавання відсканованого паперового документа (рукописного тексту), причому, виконує подібну роботу на якісно високому рівні. Звичайно, якщо ви не збираєтеся «згодовувати» додатком зображення тексту з призначення лікаря. Каліграфічно вірний почерк сприймається добре, українська та російська підтримуються.
Характеристики програми Readiris:
- Хороша якість розпізнавання на 100 + мовах, включаючи таблиці та рукописні документи;
- Можливість витягти текст з картинки в різних форматах, з електронної книги djvu;
- Отриманий текст можна експортувати не тільки в Microsoft Office Word, Excel, але і PDF, OpenOffice, XPS;
- Інструмент стиснення стискає зображення зі сканера в 200 разів без втрат;
- Програма платна, але проста у використанні – всі дії виконують в 2 кліка.
Freemore OCR , як і інші безкоштовні програми розпізнавання тексту, не блищить кількістю функцій, але і не вимагає від вас придбання дорогої підписки. Згідно заявленим характеристикам, технологія Side-by - side допомагає додатку відмінно відокремлювати картинки від символів, щоб не захоплювати зайві блоки. Утиліта зберігає розпізнані документи текстовому форматі doc, TXT або pdf. Розробники особливо акцентують увагу на відсутності необхідності установки редакторів ПДФ від Adobe, мовляв, всі потрібні функції вже включені.
Особливості Freemore OCR:
- Дозволяє розпізнати документ, pdf, зображення майже всіх підтримуваних форматів;
- Відсутній повноцінний захоплення російського тексту, тільки латиниця;
- Меню програми Просте і зрозуміле, для роботи не потрібні знання англійської;
- Заявлені корисні» бізнес " функції-шифрування пдф, додавання водяного знака;
- Програмне забезпечення часто оновлюється з офіційного веб-сайту.
ABBYY Screenshot Reader - програма розпізнавання тексту зі скріншотів! Працює за наступним принципом: ви натискаєте комбінацію клавіш, захоплюєте необхідну область екрану, чекаєте кілька секунд і зберігаєте отриманий результат у вигляді тексту з вікна утиліти в будь-який редактор через буфер обміну. Інтерфейсу обміну даними тут немає, зате є перекладач, словник та інші приємні фішки від ABBYY.
Переваги та недоліки Screenshot Reader:
- Використовує мінімум ресурсів, спрацьовує моментально;
- Не вимагає запуску з робочого столу, якщо ви виконаєте необхідні налаштування гарячих клавіш;
- Може розпізнати текст з будь-якого відкритого на вашому комп'ютері файлу або захищеної веб-сторінки;
- Інтегровані функції перекладу та перевірки орфографії;
- Тут не вийде відкрити файл - тільки захоплення області екрану в ручному режимі;
- Пакетна обробка також відсутня, пристрій зчитування не підключається;
- Щоб зберегти отримані дані в редактор, потрібно скопіювати їх вручну.
Ми б не рекомендували використовувати Adobe Acrobat як повноцінний сервіс розпізнання тексту, але якщо пакет вже встановлений на ПК, а вам потрібно конче зараз виконати роботу, він може гідно впоратися з поставленим завданням. Про те, як активувати функцію, читайте в онлайн-довідці Adobe. Впорається з нею легко, але ви повинні розуміти, що на виході отримаєте не повноцінний текстовий документ, а редагований pdf, вміст якого можна імпортувати в Блокнот і Word.
Характеристики Adobe Acrobat Pro DC:
- Являє собою пакет для створення і редагування pdf;
- Включає функцію імпорту із зовнішніх пристроїв;
- Пропонує велику кількість профільних можливостей, наприклад, завантаження файлів в хмару Creative Cloud (аналог Google Диск для продуктів Adobe);
- Утиліта повністю сумісна з усіма новими версіями ОС Windows.
Scanitto Pro - програма для розпізнання тексту з ксерокопії. Являє собою альтернативний інтерфейс сканера з опцією захоплення тексту для імпорту в стандартний формати редакторів. Дозволяє виділяти, розгортати елементи на сторінці, позначати фрагменти, які потрібно розпізнати.
Особливості Scanitto Pro:
- Розпізнання з будь-якої обраної мови з 7 інтегрованих (включаючи російську);
- Багато форматів експорту готового матеріалу;
- Зручний інтерфейс роботи з пристроями, що підключаються;
- Висока швидкість відповіді на запити, низькі вимоги до ПК;
- Недорога Ліцензія.
RiDoc , можливо, не самий функціональний продукт з представлених, але він явно краще будь-якого free online ocr (онлайн сервісу безкоштовного розпізнання). У додатку багато власних цікавих "фішок" - каталогізатор документів, інструментарій накладення водяних знаків, власний віртуальний принтер, збереження пресетів для якісного розпізнавання в пакетному режимі. Але в деяких випадках можливостей Рідока явно мало.
Корисні функції RiDoc:
- Власний інтерфейс обміну із зовнішнім зчитувачем;
- Накладення водяних знаків, цифрового підпису, створення ключа шифрування;
- Створення однакових налаштувань розпізнавання для необмеженої кількості сторінок;
- Експорт результату в MS Word, bmp, jpeg, tiff, png і, звичайно, pdf.