Как оплатить? → Статьи и обзоры → Изучайте компьютер!

Мгновенное извлечение текста из изображений: 4 простых рецепта

27.12.2016

Сколько раз вы бывали в ситуации, когда нужно извлечь из картинки несколько строк, а перепечатывать от руки лень? Глупая ситуация: ведь ставить ради такого полноценный пакет распознавания текста — слишком накладно и по времени, и по деньгам. Приятная новость в том, что теперь это и не нужно. Интернет и мобильные устройства рады предложить массу решений, которые справятся на раз, потребовав минимум времени на подготовку. Впрочем, учитывая глубину задачи, будет полезно знать о ней чуть больше, чем знает средний пользователь. Поэтому давайте сегодня пройдёмся по её основным пунктам.

Начать стоит с парадоксальности. Распознавание текста на изображениях — одна из тех вечных тем, которые всегда актуальны, всегда развиваются и, к сожалению, никогда не доведены до конца. Каждые пять лет можно писать новый обзор продуктов — и всякий раз демонстрировать новые направления, в которых исследователи и разработчики продвинулись, но так и не завершили начатое.

Что мешает? А дело в том, что символы на бумаге, напечатанные даже самым качественным типографским аппаратом, а тем более написанные рукой, с точки зрения компьютера — всегда нечто размытое, нечёткое, непонятное! Компьютер ведь воспринимает мир не как мы (образами!), а ноликами и единичками. И каждый символ для него — такой набор ноликов и единичек, светлых и тёмных точек, которые необходимо сравнить с эталонным алфавитом и выбрать наиболее похожий знак. То есть, распознать.

Так что хоть занимаются этим исследователи уже буквально половину столетия, успехи так себе: точность распознавания даже печатного текста по-прежнему варьируется где-то от 80% и выше, сильно завися от качества исходной фотографии, уровня контраста, разрешения (количества точек в снимке) и других факторов. Для текстов, написанных от руки, всё ещё хуже (там приходится прибегать к предварительному обучению «распознавалки»), но об этом чуть позже.

Ещё, распознавая текст с отсканированного листа или фотографии, стоит сразу отказаться от мысли, что удастся сохранить стиль документа. Тип шрифта, размещение слов на странице, таблицы, выравнивание и прочее скорее всего собьются или потеряются. К счастью, даже в таком виде автоматическое распознавание всё-таки приносит достаточно пользы, чтобы его применять: ведь оно избавляет от необходимости перепечатывать текст от руки. Поэтому давайте рассмотрим четыре типовых случая из жизни и рецепты для них. Итак, что делать, если у вас на руках картинка, в которую впечатан текст?

1. Самый простой и быстрый способ: отдать её на растерзание автоматическому распознавателю, встроенному в сервисы Google. Для этого вам потребуется аккаунт в Google (если у вас Android-смартфон, такой аккаунт у вас уже есть) и облачный накопитель Google Drive.

Загружайте картинку на Google Drive (drive.google.com), щёлкайте по ней правой кнопкой мыши и командуйте «Открыть с помощью -> Google Документы». Это всё, что нужно: графический файл автоматически будет преобразован в текстовый. Быстро, сравнительно качественно и с поддержкой десятков языков. Но что делать, если текст не в изображении, а, скажем, написан на доске, напечатан на бумажном чеке, квитанции?

2. Тут пригодятся мобильные приложения, превращающие смартфон сразу и в сканер, и в распознаватель текста. Их буквально море, от титулованных (вроде MS Office Lens и ABBYY FineScanner) до десятков малоизвестных разработок. Чтобы их найти, просто выполните в вашем магазине приложений поиск по слову «OCR» (это английская аббревиатура, означающая «Оптическое Распознавание Символов»).

Вероятно, приложению понадобится доступ в интернет, возможно, самые мощные из них будут не бесплатны, либо станут требовать оплату за каждый распознанный лист. Но в общем и целом нужно признать, что смартфон идеально приспособлен для этой задачи — ведь у него есть всё необходимое: фотокамера, мощный процессор и интернет-соединение. Особенно для коротких текстов это точно лучшее решение. Позаботьтесь об освещении и постарайтесь, чтобы картинка занимала всю площадь экрана, причём без «зума» (тогда качество распознавания будет наивысшим).

Работает MS Office Lens

3. Если же текста много, лучше применить специализированные веб-сервисы — которые, по сути, не что иное как программы распознавания текста, выведенные в интернет. Самые «умные» из них ограничивают бесплатный функционал — как, к примеру, всё тот же ABBYY FineReader Online, позволяющий распознать лишь 10 бесплатных страниц в месяц. Но на каждый такой сервис найдётся несколько абсолютно бесплатных аналогов, позволяющих распознавать сколько угодно страниц: это Free-OCR.com, NewOCR.com, i2OCR.com, OnlineOCR.net и многие другие (их легко найти через любой поисковик, запросив «бесплатный OCR онлайн».

Единственное, о чём следует помнить, пользуясь подобными сервисами (как и приложениями из предыдущего пункта, впрочем), что если его владелец не принадлежит к списку заслуживающих доверия компаний, не стоит скармливать ему конфиденциальные документы. Утечка, конечно, не гарантирована, но, знаете сами, бережёного бог бережёт.

4. Наконец, самый тяжёлый случай — это рукописный текст. Простые онлайновые «распознавалки» его читать не умеют. Приложения пытаются (в частности, упоминавшееся выше MS Office Lens), но похвастаться особыми успехами не могут. Необходимы хитрые алгоритмы, основанные на искусственном интеллекте и самообучении. Исследователи периодически рапортуют об успехах, но до стадии продуктов они никак не дойдут.

Поэтому, если у вас есть написанный от руки текст, который необходимо преобразовать в цифровой вид, придётся воспользоваться полноценным программным пакетом, вроде уже знакомого ABBYY FineReader. И даже здесь предварительно нужно будет произвести обучение программы, показав ей, как автор данного текста пишет отдельные буквы.

К сожалению, даже после этого качество распознавания не гарантировано. Если текст написан твёрдой рукой, да ещё и буквы раздельно, тогда может получиться. В других случаях скорее всего «распознавалка» наделает столько ошибок, что вы устанете их исправлять. Поэтому если ваш текст написан, простите, в стиле «курица лапой», проще и быстрей будет перепечатать его от руки. Увы, компьютеры пока недостаточно умны для такой простой задачи!

← назад

оглавление

Оставить комментарий

Ваш комментарий будет опубликован после модерации.

Пишите нам:

Звоните нам по тел. +7 (495) 995-82-95. Мы работаем круглосуточно. Прямо сейчас на все Ваши вопросы готова ответить наша служба поддержки:
Круглосуточная трансляция из офиса «ЭргоСОЛО»

Поможем бросить курить

Все права на материалы, находящиеся на сайте ergosolo.ru, охраняются в соответствии с законодательством РФ, в том числе, об авторском праве и смежных правах.
Использование материалов сайта без разрешения ООО "ЭргоСоло" ЗАПРЕЩЕНО!