Распознаем текст онлайн Web-сервисы и не только... Путевые заметки Баданова / 18.11.2014 Часто приходится распознавать текст с отсканированных документов и документов, сохраненных в виде изображения. Для распознавания таких документов используются программы для распознавания текста. Самая известная программа Abbyy Finereader. Но существует и онлайн версия этого программного продукта.OCR-это технология, которая извлекает текст из изображения или отсканированного документа так, что он может быть отредактирован, отформатирован и другое. Самый известный сервис, который отлично подойдёт для распознавания документов – это Google документы. Для его использования достаточно иметь аккаунт Google. Можно распознавать изображения PNG, JPG, и GIF и файлы PDF. Распознанные документы можно сохранять в форматах DOC, TXT, PDF, PRT и ODT.Небольшой обзор сервисов для распознавания текстов:1. Бесплатный онлайн сервис распознавания текста ABBYYFineReaderOnline позволяет сэкономить время на перепечатывании текста вручную. Хорошее качество распознавания и форматирования документов. Файл не более 100 Мб. За один раз можно распознать 10 страниц документа. Возможности ABBYYFineReaderOnline :1. Конвертация документов независимо от операционной системы компьютера, необходимо лишь соединение с Интернетом.2. Поддержка большого количества входных форматов.3. Распознавание многоязычных документов (до 42 языков). До 3-х языков на одном конвертируемом изображении.4. Распознавание многостраничных документов с сохранением всех элементов форматирования (сноски, колонтитулы…).5. Высокая точность распознавания исторических текстов.Сервис позволяет экспортировать распознанные файлы в облачные файловые сервисы. Для начала работы необходимо зарегистрироваться. Инструкция по работе с сервисом не требуется.2. Online OCR - сервис для распознавания текста. Особенности сервиса:Может распознать текст или символы с любого изображения (отсканированный документ, цифровая фотография или просто картинка в формате JPG, BMP, TIF и др.). OnlineOCR.ru обрабатывает также многостраничные документы TIFF и PDF.Может Конвертировать полученный в результате распознавания, текст в следующие выходные форматы: Adobe PDF, MS Word, Excel, Html, Rtf, Txt. Позволяет Хранить файлы с результатом распознавания в вашем виртуальном рабочем кабинете online, скачивать их на жесткий диск, редактировать, отправлять по почте и распечатывать на принтере. OnlineOCR.ru позволяет бесплатно распознать 15 страниц в час без регистрации. Размер файла для загрузки не должен превышать 4 Мб. Для незарегистрированных пользователей ограничены настройки распознавания и создания выходных файлов.Изображения находящиеся в тексте игнорируются при формировании выходного файла.Инструкция по работе с инструментарием сервиса не требуется.3 сервис Free online OCR для конвертирования и распознавания текста. При распознавании игнорирует интегрированные в текст изображения.Особенности:• Неограниченное скачивание файлов• Регистрация не требуется• 58 языков распознавания поддержки• Страница вращения: по часовой стрелке/против часовой стрелки на 90°, 180°• Различные варианты отображения и обработки полученного текста o Скачать как файлo Редактирование в Google Docso Перевод с помощью Google Translate или Bing Translatoro Публикации в интернете (Pastie.com или Pastebin.com)o Копировать в буфер обмена • Поддерживает плохо Отсканированные и сфотографированные страницы• Поддерживает изображения с низким разрешениемВходные форматы файлов• JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX• Сжатые файлы: Unix compress, bzip2, bzip, gzip• Многостраничных документов: TIFF, PDF, DjVu• DOCX, ODT файлов с изображениями• Несколько изображений в ZIP-архивеФорматы выходных файлов• Обычный текст (TXT)• Microsoft Word (DOC)• Adobe Acrobat (PDF) Инструкция по работе с инструментарием сервиса не требуется.4. img2txt – сервис по распознаванию текста из изображений (только форматы JPG, PNG, GIF), в тексте не должно присутствовать изображений, что скажется на качестве распознавания. Для начала работы не нужно регистрироваться. Инструкция по работе с инструментарием сервиса не требуется.5. i2OCR - сервис для распознавания текста. На этом онлайн сервисе требуется регистрация. Поддерживает документы для распознавания текстов в формате TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM. Можно загружать документ до 10 Мб без каких-либо ограничений. Полученный результат распознавания можно скачать на компьютер в виде одного из следующих форматов: TXT, DOC, PDF, HTMLОсобенности:• 60+ Языков Распознавания• Поддерживает Основные Форматы Изображений• 100% бесплатный безлимитный Uploads• может извлечь текст из нескольких столбцов.• Извлеченный текст может быть отредактирован в интернете с помощью Google Docs или переведены с помощью Google или Bing translation service.• Вы можете загружать входное изображение из URL (web, cloud и т.д.) или с жесткого диска.В примере ниже можно оценить качество распознавания из картинки: Инструкция по работе с инструментарием сервиса не требуется.Плодотворной работы! ABBYYFineReaderOnline Free online OCR Online OCR i2OCR img2txt распознать