OCR CuneiForm: Распознавание текстов отныне бесплатно
Образованная в 1993 г. российская компания Cognitive Technologies объявляет о том, что отныне распознавать тексты можно бесплатно.
12 декабря 2007 г. Компания Cognitive Technologies объявляет о запуске программы «Распознавание должно быть на каждом компьютере», о выпуске free-ware версии OCR CuneiForm и об открытии исходных кодов OCR CuneiForm.
Приложение может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных.
Более того, в конце января 2008 г. Cognitive Technologies планирует подготовить бесплатное распознавание текстов в режиме онлайн на сайте cuneiform.ru. К концу следующего года с помощью данного ресурса, как ожидается, можно будет распознавать до 10 тыс. документов в день.
Проект является открытым. В марте будущего года планируется выложить исходный код программы. Любой желающий сможет доработать продукт в соответствии со своими желаниями и требованиями.
Предполагается, что одним из основных результатов проекта OCR CuneiForm должен стать рост популярности и распространенности решений в области оптического распознавания печатных текстов (Optical Character Recognition, OCR) благодаря открытости кода и нулевой стоимости ПО.
По данным компании, число активных пользователей OCR за счет использования Open Source к 2010 г. может возрасти в 5 раз, во многом за счет активного подключения офисных сотрудников, учащихся школ, студентов вузов, а также государственных структур, для которых бесплатное ПО станет хорошей альтернативой пиратским продуктам. Таким образом, число пользователей OCR к этому времени может составить порядка 25 млн. человек. Сегодня это число составляет около 5 млн. человек.
Информация об OCR CuneiForm:
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
Характеристики OCR CuneiForm:
высокое качество распознавания;
высокая скорость работы;
распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
полное сохранение топологии страницы;
поддержка пакетного режима сканирования и распознавания;
простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
встроенный текстовый редактор для работы с распознанным текстом;
совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.
Подробная информация на официальном сайте cuneiform.ru
|