[align=justify]OCR (Optical Char Recognition - оптическое распознавание символов) в Линуксе всегда был проблемой - никаких ФайнРидеров под него нет, а существующие системы типа GOCR работают только с командной строки и только с латиницей, да и то не особо успешно...
Ветераны компьютерного фронта наверное помнят, что первой популярной системой был не ФайнРидер, а Куниформ (Cuneiform, "клинопись" в переводе). Потом эта "клинопись" пропала с горизонта, и довольно долго про неё ничего не было слышно. И вот, кажется в прошлом году, появилось сообщение что разработчики системы Cuneiform открыли её исходные тексты и выложили в публичный доступ под открытой лицензией.
На сегодняшний день есть уже программа cuneiform в Линуксе, у которой есть простенькая графическая оболочка и которая вполне пристойно распознает тексты, причем даже на русском языке (там еще целый список языков). Я недавно ей воспользовался (кстати, распознанный текст после минимальной коррекции был опубликован здесь, на этом форуме ). Вполне нармально работает.
Значит, еще один пробел в софте под Линукс ликвидирован, и это не может не радовать![/align]
OCR - системы распознавания текста.
- kalia
- Site Admin
- Сообщения: 9883
- Зарегистрирован: Пт окт 09, 2009 11:52 pm
- Скайп: kalia1962
- Пол: Мужской
- Откуда: Тбилиси
- Контактная информация:
OCR - системы распознавания текста.
Крокодил, крокожу и крокодить буду!
- kalia
- Site Admin
- Сообщения: 9883
- Зарегистрирован: Пт окт 09, 2009 11:52 pm
- Скайп: kalia1962
- Пол: Мужской
- Откуда: Тбилиси
- Контактная информация:
Re: OCR - системы распознавания текста.
png jpg jpeg tif tiffrazor писал(а):а файлы djvu этот Куниформ распознает?
Крокодил, крокожу и крокодить буду!
- razor
- Вице-Адмирал
- Сообщения: 1946
- Зарегистрирован: Пн окт 12, 2009 9:12 pm
- Откуда: Москва
- Контактная информация:
Re: OCR - системы распознавания текста.
в общем, djvu - не проблема...:)
Mожно надергать нужных страниц djvu в те же png jpeg tiff bmp gif при помощи WinDjView... и делай с ними что хош...:)
Mожно надергать нужных страниц djvu в те же png jpeg tiff bmp gif при помощи WinDjView... и делай с ними что хош...:)
- kalia
- Site Admin
- Сообщения: 9883
- Зарегистрирован: Пт окт 09, 2009 11:52 pm
- Скайп: kalia1962
- Пол: Мужской
- Откуда: Тбилиси
- Контактная информация:
Re: OCR - системы распознавания текста.
И-мен-но! "и делай с ними что хош..." ...лап-тапа-тида-ту-дай...razor писал(а):в общем, djvu - не проблема...:)
Mожно надергать нужных страниц djvu в те же png jpeg tiff bmp gif при помощи WinDjView... и делай с ними что хош...:)
[BBvideo 425,350]http://www.youtube.com/watch?v=nkVbfulgyuA[/BBvideo]
Крокодил, крокожу и крокодить буду!
Re: OCR - системы распознавания текста.
Спасибо большое за эту инфу! Действительно, очень важная штучка, нужно будет под линухом попробовать.