Ocr

  • Автор темы Автор темы D!m@n
  • Дата начала Дата начала
D

D!m@n

Добрый день, уважаемые участники!

Скажите, пожалуйста, есть ли бесплатная библиотечка OCR для .NET (или, в крайнем случае, COM)?
Распознавание русского языка не требуется (пока нужно распознавать только цифры).
В поиске был :D

Заранее большое спасибо!
 
.
 
Под девизом "спасение утопающих - дело рук самих утопающих" откопал, что Microsoft Document Imaging, входящий в состав MS Office, предоставляет COM-интерфейс для распознавания текста.
И, к слову говоря, само распознавание выполняет очень даже не дурно. Конечно, не FineReader, но хотя бы что-то.

Пример использования на C#:
Код:
			OpenFileDialog dlg = new OpenFileDialog();
dlg.DefaultExt = "tif";
dlg.Filter = "TIFF|*.tif";
if (dlg.ShowDialog() == DialogResult.OK)
{
MODI.DocumentClass doc = new MODI.DocumentClass();
doc.Create(dlg.FileName);

doc.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);

MODI.Image modiImg = (MODI.Image)doc.Images[0];
MODI.Layout layout = modiImg.Layout;

doc.Close(false);

string sRecognized = layout.Text;
MessageBox.Show(sRecognized);
}

Предварительно к проекту необходимо подключить библиотеку mdivwctl.dll.
Надеюсь, кому-то пригодится...
 
Мы в соцсетях:

Взломай свой первый сервер и прокачай скилл — Начни игру на HackerLab

🚀 Первый раз на Codeby?
Гайд для новичков: что делать в первые 15 минут, ключевые разделы, правила
Начать здесь →
🔴 Свежие CVE, 0-day и инциденты
То, о чём ChatGPT ещё не знает — обсуждаем в реальном времени
Threat Intel →
💼 Вакансии и заказы в ИБ
Pentest, SOC, DevSecOps, bug bounty — работа и проекты от проверенных компаний
Карьера в ИБ →

HackerLab