Изображение сначала надо сегментировать на отдельные цифры. Если шума нет, то это можно просто сделать, выделяя связные компоненты пикселей.
|
Цитата:
|
|
цифры из системных шрифтов и размера от 20 до 50.
|
Если шрифты фиксированные и заранее известны, то лучше всего будет просто сопоставлять с образцами. Масштабируешь цифру с изображения и цифры из шрифтов, чтобы были одинакового размера, считаешь степень похожести (например, число одинаковых пикселей в одинаковых местах).
|
Цитата:
|
Ну еще как вариант нейронные сети... , но овчинка выделки не стоит..
|
для методов машинного обучения тебе всё равно придется все то же самое проделывать - нарезать кучу картинок из своих шрифтов и масштабировать так, чтобы размеры везде были одинковые. Плюс прикручивать и тюнить алгоритм обучения.
нейросети уже давно не в моде. Сегодня стандартный baseline - SVM.