|
Очистка от шума
Пусть имеется набор точек в которых известно значение некоторой величины. В наборе может быть от нескольких тысяч до нескольких миллионов точек.
Если построить статистическое распределение с равным шагом (посчитать число точек в которых значение функции попадает в определенный интервал) - получится очень острый "колокол". Из этого колокола обычно "выпадают" несколько десятков точек - в них значения функции в деятки-сотни раз отличаются от нормальных.
Как грамотно автоматически очистить набор от этого шума с минимальными затратами?
Сейчас, в имеющейся программе, это делает человек. Просто смотрит какие точки имеют явно выбивающиеся значения и выбрасывает их.
Но хотелось бы это грамотно автоматизировать.
Спасибо.
|