Показать сообщение отдельно
  #20  
Старый 16.03.2011, 00:28
гocть

 
Сообщений: n/a

не понял вопроса

приведенная формула просто сумма квадратов ошибок сети на всех обучающих примерах. вы ее оптимизируете каким-нибудь итерационным методом. это один вариант.

другой вариант - брать примеры по одному, считать градиент на одном примере и делать шаг градиентного спуска. по выборке нужно много раз пройтись, пока не сойдется. так работает стандартный backpropagation.

оба варианта - итеративные алгоритмы, на каждом шаге меняющие весь вектор весов. для предсказания берите либо последний вектор, как сойдется, либо для каждого шага считайте оценку качества предсказания на независимой выборке и берите там, где было лучше всего.