Большая награда ускоряет обучение

…а также уменьшает разницу между более способными и менее способными – по крайней мере, у мышей.

Обучение предполагает регулярные тренировочные и проверочные задания – теория без практики мало чего стоит. Либо сам предмет обучения таков, что ему можно выучиться только в постоянной практике. Скажем, езда на велосипеде не предполагает теории, и вот мы раз за разом садимся на него, пытаясь удержать равновесие и одновременно крутить педали. В конце концов у нас начинает что-то получаться, и мы чувствуем некоторое удовлетворение. При этом в мозге у нас работает знаменитая система подкрепления, или система награждения – группа нервных центров, которые заставляют предвкушать награду за выполненное дело. Наградой может быть сам результат – мы чувствуем удовольствие от того, что чему-то научились, или же деньги, еда и пр.

(Иллюстрация GigaChat)

Очевидно, что чем больше ты будешь тренироваться, тем лучше выучишься. Это хорошо видно в нейробиологических и поведенческих экспериментах, в которых изучают обучение и работу системы подкрепления. Львиную долю таких экспериментов ставят на грызунах, которых приходится стимулировать наградой. Например, мышей учат нажимать на правильный рычаг или кнопку: нажав на неё, они получают угощение, вроде сиропа, или же просто порцию воды, только для этого у них заранее нужно вызывать жажду. И вот спустя множество попыток, после которых они получают – или не получают – небольшую порцию воды, мыши выучивают то, что от них хотят.

Сотрудникам Медицинского института Говарда Хьюза пришло в голову проверить, что получится, если небольшую награду заменить на большую. Например, чтобы в случае правильного действия мышь получала воды не на один глоток, а на несколько глотков. Оказалось, что в этом случае мыши учатся намного быстрее – вместо нескольких недель их можно выучить буквально за день. Более того, с большой наградой уменьшалась разница между более способными и менее способными особями. С небольшой наградой одна мышь могла выучиться правильным действиям, например, за неделю, другая за месяц, но если награда увеличивалась, то у обеих на обучение уходило несколько дней.

В статье в Science говорится, что увеличенная награда помогала усвоить больше «учебного материала» в ходе одного занятия-сеанса, помогала помнить усвоенное между занятиями и в целом повышала заинтересованность мышей в обучении. В мозге это сопровождалось более длительным дофаминовым сигналом в системе подкрепления. Если короткий дофаминовый сигнал, сопутствующий небольшой награде, искусственным образом продлевали, то эффект получался такой же, как при награде увеличенной. Если такая же закономерность, связывающая размер награды и скорость обучения, имеет место и у людей, то тут открываются широчайшие перспективы в смысле новых преподавательских подходов, новых методов, стимулирующих память и мотивацию, и пр. (Впрочем, не исключено, что опытные воспитатели, преподаватели и просто родители про эту закономерность и так давно знают.)

Однако не стоит забывать, что обучение – процесс сложный, и награда здесь далеко не всегда нужна. Так, в прошлом году мы писали, что можно учиться без нужды, когда никакого поощрения не предполагается вовсе. А ещё раньше мы рассказывали о похожем исследовании, в котором обучение происходило на постоянных колебаниях нейромедиаторов дофамина и ацетилхолина, и этих колебаний опять же было достаточно, чтобы обойтись без награды. И заодно можно вспомнить случаи, когда награда работает наоборот, то есть мешает мозгу воспринимать то, чему его учат.

31 мая 2026

Автор: Кирилл Стасевич

Товар добавлен в корзину