Лингвистическая тень нейросетей
Эльвира Еникеева, лингвист
История языка — это история непрерывных изменений, отражающих мировоззрение, культуру и технологии каждой эпохи.
История языка — это история непрерывных изменений, отражающих мировоззрение, культуру и технологии каждой эпохи. В начале XXI века развитие цифровых технологий и увеличение темпов обмена информацией привели к тому, что языковые инновации распространяются не за поколения, а за месяцы.
С конца 2022 года, когда на цифровую сцену ворвался ChatGPT, а следом и множество других текстовых нейросетей, искусственный интеллект стал незримым соавтором в самых разных ситуациях: от составления делового письма до написания школьного сочинения.
Исследование, опубликованное в журнале Smart Learning Environments*, показало, что студенты, использовавшие ИИ в качестве ассистента, смогли улучшить связность своих работ, обогатить словарный запас и отточить грамматику.
Для людей, изучающих иностранный язык, сгенерированный текст служит образцом, своего рода неутомимым репетитором.
Поначалу казалось, что мы получили лишь удобный инструмент, своего рода продвинутый текстовый редактор. Однако сегодня исследователи всё чаще говорят о куда более глубоком и неочевидном влиянии: нейросети не просто помогают составлять письма, отчёты, доклады, другие тексты — они активно формируют наш стиль письма и даже устную речь. Мы наблюдаем глобальный лингвистический сдвиг, происходящий в реальном времени!
Механизм этого влияния прост и в то же время всеобъемлющ. Генеративные модели обучаются на колоссальных массивах текстовых данных, включающих миллиарды слов и фраз из книг, статей и веб-сайтов — всего, что доступно в интернете. Это, как правило, выверенные, отредактированные тексты с нейтральной интонацией и формализованным способом изложения, предназначенным для широкой аудитории.
В результате нейросеть усваивает и воспроизводит наиболее усреднённые, статистически вероятные языковые конструкции. Она выдаёт текст без грамматических ошибок, но и без той «живой» структуры, которая свойственна человеческой речи, использует клишированные фразы. Например, в немецком ИИ часто используют формальный вывод: Zusammenfassend lasst sich sagen (подводя итог, можно сказать), который в живой речи практически не используется.
Как подметил Джон Клейнберг, специалист по информатике из Корнеллского университета (США), язык ChatGPT заразителен, поскольку его уверенный и авторитетный тон подсознательно привлекает пользователей**.
Это «заражение» уже можно измерить. Исследователи из Института человеческого развития Общества Макса Планка, проанализировав 740 тысяч часов видео и подкастов различной тематики, выявили яркую закономерность: в беседах стали чаще встречаться слова, характерные для ответов, сгенерированных ИИ, например delve (углубляться, вникать), meticulous (тщательный, дотошный), pivotal (ключевой), explore (исследовать)***. С момента широкого распространения ChatGPT частота употребления слова delve в текстах подскочила на 51%. Язык как экосистема всегда выравнивается по самому громкому источнику, и сегодня этим источником стали нейросетевые алгоритмы.
По мере того как ИИ становится повседневным соавтором, мы рискуем утратить нечто ценное — собственный, уникальный язык. Когда электронные письма, публикации в социальных сетях и даже личные сообщения начинают пестреть одинаковыми оборотами в стиле GPT, грань между индивидуальным и синтетическим стирается. Тексты теряют интонацию, присущую каждому человеку, и обезличиваются.
Более серьёзную тревогу вызывает проблема языкового разнообразия. Большин-ство крупных языковых моделей изначально обучались на английском, причём по умолчанию они используют стандартный американский вариант (Standard American English), то есть так называемый эталонный американский английский, который, наравне со стандартным британским, считается «нейтральным». Это приводит к постепенной эрозии региональных диалектов и культурных идиом. Недавнее исследование Корнеллского университета продемонстрировало, как под влиянием ИИ стиль письма носителей индийского английского становится всё более американизированным.
Подобные тенденции наблюдаются и в других языках. Генерируемый большими языковыми моделями не-английский (например русский) текст часто представляет собой кальку с английского синтаксиса. Например, в русскую речь проникают такие фразы, как «почему это проблема?», вытесняя более естественное «в чём дело?». Вместо простых глаголов «изучить» или «разобраться», тексты наполняются призывами «погрузиться» или «вникнуть» (прямая калька с английского delve). Обычное «понимание ситуации» превращается в громоздкое «ориентирование в ландшафте» (navigate the landscape), а вместо слова «показывать» всё чаще используется тяжеловесная «демонстрация» (showcasing).
В этот же «синтетический» словарь перекочевали слова «ключевой» (как аналог вездесущего pivotal) и «нарратив» (вместо русских понятий «история» или «повествование»). «Английское мышление» нейросетей влияет даже на грамматику: в текстах появляется избыточность притяжательных местоимений. Там, где русский язык подразумевает принадлежность по контексту («она взяла сумку в руку»), ИИ, копируя английскую структуру (she took her bag in her hand), навязывает конструкцию: «она взяла свою сумку в свою руку» (либо, ещё хуже, «она взяла её сумку в её руку»).
В русском языке влияние ИИ на язык заметно даже на уровне прямой частот-ности упоминаний. По данным аналитики социальных сетей и СМИ компании «Медиалогия», в 2025 году абсолютным лидером по употреблению слов в сети стала аббревиатура «ИИ». За неполный год она встретилась в сообщениях более 22 миллионов раз, вытесняя другие термины.
Кроме того, по всему миру люди, часто взаимодействующие с ИИ, перенимают его склонность к избыточно длинным и развёрнутым ответам там, где хватило бы пары слов.
В самой идее подражания доминирующему стилю нет ничего нового. Язык всегда отражал дух времени, и такая тенденция циклична. Во времена Шекспира авторы следовали канонам драматургии и откровенно заимствовали друг у друга не только стили написания пьес, но и сами пьесы; в эпоху Дефо все писали романы о путешествиях (и он удачно опубликовал своего «Робинзона Крузо», исходя из того, что это востребованный жанр). Каждое поколение формировало свою манеру выражения под влиянием школы, литературы и культурного контекста. Сегодня этот контекст, этот «воздух времени» пропитан языком нейросетей.
Парадокс в том, что их влиянию подвержены даже те, кто никогда не открывал окно чат-бота. Мы читаем сгенерированные посты, статьи и комментарии в общедоступных статьях или письмах знакомых и подсознательно впитываем их ритм и синтаксис. Речь становится более структурированной, «правильной», но при этом теряет живость, непосредственность, индивидуальность и эмоциональные полутона. Возникает новый гибридный культурный стиль, в котором всё труднее отличить живое письмо от синтетического. Происходит тихая подмена: теперь уже не мы обучаем нейросети, а они — нас. Мы начинаем мыслить и говорить их языком, зачастую даже не замечая этого.
Комментарии к статье
* Li Y., Zhou X., Yin Hb. et al. Design language learning with artificial intelligence (AI) chatbots based on activity theory from a systematic review. Smart Learn. Environ. 12, 24 (2025).
** Caswel A., www.tomsguide.com/ai/new-study-reveals-chatgpt-is-changing-how-we-talk-text-and-write-heres-how.
*** Yakura H. et al. Empirical evidence of Large Language Model’s influence on human spoken
communication // arxiv.org/pdf/2409.01754.
Читайте в любое время

