Люди не должны ходить строем. ИИ в генетике и не только
Доктор физико-математических наук Всеволод Макеев.
Искусственный интеллект сегодня применяется во всех областях науки и жизни. О том, почему он стал незаменимым и какие тут есть опасности, рассуждает член-корреспондент РАН Всеволод Макеев, доктор физико-математических наук.
Искусственный интеллект сегодня применяется во всех областях науки и жизни. О том, почему он стал незаменимым и какие тут есть опасности, рассуждает член-корреспондент РАН Всеволод Макеев, доктор физико-математических наук, главный научный сотрудник Института общей генетики РАН им. Н. И. Вавилова и Института биохимии и генетики УФИЦ РАН.Беседу ведёт Наталия Лескова.
— Итак, искусственный интеллект в генетике. Какие он даёт новые возможности?
— Генетика — это наука, которая изучает наследование разных признаков. Признаки, особенно интересные для человека, — это признаки самого человека: особенности телосложения, поведения, предрасположенность к болезням. Можно ещё говорить о приложениях генетики, например, о генетике животных и растений, когда изучаются признаки, ценные для нашей хозяйственной деятельности. И, наконец, такая важная вещь, как генетика охраны природы: надо сохранять генетическое разнообразие для видов с очень малой численностью. Если генетическое разнообразие станет слишком низким, сохранить вид не получится.
Генетические данные, включая последовательности ДНК — генотипы и различные характеристики организмов — фенотипы, являются одним из наиболее объёмных типов данных в настоящее время. По своему объёму такие данные сравнимы с изображениями и «социальными данными» (типа транзакций в банках, использования мобильных телефонов, социальных сетей и т. д.). Так что без современных компьютерных технологий с подобными данными нереально работать. Прогресс компьютерных алгоритмов постоянно даёт новые возможности, и их нельзя недооценивать. Можно выделять фенотипические признаки, которые раньше были практически недоступны. Это могут быть признаки, которые возникают из компьютерного анализа изображений — например микроскопических изображений. Недавно в Петербурге была сделана интересная работа. Её автор Екатерина Пчицкая из Института биомедицинских систем и биотехнологий СПбПУ вместе с сотрудниками разработала метод анализа количества и расположения шипиков на окончаниях нейронных отростков-дендритов в мозге. Это, оказывается, довольно важный признак для диагностики ряда нервно-психиатрических синдромов. Раньше он был для работы практически недоступен, потому что нужно было вручную эти шипики на микрофотографиях считать, а сейчас, путём компьютерного анализа изображений, делать это стало намного проще и быстрее.
— Каким образом происходит такой подсчёт?
— Изображения можно анализировать, выделяя контуры, — современные нейронные сети это хорошо умеют делать. Дальше для выделения конкретных признаков делают более сложные преобразования: например, коллеги из Петербурга, которые изучали шипики, проводили прямые линии, соединяющие точки контура отростка нейрона, и было понятно, где гладкий участок дендрита, а где дендрит с шипиками.
— Но ведь анализом изображений занимаются уже лет сорок…
— Если не пятьдесят. Но есть и совершенно новые направления развития науки в этой области. Сейчас термин «искусственный интеллект» обычно используют для методов, связанных с большими языковыми моделями (Large Language Models, LLM). Относительно простые примеры использования языковых моделей — это системы перевода с языка на язык. Система читает текст на одном языке и генерирует текст на другом. Вариантом является автоматическое написание компьютерного кода, компьютерных программ. Тогда система будет читать описание задачи на «человеческом языке» и генерировать текст на языке, понятном машине, — компьютерную программу на языке программирования...
Продолжение статьи читайте в номере журнала

