Подписывайся! Будь в курсе последних новостей
подписаться

Автор Администратор Сайта

МОСКВА, 22 мая. /Новости науки/. Ученые из Медицинской школы Икана при Mount Sinai разработали модель искусственного интеллекта, которая показывает, как гены работают вместе внутри клеток человека. Исследование опубликовано в журнале Patterns.

Новая модель получила название GSFM — Gene Set Foundation Model. Ее можно перевести как «фундаментальная модель генных наборов». Она анализирует не отдельные гены, а группы генов, которые вместе участвуют в биологических процессах.

Авторы сравнивают принцип ее работы с большими языковыми моделями. Такие системы учатся понимать значение слов по контексту. GSFM похожим образом учится понимать «значение» генов по тому, с какими другими генами они встречаются в разных клеточных ситуациях.

По словам исследователей, один и тот же ген может играть разные роли в разных условиях. Поэтому простого списка генов часто недостаточно. Нужно понимать, какие связи возникают между ними в конкретном биологическом контексте.

Для обучения GSFM ученые собрали миллионы наборов генов из опубликованных научных работ и массивов данных по экспрессии генов. В общей сложности модель использовала данные из сотен тысяч независимых исследований.

Систему обучали как модель для решения задачи с пропущенными элементами. Ей давали часть набора генов и просили предсказать недостающие гены. Со временем она научилась находить скрытые закономерности в том, как гены группируются и взаимодействуют.

Проверка показала, что GSFM может находить связи между генами и функциями генов. В том числе модель смогла предсказывать некоторые связи до того, как их подтвердили экспериментально. Для этого ее обучали на публикациях до определенной даты, а затем проверяли на открытиях, которые появились позже.

Авторы считают, что GSFM может помочь изучать плохо понятные гены без немедленных лабораторных экспериментов. Модель также может выделять гены, связанные с болезнями, предлагать новые мишени для лекарств и помогать искать биомаркеры.

Отдельное применение связано с анализом обогащения генных наборов. Это один из стандартных методов молекулярной биологии, который помогает понять, какие биологические процессы активны в клетках по данным экспериментов.

В будущем команда хочет объединить GSFM с другими фундаментальными моделями ИИ. Один из вариантов — связать ее с языковыми моделями, чтобы система могла объяснять функции генов обычным языком. Еще одно направление — объединение с моделями, которые изучают лекарства и их действие на клетки.