ИИ составил «карту» совместной работы генов в клетках человека
Ученые из Медицинской школы Икана при Mount Sinai создали модель искусственного интеллекта GSFM. Она учится понимать, как гены работают в разных клеточных условиях, и может помочь искать биомаркеры, мишени для лекарств и причины болезней.
Источник: Новости науки.
МОСКВА, 22 мая. /Новости науки/. Ученые из Медицинской школы Икана при Mount Sinai разработали модель искусственного интеллекта, которая показывает, как гены работают вместе внутри клеток человека. Исследование опубликовано в журнале Patterns.
Новая модель получила название GSFM — Gene Set Foundation Model. Ее можно перевести как «фундаментальная модель генных наборов». Она анализирует не отдельные гены, а группы генов, которые вместе участвуют в биологических процессах.
Авторы сравнивают принцип ее работы с большими языковыми моделями. Такие системы учатся понимать значение слов по контексту. GSFM похожим образом учится понимать «значение» генов по тому, с какими другими генами они встречаются в разных клеточных ситуациях.
По словам исследователей, один и тот же ген может играть разные роли в разных условиях. Поэтому простого списка генов часто недостаточно. Нужно понимать, какие связи возникают между ними в конкретном биологическом контексте.
Для обучения GSFM ученые собрали миллионы наборов генов из опубликованных научных работ и массивов данных по экспрессии генов. В общей сложности модель использовала данные из сотен тысяч независимых исследований.
Систему обучали как модель для решения задачи с пропущенными элементами. Ей давали часть набора генов и просили предсказать недостающие гены. Со временем она научилась находить скрытые закономерности в том, как гены группируются и взаимодействуют.
Проверка показала, что GSFM может находить связи между генами и функциями генов. В том числе модель смогла предсказывать некоторые связи до того, как их подтвердили экспериментально. Для этого ее обучали на публикациях до определенной даты, а затем проверяли на открытиях, которые появились позже.
Авторы считают, что GSFM может помочь изучать плохо понятные гены без немедленных лабораторных экспериментов. Модель также может выделять гены, связанные с болезнями, предлагать новые мишени для лекарств и помогать искать биомаркеры.
Отдельное применение связано с анализом обогащения генных наборов. Это один из стандартных методов молекулярной биологии, который помогает понять, какие биологические процессы активны в клетках по данным экспериментов.
В будущем команда хочет объединить GSFM с другими фундаментальными моделями ИИ. Один из вариантов — связать ее с языковыми моделями, чтобы система могла объяснять функции генов обычным языком. Еще одно направление — объединение с моделями, которые изучают лекарства и их действие на клетки.
Новая модель получила название GSFM — Gene Set Foundation Model. Ее можно перевести как «фундаментальная модель генных наборов». Она анализирует не отдельные гены, а группы генов, которые вместе участвуют в биологических процессах.
Авторы сравнивают принцип ее работы с большими языковыми моделями. Такие системы учатся понимать значение слов по контексту. GSFM похожим образом учится понимать «значение» генов по тому, с какими другими генами они встречаются в разных клеточных ситуациях.
По словам исследователей, один и тот же ген может играть разные роли в разных условиях. Поэтому простого списка генов часто недостаточно. Нужно понимать, какие связи возникают между ними в конкретном биологическом контексте.
Для обучения GSFM ученые собрали миллионы наборов генов из опубликованных научных работ и массивов данных по экспрессии генов. В общей сложности модель использовала данные из сотен тысяч независимых исследований.
Систему обучали как модель для решения задачи с пропущенными элементами. Ей давали часть набора генов и просили предсказать недостающие гены. Со временем она научилась находить скрытые закономерности в том, как гены группируются и взаимодействуют.
Проверка показала, что GSFM может находить связи между генами и функциями генов. В том числе модель смогла предсказывать некоторые связи до того, как их подтвердили экспериментально. Для этого ее обучали на публикациях до определенной даты, а затем проверяли на открытиях, которые появились позже.
Авторы считают, что GSFM может помочь изучать плохо понятные гены без немедленных лабораторных экспериментов. Модель также может выделять гены, связанные с болезнями, предлагать новые мишени для лекарств и помогать искать биомаркеры.
Отдельное применение связано с анализом обогащения генных наборов. Это один из стандартных методов молекулярной биологии, который помогает понять, какие биологические процессы активны в клетках по данным экспериментов.
В будущем команда хочет объединить GSFM с другими фундаментальными моделями ИИ. Один из вариантов — связать ее с языковыми моделями, чтобы система могла объяснять функции генов обычным языком. Еще одно направление — объединение с моделями, которые изучают лекарства и их действие на клетки.