Учёные из Биотехнологического центра (BIOTEC) Дрезденского технического университета разработали GROVER — новую большую языковую модель, которая способна расшифровывать сложную информацию, скрытую в человеческом геноме. Модель анализирует ДНК как текст, извлекая функциональную информацию о последовательностях ДНК и преобразуя геномику.
Прорыв в изучении ДНК
GROVER рассматривает человеческую ДНК как язык, изучая её грамматику, синтаксис и семантику. Модель была обучена на эталонном геноме человека, что позволило ей понять правила и контексты последовательностей ДНК. Этот подход напоминает работу моделей GPT, которые изменили понимание человеческих языков.
Процесс создания и потенциал
Для обучения GROVER команда BIOTEC создала словарь ДНК, используя алгоритмы сжатия для анализа комбинаций букв, встречающихся чаще всего. Модель прошла 600 циклов обучения, что позволило ей эффективно предсказывать следующие последовательности ДНК. GROVER уже показала способность идентифицировать промоутеры генов и участки связывания белков, а также изучать эпигенетические процессы.
Влияние на геномику и медицину
"Понимание правил ДНК через языковую модель поможет раскрыть глубины биологического смысла, что будет способствовать развитию как геномики, так и персонализированной медицины", — говорит доктор Анна Пётч, руководитель исследовательской группы в BIOTEC. GROVER обещает революционизировать подход к изучению генетического кода и улучшить возможности персонализированной медицины.
Разработка GROVER — значительный шаг вперед в понимании генетического кода и его применения в медицине, что открывает новые горизонты для исследований и лечения, пишет sciencedaily.com 18+).