Общий хайп вокруг нейросетей и их природы несколько перегрет. Да, нейросети способны быстро создавать контент или искать ответы на вопросы. Но что делает их работу действительно ценной, так это применение для комплексных задач. Нейросеть решающая задачи существования и модификации всего, что имеет отношение к живой материи уже запущена в работу.
Еще 5 лет назад разговоры вокруг анализа генома, CRISPR технологий и нейросетей были чем-то вроде околонаучной фантастики. Чего стоит фильм со Скалой «Рэмпейдж», где завязка сюжета в тестировании потенциала CRISPR. Однако, уже сегодня человеку открыт широкий спектр инструментов для улучшения некоторых своих качеств. О них и рассказывают материалы телеграм канала. Подписывайтесь, чтобы первыми получать свежие статьи!
Нейросеть решающая задачи существования жизни
Статья написана по материалам исследования. Инновационная нейросеть от Google DeepMind генерирует не только структуру белков, лигандов, ДНК, РНК и «молекул всех форм жизни», но и предсказывает принципы их связи. Это обещает радикальное, революционное ускорение во многих областях науки.
Особенности работы с белками в науке
Схематическая демонстрация сложности в работе с аминокислотами и белками
Белки — одно из самых универсальных изобретений природы. Эти важнейшие строительные блоки всех живых организмов, на которых держатся практически все химические реакции в организме. Белки регулируют экспрессию генов, поддерживают иммунную систему, составляют основные структурные элементы всех клеток и образуют основные компоненты мышц.
При этом, самих белков существует невероятно много. Если пытаться наугад синтезировать их в лаборатории, то процесс займет миллиарды лет. Но можно моделировать процессы, если использовать вычислительные системы. Хотя потребуется невероятно огромное количество мощностей для перебора. Тем более, что вычислительная мощность становится сегодня едва ли не мерилом чего-то божественного, если вдаваться в фундамент датаизма.
Сейчас для этого используются суперкомпьютеры, или подпроекты BOINC. Я сам использовал до последнего старый ноут для расчета заданий в Rosetta@home. Однако, даже если все люди мира запустят проект на своих устройствах, эта работа займет достаточно много времени.
Чем нейросеть решающая задачи отличается от перебора вариантов?
И почему новая нейросеть называется AlphaFold? Суть в том, что белки представляют собой цепочки аминокислот, которые спонтанно складываются, образуя трехмерную структуру. Важны не только компоненты, но и то, как они складываются и связываются друг с другом. В этом случае, форма напрямую влияет на биологические функции белка.
Говоря о белках, можно анализировать их компоненты и последовательность на бумаге, но если вы не знаете их трехмерную форму, вы не сможете предсказать, что белки будут делать и как они будут взаимодействовать с другими молекулами.
Если говорить цифрами, то на сегодня известно про существование более 200 миллионов белков. И только 170 000 белков разобрано до понимания базовых принципов. Зная аминокислотный состав и способы формирования структур, имеет смысл использовать продукт прогресса, по крайней мере за это ратуют идеи датаизма. Здесь на свет и выходит нейросеть решающая задачи существования жизни, чтобы ускорить этот процесс. Ведь до появления AlphaFold программы не могли предсказывать структуру белка так же точно, как экспериментальные методы, основанные на использовании человека.
Небольшой экскурс в историю. Как развивалась нейросеть решающая задачи фундаментальных жизненных процессов?
Здесь смоделирован белок шипа вируса простуды
AlphaFold 2, выпущенный в 2021 году, стал прорывом, изменившим методологию. Нейросеть предсказала трехмерные структуры почти каждого белка в человеческом организме и помогла в реализации научных исследований. Менее чем за три года нейросеть использовалась исследователями во всем мире для ускорения открытий в области лечения рака, вакцин против малярии , создания ферментов, разъедающих пластик, и бесчисленного множества других проектов. На сегодня Alphafold 2 насчитывает более 14 000 упоминаний в научных статьях.
Итак, чем лучше AlphaFold 3? Новая версия выходит за рамки простого предсказания структуры и характера взаимодействия белков и включает в себя все базовые элементы живых организмов: от множества белков до ДНК, РНК и низкомолекулярных лигандов.
Большинство лекарств это лиганды, которые связываются с белками, меняя принципы их работы.
Нейросеть решающая задачи всестороннего моделирования становится по сути беспрецедентным ресурсом для моделирования того, как конкретные белки в организме будут взаимодействовать с конкретными молекулами лекарств. Датаизм в чистом виде.
Природа данных и архитектура
Розовым и синим показано смоделированное воздействие белка на ДНК. А серым показано то, как это происходит в жизни
Чтобы достичь таких возможностей, AlphaFold 3 был обучен на глобальных данных о молекулярной структуре, хранящихся в банке данных белков. Представители компании Deepmind утверждают, что нейросеть может обрабатывать более 99% всех известных биомолекулярных комплексов из упомянутой базы данных. Кроме того, был улучшен модуль Evoformer — архитектура, которая лежала в основе AlphaFold 2.
Вот как работает нейросеть решающая задачи трехмерного моделирования простыми словами.
AlphaFold 2 берет введенную аминокислотную последовательность.
Ищет в базах данных аналогичные последовательности, уже идентифицированные в других живых организмах.
Извлекает всю необходимую информацию с помощью преобразователя Evoformer. Воплотившего в себе философию датаизма.
Передает эту информацию нейронной сети, которая создает трехмерную структуру — длинный список координат, представляющих положение каждого атома белка, включая боковые цепи.
Новый и улучшенный Evoformer собирает свои структурные прогнозы с использованием диффузионной сети, подобной той, на которой работают нейросетевые генераторы изображений.
Как объясняет DeepMind в анонсе AlphaFold 3
Все начинается с облака атомов и через призму многих шагов процесс сводится к своей окончательной, наиболее точной молекулярной структуре.
В недавнем интервью Тому Маккензи из Bloomberg генеральный директор и соучредитель Google DeepMind, а также генеральный директор и основатель Isomorphic Labs, Демис Хассабис обсудил последствия использования AlphaFold 3 в разработке лекарств.
Святой Грааль открытия лекарств — это не просто знание структуры белка, что и делал AlphaFold 2, но и фактическая разработка лекарственных соединений, называемых лигандами, которые связываются с поверхностью белка. Важно знать, где лиганд связывается и насколько сильна новая связь, чтобы разработать правильный тип лекарственного соединения. Таким образом, AlphaFold 3 — это большой шаг в этом направлении предсказания связывания белка с лигандом и того, как это взаимодействие будет работать.
Потенциал AlphaFold 3
В январе 2024 года Isomorphic Labs объявила о стратегическом партнерстве с фармацевтическими гигантами Eli Lilly и Novartis общей стоимостью около 3 миллиардов долларов США. Но что удивительно, так это сроки производства лекарств, которые, как ожидается, станут результатом этого партнерства.
Итак, мы уже работаем над реальными программами. И я ожидаю, что, возможно, в ближайшие пару лет в клиниках появятся первые лекарства, разработанные с помощью нейросетей. Если вы спросите меня, что самое важное, что может создать нейросеть для человека, так по мне – это лекарство для избавления от сотен ужасных болезней. Я не могу представить лучшего варианта использования нейросетей. Так что отчасти это и есть Мотивация Isomorphic и AlphaFold, а также всей нашей научной работы. Смысл того, что мы делаем.
В ходе испытаний AlphaFold 3 продемонстрировал современную точность в прогнозировании лекарственных взаимодействий, включая белки, связанные с лигандами, и антитела, связанные с белками-мишенями.
Использование теста PoseBusters показало, что AlphaFold 3 на 50% точнее лучших существующих методов — без необходимости ввода какой-либо структурной информации. Справка: PoseBusters проверяет химическую и физическую достоверность молекулярных и белково-лигандных «поз», созданных с помощью модели глубокого обучения.
Нейросеть решающая задачи на уровне форм жизни. Можно ли её использовать?
Также, вы сами можете затестить нейросеть. AlphaFold 3 доступен через AlphaFold Server , который включает в себя базу данных из 200 миллионов белковых структур. Этот феноменальный ресурс доступен бесплатно ученым, проводящим некоммерческие исследования, а также просто любопытным пользователям Интернета по всему миру.
Прогнозирование поведения группы белковых структур без такого инструмента может занять лет десять и обойтись в сотни тысяч долларов. AlphaFold 3 обещает радикально ускорить прогресс в областях биологии и фармацевтики.
Это ступень в дивный новый мир невероятно мощной медицины, или портал в преисподнюю с виртуозно отточенным оружием, способным ориентироваться на генетические маркеры? Сказать сложно. Мы стоим на грани технологической сингулярности и её потенциал велик, а плоды манят разум. Подробнее о них рассказывается в телеграм канале. Подписывайтесь, чтобы не пропустить новые статьи!