ЧатGPT
Фото: FlashMovie/Getty Images
Проведение программы проверки на наркотики похоже на организацию огромной коктейльной вечеринки и подслушивание ее хода. На коктейльных вечеринках так много светских разговоров, но лишь несколько содержательных разговоров. Аналогичным образом, в программах скрининга лекарств слабые взаимодействия лекарственного средства с мишенью значительно превосходят случаи связывания с высоким сродством.
Представьте себе, если бы вам пришлось выслушивать каждую шутку на коктейльной вечеринке. Конечно, это было бы утомительно. Теперь представьте, насколько хуже было бы оценивать каждое взаимодействие препарата с мишенью при типичном скрининге на наркотики. Да ведь это утомило бы даже самого терпеливого слушателя — типичная система искусственного интеллекта (ИИ).
К сожалению, обычным системам искусственного интеллекта требуется много времени, чтобы проанализировать данные о взаимодействии между кандидатами на лекарства и белками-мишенями. Большинство систем искусственного интеллекта рассчитывают трехмерную структуру каждого целевого белка на основе его аминокислотной последовательности, а затем используют эти структуры для прогнозирования, с какими молекулами лекарства он будет взаимодействовать. Подход является исчерпывающим, но медленным.
Чтобы продвинуться вперед, исследователи из Массачусетского технологического института и Университета Тафтса разработали альтернативный вычислительный подход, основанный на алгоритме искусственного интеллекта, известном как модель большого языка. Эти модели (одним из хорошо известных примеров является ChatGPT) могут анализировать огромные объемы текста и определять, какие слова (или, в данном случае, аминокислоты) с наибольшей вероятностью встречаются вместе. Большая языковая модель, разработанная командой MIT/Tufts, известна как ConPLex. Он может сопоставить целевые белки с потенциальными молекулами лекарств без необходимости выполнять трудоемкий этап расчета структуры молекул.
Подробности о ConPLex появились 8 июня в PNAS в статье под названием «Контрастное обучение в языковом пространстве белков предсказывает взаимодействие между лекарствами и белками-мишенями». ConPLex может использовать достижения в области предварительно обученных моделей белкового языка («PLex») и использовать контрастивное совместное встраивание, заякоренное в белках («Con»), чтобы превзойти самые современные подходы.
«ConPLex обеспечивает высокую точность, широкую адаптивность к невидимым данным и специфичность в отношении соединений-приманок», — пишут авторы статьи. «Он делает прогнозы связывания на основе расстояния между изученными представлениями, что позволяет делать прогнозы в масштабах огромных библиотек соединений и человеческого протеома».
Затем исследователи проверили свою модель, проверив библиотеку из около 4700 молекул-кандидатов на лекарство на предмет их способности связываться с набором из 51 фермента, известного как протеинкиназы.
Из лучших результатов исследователи выбрали 19 пар лекарство-белок для экспериментального тестирования. Эксперименты показали, что из 19 совпадений 12 имели сильное сродство связывания (в наномолярном диапазоне), тогда как почти все другие возможные пары лекарство-белок не имели сродства. Четыре из этих пар связываются с чрезвычайно высоким субнаномолярным сродством (настолько сильным, что даже крошечная концентрация лекарства, порядка частей на миллиард, ингибирует белок).
Хотя в этом исследовании исследователи сосредоточились в основном на скрининге низкомолекулярных лекарств, сейчас они работают над применением этого подхода к другим типам лекарств, таким как терапевтические антитела. Такое моделирование может также оказаться полезным для проведения скрининга токсичности потенциальных лекарственных соединений, чтобы убедиться в отсутствии нежелательных побочных эффектов перед их тестированием на животных моделях.
«Эта работа направлена на необходимость эффективного и точного in silico скрининга потенциальных кандидатов на лекарства», — сказала Бонни Бергер, исследователь Массачусетского технологического института и один из старших авторов нового исследования. «[Наша модель] позволяет проводить крупномасштабные скрининги для оценки нецелевых эффектов, перепрофилирования лекарств и определения влияния мутаций на связывание лекарств».
«Одна из причин, почему разработка лекарств обходится так дорого, заключается в том, что она имеет высокий процент неудач», — отметил Рохит Сингх, исследователь Массачусетского технологического института и один из ведущих авторов исследования. «Если мы сможем снизить процент неудач, заранее заявив, что этот препарат вряд ли сработает, это может иметь большое значение для снижения стоимости открытия лекарства».