Данный проект направлен на решение задачи прогнозирования органического синтеза при помощи нейронных сетей. В работе использовался датасет, содержащий 149 510 реакций, из открытой базы данных патентов USPTO. Для разработки алгоритма мы использовали свойства катализаторов и растворителей, а также структурные характеристики реагентов. Мы провели сравнение нескольких архитектур, среди которых наиболее перспективной оказалась модель LSTM-RNN, точность предсказания которой составила 77%. Анализ важности дескрипторов показал, что наибольший вклад в предсказание продукта реакции оказывают дескрипторы, описывающие электронную структуру катализатора и молекулярную структуру растворителя. Полученные результаты позволят прогнозировать структуру продукта органического синтеза с высокой точностью с уче
Крюков А.Д. (науч. рук. Лавриненко А.К.) Разработка стратегии прогнозирования органического синтеза на основе машинного обучения // Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, [2023]. URL: https://kmu.itmo.ru/digests/article/11678