логотип ИФАВа
a



Главная           Карта сайта      Контакты       

Лаборатория фталоцианинов и их аналогов

Толбин Александр Юрьевич
доктор химических наук,
профессор РАН

E-mail: tolbin@ipac.ac.ru
Телефон: +7 (49652) 42566


Эффективный метод поиска корреляционных соотношений между неограниченным набором данных для создания предсказательных моделей – Correlato

Исследование выполнялось при финансовой поддержке РНФ 21-73-20016. Автор выражает благодарность Межведомственному суперкомпьютерному центру РАН (МСЦ РАН, www.jscc.ru) за предоставленные вычислительные ресурсы.

 Ученые оперируют различными характеристиками исследуемых объектов. Для каждого исследования может существовать множество различных параметров, описывающих систему. Например, интенсивность спектральной полосы, равновесная концентрация, коэффициент кумуляции, летальная доза, порог избирательного действия и т.д. И между этими характеристиками нужно найти внутренние взаимосвязи, чтобы ответить на вопросы: 1) что на что влияет и 2) можно ли предсказать к.-л. свойство на основе некоторого набора молекулярных дескрипторов?

 Предлагается простой, надежный и высокопроизводительный алгоритм, который позволит любому исследователю существенно сэкономить свои ресурсы и сосредоточиться на создании конкретных моделей, описывающих поведение исследуемых объектов.

 Написана расчетная программа CORRELATO с поддержкой Intel MPI интерфейса. На выходе пользователь имеет серию 2D диаграмм, а опция детального анализа позволяет выявить т.н. «выбросы» – элементы, мешающие сходимости к заданным критериям. Это могут быть ошибочные признаки (столбцы) или экспериментальные ошибки (строки). Разработанный алгоритм работает очень быстро. Так, для ограниченной серии из пяти фталоцианинов для выполнения 10 000 итераций требуется не более 1 минуты на одном процессоре.

 Реализованный алгоритм не требует знаний в области математической статистики и иных специальных дисциплин. Возможно практическое решение любой задачи: результат ограничен лишь фантазией исследователя по части выбора признаков, определяющих поведение модели. Создание «forecasting» моделей теперь стало доступным для широкого круга исследователей.

 Для демонстрации работы алгоритма предлагается упрощенный вариант программы Correlato для 64 бит Windows.