Отзыв на магистерскую диссертацию студентки 6 курса факультета ПМ-ПУ СПбГУ Мироновой Полины Николаевны на тему «Логистическая регрессия в медицине» Направление 01.04.02 Прикладные математика и информатика Магистерская программа «Прикладная математика и информатика в задачах медицинской диагностики» Задача настоящей магистерской диссертации заключается в построении логистической модели с оптимальным количеством предикторов и оптимальным порогом отсечения при классификации пациентов с подозрением на сахарный диабет. В качестве математической модели рассматривается бинарная логистическая регрессия с неизвестными коэффициентами. Оценка этих коэффициентов осуществлялась методом максимального правдоподобия с использованием случайного поиска в сочетании с градиентным методом. Обучающей выборкой являлись данные, полученные из Национального института диабета, болезней органов пищеварения и почек (США). Проверка гипотез о значимости коэффициентов регрессии позволила исключить из логит-модели три незначимых предиктора. При использовании ROC-анализа была проведена оценка модели и уточнение порога отсечения группы пациентов на два класса: здоров/болен. По проведенному в настоящей работе ROC-анализу оптимальный порог отсечения получился равным 0.32. Миронова Полина Николаевна начала исследования с одного предиктора. Далее рассматривались два предиктора, семь и оптимальное число предикторов – четыре. С добавлением предикторов качество логит-моделей возрастает, однако при исключении трех статистически незначимых предикторов, точность модели понизилась всего на 0.2%. По сравнению с порогом отсечения 0.5 при оптимальном пороге отсечения 0.32 специфичность понизилась, но чувствительность возросла. Это дает возможность избежать ошибок I рода. В диагностике диабета следует выбрать наиболее чувствительную модель, так как гипердиагностика не приведет к серьезным последствиям, а вот при использовании модели с высокой специфичностью можно не выявить вовремя опасную, но излечимую болезнь. Представленная модель используются в медицине и в скоринге. На примере определенной выборки пациентов по результатам данной диссертации можно наглядно проследить, как происходит разделение пациентов на две группы – «больные» и «здоровые». Причем при оптимальном пороге отсечения в группу «больных» могут попадать не только истинно больные пациенты, но и пациенты с повышенным риском наличия заболевания. Результаты исследований, проводимых в диссертации Мироновой Полиной Николаевной, сопровождаются многочисленными таблицами и рисунками с их описанием и выводами. Настоящая работа прошла апробацию на 48 международной научной конференции аспирантов и студентов “Процессы управления и устойчивость”, 3-6 апреля 2018 г. Диссертации Мироновой Полины Николаевны оформлена с учётом требований к магистерской диссертации и на достаточно высоком научном уровне. Считаю, что магистерская диссертация Мироновой Полины Николаевны заслуживает оценки “отлично”.