Рецензия на бакалаврскую работу Григорьевой Ирины Владимировны “Канонический анализ категориальных данных с приложением в маркетинге” Работа Григорьевой Ирины посвящена задаче исследования зависимости между двумя наборами номинальных признаков. Подобная задача часто встречается на практике в биологии, медицине, социальных и экономических науках. Обсуждаемая работа посвящена изучения связи между характеристиками инновационных проектов и их деятельностью и успехом спустя один год. В качестве меры зависимости переменных предлагается использовать коэффициент неопределенности. В дополнение к выявлению наиболее сильных связей применяется симптомально­синдромальный подход для нахождения устойчивых сочетаний признаков в смысле уменьшения количества значимых связей при их исключении из совокупностей, названных номинативными представителями. Из недостатков работы стоит отметить то, что ее текст не всегда выдержан в академическом стиле и приближается к разговорному. Недостаточно хорошо изучена имеющаяся литература, не приведены примеры похожих задач и подходов, применяющихся в их решении. Экстремальное распределение в таблице 2.11 вероятно является следствием ошибки в исходных данных или на каком­то этапе их обработки. Автору следовало как минимум прокомментировать эти результаты. Дополнительно можно порекомендовать учитывать множественность проверок гипотез и использовать, например, поправку Бонферрони. Интересным развитием работы могла бы стать непараметрическая оценка статистической значимости используемой процедуры. Например, можно было бы использовать тест перестановок, а именно, случайным образом перемешать значение исследуемых переменных и провести процедуру на перемешанных данных. Повторение этой операции большое количество раз позволило бы сравнить полученные результаты с распределением результатов в случае истинности нулевой гипотезы. В целом Григорьевой Ирина была проделана большая и качественная работа. Ей было продемонстрировано знание большого количества методов, которые включают в себя как классические, так и недавно разработанные, умение их грамотно применять и сочетать, исходя из потребностей практической задачи. Используемые методы были подробно и четко описаны. Был проведен эксплораторный анализ данных, позволивший оценить их качество и указать на потенциальные смещения. Было реализовано необходимое для рассчетов программное обеспечение. Полученные в ходе исследования результаты были адекватно интерпретированы и позволили ответить на исходный вопрос. С учетом всего вышесказанного рекомендую оценку “хорошо”. Иван Смирнов, MSc, Исследователь Центра Исследований Инноваций в Образовании, Национальный Исследовательский Университет Высшая Школа Экономика