Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/32590
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorЦарев Михаил Владимировичru_RU
dc.contributor.advisorCarev Mihail Vladimirovicen_GB
dc.contributor.authorПоздняков Николай Николаевичru_RU
dc.contributor.authorPozdnakov Nikolaj Nikolaevicen_GB
dc.contributor.editorВладимирова Людмила Васильевнаru_RU
dc.contributor.editorVladimirova Ludmila Vasilevnaen_GB
dc.date.accessioned2021-08-07T09:12:04Z-
dc.date.available2021-08-07T09:12:04Z-
dc.date.issued2021
dc.identifier.other080180en_GB
dc.identifier.urihttp://hdl.handle.net/11701/32590-
dc.description.abstractЛогистическая регрессия является хорошим способом аналитики данных о заемщиках, позволяет на основе характеристик потенциального должника автоматически определять его благонадежность. В данной работе была построена оптимальная логит-модель, которая определяла вероятность выдачи кредита на основе обучающей выборки. Эта сложная задача решалась в 3 этапа. Первой простейшей задачей являлась задача с одним предиктором. Она наглядно показала суть задачи. Однако она далека от жизненной ситуации, когда можно принимать решение только на основании величины заработной платы. Поэтому далее перешли ко второй задаче с 6 предикторами. Благодаря проверке гипотез о значимости коэффициентов, было получено оптимальное число параметров и решена третья задача с этим числом параметров. Основной упор сделан на последнюю задачу, для ее решения: использовался метод максимального правдоподобия; написана программа для ЭВМ на языке (C#) и Excel для поиска максимума функции правдоподобия, зависящей от (m+1)-го параметра; оптимизация проводилась на основе применения случайного поиска в сочетании с градиентным методом; на основе проверки гипотез о значимости параметров логит-модели выделены значимые предикторы, их оказалось 4 вместо 6; для оптимального числа параметров рассчитаны доверительные интервалы для каждого коэффициенты логистической регрессии; для оценки качества логистической модели применялся ROC-анализ: строились кривые чувствительности и специфичности модели, которые показывают зависимость верно классифицированных положительных и отрицательных примеров от порога отсечения; выявили оптимальный порог отсечения. Компьютерные расчеты, анализ, построение диаграмм и графиков были проведены с помощью написанных ЭВМ (C#) и Excel. Обучающая выборка составлялась с учетом данныхru_RU
dc.description.abstractLogistic regression is a good way to analyze data about borrowers, it allows to automatically determine its reliability based on the characteristics of a potential debtor. In this work, an optimal logit model was built, which determined the probability of a loan on the basis of a training sample. This difficult task was solved in 3 stages. The first simplest problem was one with one predictor. She clearly showed the essence of the problem. However, it is far from a life situation where a decision can be made only on the basis of the amount of wages. Therefore, we went on to the second problem with 6 predictors. By testing the hypotheses about the significance of the coefficients, the optimal number of parameters was obtained and the third problem with this number of parameters was solved. The main emphasis is placed on the last problem, for its solution: the maximum likelihood method was used; a computer program was written in C # and Excel to find the maximum likelihood function depending on the (m + 1) -th parameter; optimization was carried out based on the use of random search in combination with the gradient method; on the basis of testing hypotheses about the significance of the parameters of the logit model, significant predictors were identified, there were 4 of them instead of 6; for the optimal number of parameters, the confidence intervals were calculated for each logistic regression coefficients; to assess the quality of the logistic model, ROC analysis was used: curves of the sensitivity and specificity of the model were built, which show the dependence of correctly classified positive and negative examples on the cut-off threshold; have identified the optimal cut-off threshold. Computer calculations, analysis, construction of diagrams and graphs were carried out using written computers (C #) and Excel. The training sample was compiled taking into account the data.en_GB
dc.language.isoru
dc.subjectОбучающая выборкаru_RU
dc.subjectлогит-функцияru_RU
dc.subjectоптимизацияru_RU
dc.subjectпрогнозированиеru_RU
dc.subjectROC-анализru_RU
dc.subjectпорог отсеченияru_RU
dc.subjectдоверительный интервалru_RU
dc.subjectгипотеза о значимости.ru_RU
dc.subjectTraining seten_GB
dc.subjectlogit functionen_GB
dc.subjectoptimizationen_GB
dc.subjectforecastingen_GB
dc.subjectROC analysisen_GB
dc.subjectcut-off thresholden_GB
dc.subjectconfidence intervalen_GB
dc.subjectsignificance hypothesis.en_GB
dc.titleUsing a logistic model to build score cardsen_GB
dc.title.alternativeИспользование логистической модели для построения скоринговых картru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
VKR_11_MAA_POZDNAKOV_NN.docxArticle468,61 kBMicrosoft Word XMLПросмотреть/Открыть
reviewSV_Otzyv_Pozdnakova_ispr.docReviewSV34 kBMicrosoft WordПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.