Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/32590
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Царев Михаил Владимирович | ru_RU |
dc.contributor.advisor | Carev Mihail Vladimirovic | en_GB |
dc.contributor.author | Поздняков Николай Николаевич | ru_RU |
dc.contributor.author | Pozdnakov Nikolaj Nikolaevic | en_GB |
dc.contributor.editor | Владимирова Людмила Васильевна | ru_RU |
dc.contributor.editor | Vladimirova Ludmila Vasilevna | en_GB |
dc.date.accessioned | 2021-08-07T09:12:04Z | - |
dc.date.available | 2021-08-07T09:12:04Z | - |
dc.date.issued | 2021 | |
dc.identifier.other | 080180 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/32590 | - |
dc.description.abstract | Логистическая регрессия является хорошим способом аналитики данных о заемщиках, позволяет на основе характеристик потенциального должника автоматически определять его благонадежность. В данной работе была построена оптимальная логит-модель, которая определяла вероятность выдачи кредита на основе обучающей выборки. Эта сложная задача решалась в 3 этапа. Первой простейшей задачей являлась задача с одним предиктором. Она наглядно показала суть задачи. Однако она далека от жизненной ситуации, когда можно принимать решение только на основании величины заработной платы. Поэтому далее перешли ко второй задаче с 6 предикторами. Благодаря проверке гипотез о значимости коэффициентов, было получено оптимальное число параметров и решена третья задача с этим числом параметров. Основной упор сделан на последнюю задачу, для ее решения: использовался метод максимального правдоподобия; написана программа для ЭВМ на языке (C#) и Excel для поиска максимума функции правдоподобия, зависящей от (m+1)-го параметра; оптимизация проводилась на основе применения случайного поиска в сочетании с градиентным методом; на основе проверки гипотез о значимости параметров логит-модели выделены значимые предикторы, их оказалось 4 вместо 6; для оптимального числа параметров рассчитаны доверительные интервалы для каждого коэффициенты логистической регрессии; для оценки качества логистической модели применялся ROC-анализ: строились кривые чувствительности и специфичности модели, которые показывают зависимость верно классифицированных положительных и отрицательных примеров от порога отсечения; выявили оптимальный порог отсечения. Компьютерные расчеты, анализ, построение диаграмм и графиков были проведены с помощью написанных ЭВМ (C#) и Excel. Обучающая выборка составлялась с учетом данных | ru_RU |
dc.description.abstract | Logistic regression is a good way to analyze data about borrowers, it allows to automatically determine its reliability based on the characteristics of a potential debtor. In this work, an optimal logit model was built, which determined the probability of a loan on the basis of a training sample. This difficult task was solved in 3 stages. The first simplest problem was one with one predictor. She clearly showed the essence of the problem. However, it is far from a life situation where a decision can be made only on the basis of the amount of wages. Therefore, we went on to the second problem with 6 predictors. By testing the hypotheses about the significance of the coefficients, the optimal number of parameters was obtained and the third problem with this number of parameters was solved. The main emphasis is placed on the last problem, for its solution: the maximum likelihood method was used; a computer program was written in C # and Excel to find the maximum likelihood function depending on the (m + 1) -th parameter; optimization was carried out based on the use of random search in combination with the gradient method; on the basis of testing hypotheses about the significance of the parameters of the logit model, significant predictors were identified, there were 4 of them instead of 6; for the optimal number of parameters, the confidence intervals were calculated for each logistic regression coefficients; to assess the quality of the logistic model, ROC analysis was used: curves of the sensitivity and specificity of the model were built, which show the dependence of correctly classified positive and negative examples on the cut-off threshold; have identified the optimal cut-off threshold. Computer calculations, analysis, construction of diagrams and graphs were carried out using written computers (C #) and Excel. The training sample was compiled taking into account the data. | en_GB |
dc.language.iso | ru | |
dc.subject | Обучающая выборка | ru_RU |
dc.subject | логит-функция | ru_RU |
dc.subject | оптимизация | ru_RU |
dc.subject | прогнозирование | ru_RU |
dc.subject | ROC-анализ | ru_RU |
dc.subject | порог отсечения | ru_RU |
dc.subject | доверительный интервал | ru_RU |
dc.subject | гипотеза о значимости. | ru_RU |
dc.subject | Training set | en_GB |
dc.subject | logit function | en_GB |
dc.subject | optimization | en_GB |
dc.subject | forecasting | en_GB |
dc.subject | ROC analysis | en_GB |
dc.subject | cut-off threshold | en_GB |
dc.subject | confidence interval | en_GB |
dc.subject | significance hypothesis. | en_GB |
dc.title | Using a logistic model to build score cards | en_GB |
dc.title.alternative | Использование логистической модели для построения скоринговых карт | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
VKR_11_MAA_POZDNAKOV_NN.docx | Article | 468,61 kB | Microsoft Word XML | Просмотреть/Открыть |
reviewSV_Otzyv_Pozdnakova_ispr.doc | ReviewSV | 34 kB | Microsoft Word | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.