Семінар побудова скорингових моделей маркетингу. Формування скорингової моделі оцінки кредитоспроможності корпоративного позичальника

Кредитування

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Розміщено на http://www.allbest.ru/

  • Вступ
    • 1.4 Нейронні мережі
    • 1.5 CHAIDаналіз
    • 1.6 Інші методи
    • 2.1 Постановка задачі
    • 3.1 Завдання Монжа-Канторовича
    • 3.2 Застосування завдання Монжа-Канторовича до скорингу
  • Висновок
  • Список літератури

Вступ

Скоринг - це евристичний спосіб побудови рейтингів та класифікації різних об'єктів на групи. Він ґрунтується на припущенні про те, що люди зі схожими соціальними показниками поводяться однаково. Він застосовується в банківській сфері, маркетинг, страхова справа.

Основною метою традиційного скорингу є класифікація клієнтів банку на “хороших” і “поганих”, з якої кредитор може обирати відповідні дії стосовно даного клієнта. "Поганого" клієнта, наприклад, можна визначити як клієнта з низькою емпіричною ймовірністю повернення кредиту. Але, зазвичай, таке визначення “поганого” клієнта розширюється до будь-якого небажаного банку поведінки клієнта. Класифікація складає основі скорингової карти з допомогою якої розраховується скоринговий бал клієнта. скоринг дискримінантний байєсовський

З літератури, присвяченої скорингу, зазначимо кілька праць.

“Посібник із кредитного скорингу” за редакцією Елізабет Мейз, 2008 р. - єдина книга про скоринг російською мовою. Описуються загальні поняття, розбираються методи побудови скорингової карти, обговорюється застосування скорингу практично. Книга складається із статей написаних зарубіжними фахівцями у галузі фінансів.

Дисертаційна робота Семюела Глассона “Метод цензурованої вибірки для кредитного скорингу”, 2007 р. У ній досліджуються інструменти аналізу виживання, стосовно кредитного скорингу, в умовах цензурованих даних. Розбирається застосування методу лінійної регресії та зокрема методу Баклі-Джеймса. Практична частина роботи містить у собі застосування цих методів до оцінки часу кредитного дефолту та часу виплати чергового платежу.

Дисертаційна робота Христини Болтон “Логістичні регресії та їх застосування у кредитному скорингу”, 2009 р. Розбирається концепція кредитного скорингу стосовно банківській справіу Південній Африці. Розглядаються методи побудови скорингової моделі з особливим акцентом метод логістичної регресії. Використовується цей метод для створення скорингової моделі.

Дисертаційна робота Маттіаса Кремпля “Адаптивні моделі та їх застосування у кредитному скорингу”, 2011. Акцент ставиться на вивченні методів побудови передбачуваних моделей в умовах дрейфу та затримки даних. Подано новий метод для побудови скорингових моделей, що базується на методі дерева прийняття рішень. Поданий метод застосовується для оцінки дрейфу у двох наборах реальних фінансових даних.

У наведених вище роботах є загальна проблема: застосування методів побудови скорингових моделей не обґрунтовано. Звідси випливає сумнів щодо правильності отриманих даних. Завдання полягає у побудові методу, застосування якого було б обґрунтовано. У цьому роботі представляється спосіб, який вирішує це завдання.

Існує безліч підходів до побудови скорингової моделі. У розділі 1 даної роботи описані методи, що застосовуються у вищенаведених дисертаціях. У розділі 2 вводиться математична модельскорингу і розбирається емпіричний Байєсовський підхід до побудови скорингової моделі: підхід описується теоретично, а потім застосовується до реальних даних банку "Сбербанк Росії" для побудови скорингової моделі. У розділі 3 вводиться метод, що грунтується задачі Монжа-Канторовича. Наведено теоретичне обґрунтування використання цього методу. Потім він застосовується для побудови скорингової моделі даних використовуваних у розділі 2.

Глава 1. Методи побудови скорингових моделей

1.1 Історія появи та розвитку скорингу

Спочатку скоринг розроблявся з метою автоматизації процесу рішення про видачу кредиту. До впровадження скорингу рішення про те, кому видати кредит у якому розмірі, приймалося кредитним експертом. Він вирішував це, спираючись на досвід та власну думку, керуючись параметрами клієнта, що впливають на його кредитоспроможність.

У 1940-х роках почалося використання скорингових систем. У 1941 Давид Дюран опублікував першу дослідницьку роботу з кредитного скорингу, в якій оцінював роль різних факторів у системі прогнозування. Після закінчення Другої світової війни різко зріс попит на кредитні продукти, і стало ясно, що традиційні методи ухвалення рішення погано працюють в умовах великої кількостіклієнтів. Вибух попиту на кредити, частково зумовлений запровадженням кредитних карток, мотивував кредиторів впроваджувати автоматизовані системиухвалення рішення про видачу кредитів. Паралельний розвиток обчислювальної техніки сприяв цьому і давав можливість обробляти великі масиви фінансових даних.

У 1956 році була створена компанія FICO, яка займалася розробками в галузі споживчих кредитів. У 60-х роках почалося впровадження комп'ютерних технологій у область скорингу. 1963 року було запропоновано використання дискримінантного аналізу даних для кредитного скорингу. І, нарешті, в 1975 році з прийняттям "US Equal Credit Opportunity Act I", скоринг був остаточно визнаний.

Важливим кроком у розвитку кредитного скорингу була поява скорингу поведінки (behavior scoring) на початку 90-х. Його метою є передбачення виплат вже існуючих клієнтів.

Нещодавно розвиток скорингових систем було обумовлено регулюванням з боку зовнішнього середовища. Як частина вимог до достатності капіталу, що пред'являються банкам у зв'язку з набранням чинності другою Базельською угодою (Basel Committee for Banking Supervision 2001), установи повинні уважно стежити за ризиками, пов'язаними з їх кредитними портфелями. Методи кредитного скорингу дозволяють це робити.

З моменту введення першої скорингової системи, використовувалося безліч математичних та статистичних методів. Серед статистичних можна назвати: дискримінантний аналіз, лінійну регресію, логістичну регресію та дерево прийняття рішень. Інші методи прийшли з математики: математичне програмування, нейронні мережі, генетичні алгоритми та експертні системи. Далі ми розберемо найпоширеніші методи і поговоримо про їхні переваги та недоліки.

1.2 Лінійний дискримінантний аналіз та лінійна регресія

Лінійний дискримінантний аналіз - метод для класифікації об'єктів на певні категорії. Ідея в тому, щоб знайти таку лінійну комбінацію змінних, що пояснюють, яка найкраще розділила б об'єкти на категорії. Під поділом найкраще мається на увазі таке, у якому забезпечується максимальна дистанція між середніми даних категорій. Скоринговий бал розраховується як лінійна функція від значень атрибутів клієнта:

Тут - значення атрибутів клієнта - параметри моделі, які максимізують відношення

де - вектор середніх для добрихі поганихклієнтів, - загальна підступна матриця.

Лінійний дискримінантний метод передбачає виконання двох умов. По-перше, підступні матриці незалежних змінних для обох груп повинні збігатися. По-друге, незалежні змінні мають бути розподілені нормально. Часто, у скорингу, незалежні змінні дискретні чи розподілені не нормально. Звідси виникають проблеми у застосуванні цього методу. Однак було показано, що навіть у разі порушення нормальності, цей метод широко застосовується. Його перевагою можна назвати простоту застосування.

Такий спосіб лінійної регресії, також використовується для формування скорингової моделі. У разі двох категорій, він еквівалентний методу лінійного дискримінантного аналізу та виражає залежність однієї змінної (залежної) від інших (незалежних). У загальному виглядівидається так:

Залежна змінна;

Поясні незалежні змінні;

Невідомі коефіцієнти регресії, які знаходяться методом найменших квадратів;

Для застосування моделі лінійного скорингу потрібно виконання наступного припущення: зв'язок між залежною та незалежними змінними повинен бути лінійним. Інакше точність оцінки значно погіршується. Помилки повинні бути незалежні і розподілені нормально.

Як і у випадку дискримінантного аналізу, в умовах кредитного скорингу, припущення, які потрібні для застосування лінійної регресії, нерідко порушуються. Лінійна регресія може дати оцінку ймовірності поза діапазоном, що є неприйнятним. Наприклад, логістична регресія позбавлена ​​цього недоліку.

1.3 Логістична регресія та пробитий-регресія

Дані види регресії найбільше підходять для побудови скорингової моделі, оскільки допускають категорійне представлення даних. Модель логістичної регресії задається так:

де - оцінка ймовірності того, що клієнт "поганий" , - вектор невідомих параметрів регресії, який обчислюється через умову максимізації відносин правдоподібності.

Модель логістичної регресії виходить з функції логарифм. У свою чергу, пробіта-регресія базується на нормальному розподілі і задається таким чином:

де. Вектор також як і в моделі логістичної регресії.

Так як логістична регресія і пробіт-регресія використовують схожі формою розподілу, результати застосування даних моделей також схожі. Логістична регресія користується великою перевагою, тому що обчислення простіше, ніж у пробіт-регресії і є більше інструментів для роботи з нею. За рахунок своєї бінарної природи, логістична регресія краща за лінійну регресію у використанні для побудови скорингових моделей. Насправді ж було з'ясовано, що різниця у точності прогнозованих результатів незначна. Проте, спостерігається переважання логістичної регресії у скорингових системах.

1.4 Нейронні мережі

Штучні нейронні мережі є симуляцією нейронних мереж у природі. Виникло це поняття при спробі змоделювати процеси, що відбуваються у мозку людини.

Нейронні мережі, також звані багатошаровим перцептроном, особливо підходять на вирішення завдання класифікації. Вони широко використовуються у різних сферах: фінансах, комп'ютерних науках, фізиці та медицині. Популярність нейронних мереж частково обумовлюється можливістю моделювати складні ситуаціїбез особливих витрат із боку використовує цей метод. За своєю природою нейронні мережі автоматично виявляють будь-яку нелінійну ситуацію даних і підлаштовуються під неї. Також багатошарові нейронні мережі є універсальними апроксиматорами, тобто можуть апроксимувати будь-яку функцію як завгодно точно.

Нейронні мережі складаються з шарів, які, у свою чергу, складаються з вузлів. Є 3 типи шарів у мережах: вхідний, прихований, вихідний. Вхідний шар утворюють атрибути клієнта, такі як стать, вік тощо.

Вихід для k-го вузла з входами m представляється так:

де - активаційна функція, - вектор вхідних даних, - ваговий вектор, який позначає силу зв'язку між вузлами.

Основним недоліком є ​​те, що незважаючи на можливість досягти високої точності прогнозу, зрозуміти причини, з яких було прийнято те чи інше рішення, неможливо.

У контексті кредитного скорингу було показано, що нейронні мережі працюють не гірше за традиційні методи.

1.5 CHAID аналіз

Даний метод відмінно підходить для знаходження зв'язків між даними, особливо якщо нелінійні зв'язки. Він застосовується для побудови дерев прийняття рішень, і має багато спільного з класичними методами, такими як дискримінантний аналіз та лінійна регресія.

Абревіатура CHAID розшифровується як Chi-squared Automated Interaction Detector.

Гнучкість цього методу робить його привабливим для використання, але це не означає, що його варто використовувати замість традиційних методів. У випадку, коли зустрічаються суворі теоретичні припущення про розподіл, традиційні методи є кращими. Як техніка дослідження або у випадку, коли традиційні методи не спрацьовують, аналіз CHAID є неперевершеним інструментом.

CHAID будує не бінарні дерева (тобто дерева, у яких може бути більше двох гілок) на основі відносно простого алгоритму, який особливо добре підходить для аналізу великих масивів даних. Алгоритм ґрунтується на застосуванні тесту хі-квадрат.

1.6 Інші методи

Дерево прийняття рішень.

Метод поділяє дані на підмножини, кожна з яких більш однорідна у своїй поведінці, ніж вихідна кількість даних. Кожна з цих підмножин ділиться далі, за таким самим алгоритмом. Результат поділу називається "листом" це дерева. Є й інші способи, що працюють за подібним принципом.

Переваги цього - простота і інтуїтивність. Метод здатний працювати з відсутніми спостереженнями. Особливо він застосовний у разі, коли про дані до їх дослідження практично нічого невідомо і не можна побудувати будь-які здогади чи гіпотези.

Головний недолік цього - складність комп'ютерних розрахунків. Внаслідок громіздкості одержуваних дерев процес вивчення моделі трудомісткий. Зміни в ситуації можуть призвести до перегляду всього дерева рішень.

Здебільшого метод використовується як допоміжний. Наприклад визначення змінних, які найсильніше пояснюють поведінка залежної змінної.

Методkнайближчих сусідів. Непараметричний метод класифікації об'єктів. Грунтується на метриці, що визначає схожість між даними.

Спочатку вводяться тренувальні дані, поділені на класи. Потім вводяться дані і визначається схожість між введеними і тренувальними даними. На основі метрики вибирається до найближчих сусідів. Новий елемент відносять до того класу, до якого належить більшість його сусідів.

Кількість сусідів k визначається компромісом між компенсацією та дисперсією. Чим менший клас, тим менше вибирається k. При цьому необов'язково, що за більших k результат буде кращим.

Одна з переваг даного методу – легко додати нові дані, не змінюючи при цьому модель. Непараметрична сутність цього методу дозволяє працювати з ірраціональностями у функціях ризику на просторі ознак.

Відсутність формального методу вибору k і неможливість ймовірнісної інтерпретації результату, оскільки результатом є очікувані частоти, є головними недоліками методу. Дані складності можуть бути вирішені використанням методом Байєсівської апроксимації.

Цей метод мало використовується у скорингу. Однією з причин цього є те, що для класифікації одного об'єкта необхідно мати базу для всіх об'єктів.

Більш новий метод опорних векторів, побудований на машинному навчанні, показав себе не гірше за традиційні скорингові методи. Він складається з двох процесів: перший перетворює вхідні дані до даних високої розмірності у просторі ознак; другий класифікує дані за допомогою лінійного класифікатора. Класифікатором може бути, наприклад, лінійний дискримінантний аналіз.

1.7 Порівняння різних методів

Було проведено низку порівняльних досліджень для скорингових методів. Критеріями для ранжування служили відсоток помилок при класифікації та ROC-крива. Досліджувалися 8 наборів даних.

Середня оцінка

Нейронні мережі

Опорних векторів

Логістична регресія

Лінійний дискримінантний аналіз

Лінійні LS-SVM

Розширене дерево Байєса

Наївний байєсовський класифікатор

Радіально базисні функції

k-найближчих сусідів (k=100)

Лінійний SVM

Квадратичний дискримінантний аналіз

Дерево прийняття рішень

Лінійне програмування

Дерево прийняття рішень

Дерево прийняття рішень

k-найближчих сусідів (k=10)

Дерево прийняття рішень

З таблиці видно, що нейронні мережі та метод опорних векторів з'явилися найкращими на досліджуваних 8 наборах даних. Крім того, традиційні методи, такі як лінійний і дискримінантний аналіз показали себе конкурентоспроможними. Звідси випливає, що, мабуть, більшість даних для кредитного скорингу лише трохи нелінійні. Внаслідок чого лінійні методипоказали себе лише на рівні з нелінійними.

Немає оптимальної скорингової моделі для будь-якої ситуації. Вибір моделі залежить від даних та мети, на яку спрямоване створення моделі. Крім того, метод, який найкраще оцінює, не обов'язково буде кращим у даній ситуації.

Глава 2. Емпіричний Байєсовський підхід

У цьому розділі розберемо емпіричний Байєсовський підхід і з допомогою нього побудуємо скорингову модель. Побудову будемо вести виходячи зі статистики щодо споживчим кредитамбанку "Сбербанк Росії".

2.1 Постановка задачі

Припустимо, є певний банк, що займається кредитуванням приватних осіб. До банку отримання кредиту звертаються клієнти. Рішення про видачу кредиту банк виносить з урахуванням інформації про клієнта.

Інформацію про клієнта банк отримує з різних джерел: від самого клієнта, від кредитного бюрота з інших джерел. Ми розглядатимемо інформацію, що надається самим клієнтом. Банк отримує її через заповнену позичальником анкету.

В анкеті позичальник вказує такі дані: стать, вік, сімейний стан, наявність дітей, щомісячний дохід, наявність нерухомості та інше.

На підставі цих даних розіб'ємо клієнтів на групи, в яких вони схожі певним ознакам. Для кожного клієнта Байєсовським способом знайдемо рейтинг - емпірична можливість того, що клієнт поверне кредит за умови, що він належить цій групі.

Для застосування методу необхідно, щоб дані задовольняли наступним умовам:

· Незалежність - клієнти не мають змови щодо виплати кредиту;

· Однорідність - дані взяті з однієї генеральної сукупності;

· рівноймовірність - клієнти рівноймовірно розподіляються за групами.

Їхнє виконання перевіряється нижче.

2.2 Побудова скорингової моделі

Введемо імовірнісний простір. Позначимо у цьому просторі – клієнт банку.

Кожен клієнт банку має набір характеристик згідно з заповненою анкетою. Наприклад: у шлюбі чи ні, рівень доходу, розбитий за категоріями, наявність машини та інші характеристики. Відповідно до цих характеристик введемо розбиття простору на множини

Таким чином, багато клієнтів розбито на групи.

Введемо випадкові величини.

Кількість клієнтів у j-й групі.

Виходячи з даних, ми можемо побудувати спільний емпіричний розподіл ймовірностей.

де - апріорна емпірична ймовірність події A,

Емпірична ймовірність події B за умови А,

Емпірична ймовірність події A за умови B, яку називають апостеріорною ймовірністю,

Емпірична можливість події B.

Ця формула дозволяє переоцінити ймовірність події A, враховуючи той факт, що сталася подія B.

З визначення умовної ймовірності можемо записати:

Виразивши з (1) і підставивши в цю формулу вираз для, отримаємо:

2.3 Застосування моделі даних

У нашому розпорядженні є дані про 1977 клієнтів банку "Сбербанк Росії" включаю інформацію про те, повернули вони кредит чи ні.

Для застосування Байєсовського підходу необхідно переконатися у виконанні 3-х гіпотез:

· Про незалежність - клієнти не мають змови щодо виплати або не виплати кредиту;

· Про однорідність - дані взяті з однієї генеральної сукупності;

· Про вид розподілу - дані розподілені рівноймовірно.

Гіпотеза про незалежність

Для перевірки цієї гіпотези скористаємося ранговим критерієм Спірмена. Статистикою даного критерію є коефіцієнт рангової кореляції, який визначається наступним чином.

Дано два ряди спостережень: і. З цих спостережень побудуємо пари рангів. Під рангом розуміємо номер місця, яке займає спостереження в варіаційному ряду. Аналогічно розуміємо ранг. Потім переставляємо пари рангів у порядку зростання першої компоненти. Ряд, що вийшов, позначимо.

Коефіцієнт кореляції знаходиться за формулою:

Критична область критерію. Для знаходження скористаємося тим, що закон розподілу прагне, за великих n. Звідси. Тут – функція розподілу стандартного Гауссового закону.

За рівня значимості, =1.959964. Кордон критичної зони. Знайдений коефіцієнт кореляції.

Таким чином, статистика критерію не потрапляє в його критичну сферу, і ми можемо прийняти гіпотезу про незалежність при рівні значущості 0.05.

Гіпотеза про однорідність

Формулюється гіпотеза в такий спосіб. Дано дві вибірки і з розподілів і, відповідно, з функціями розподілів і. Тоді гіпотеза про однорідність.

Для перевірки цієї гіпотези скористаємося критерієм Смирнова.

Статистикою цього критерію є, де - емпіричні функції розподілу, побудовані за вибірками та. Критична область задається у вигляді. При великих n і m кордон критичної області можна прийняти рівним, де. - Функція розподілу Колмогорова.

Таким чином, гіпотеза про однорідність відкидається, якщо. При рівні значимості 0.05. - кордон критичної галузі. Статистика.

Статистика критерію не потрапляє у критичну область, і ми можемо прийняти гіпотезу про однорідність при рівні значимості 0.05.

Гіпотеза про вид розподілу

Сформулюємо гіпотезу. Нам дано вибірку з розподілу з функцією розподілу, яка невідома. Необхідно перевірити, що функція розподілу рівномірного розподілу на відрізку .

Для цього скористаємося критерієм згоди Пірсона.

Статистикою критерію є. Тут - частота потрапляння спостережень у i-й відрізок, - ймовірність попадання в i-й відрізок. Якщо гіпотеза, що перевіряється, правильна, при великих n статистика підпорядковується розподілу хі-квадрат з k-1 ступенем свободи.

Гіпотеза відкидається у разі, якщо статистика перевищує критичне значення.

Значення статистики порахуємо за допомогою програмного пакета Statistica – = 24,19468, k-1 = 39. Кордон критичної області за рівня значимості.

Таким чином значення статистики не перевищує критичного рівня та гіпотеза про рівномірний розподіл клієнтів по групах приймається при рівні значущості 0.05.

Отже, дані задовольняють всі гіпотези, наведені вище, і ми можемо приступити до знаходження рейтингів.

Наявні дані містять безліч різних показників клієнтів. Для побудови будемо використовувати чотири з них, найбільш значущі. Взяти Велика кількістьелементів не дозволяє нам обмеженість нашої вибірки (1977 елементів).

Вибрані характеристики: вік та стать позичальника, наявність дітей, виплати за кредитом у % від сумарного доходу позичальника. Характеристика вік приймає 3 значення – 18-29, 30-45, 46-…; стать позичальника два значення - чоловічий та жіночий; наявність дітей два значення – є діти, і немає дітей; виплати приймають 5 значень - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

Кожне конкретне значення характеристики назвемо властивістю позичальника. Розіб'ємо всіх наших клієнтів на безлічі, спираючись на наявність конкретної якості даного клієнта. Наприклад, - безліч клієнтів, у яких немає дітей.

Наведемо ці позначення:

Діти = Ні дітей = Є діти;

Вік, =Возр1(18-29), =Возр2(30-45), =Возр3(46-...);

Стать, =Жіночий, =Чоловічий;

Виплати за кредитом у % від сумарного доходу позичальника, = Вип1 (<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

Утворимо нові множини, як комбінацію всіх можливих властивостей клієнта - за всілякими. Наприклад, безліч складається з жінок віком 18-29 років без дітей, які виплачують<5% от своего суммарного дохода. Количество таких множеств равно 60.

Таблиця 2.1. Кодування множин.

Немає дітей

Є діти

Зауважимо, що - утворюють розбиття всієї множини клієнтів:

Побудуємо спільне емпіричне розподіл двох дискретних випадкових величин - де =(0,1), =(, i=1:60). Будувати його будемо як відношення кількості клієнтів, що задовольняють парі значень випадкових величин (X,Y) до загальної кількості клієнтів.

Зафіксуємо кількість клієнтів, що відповідають кожній можливій парі (X,Y).

Таблиця 2.2. Кількість клієнтів, які повернули і не повернули кредит у кожній групі. 0 – повернули кредит, 1 – не повернули кредит.

Побудуємо спільне емпіричне розподіл ймовірностей. Для цього розділимо кількість клієнтів, які повернули і не повернули кредит у кожній із груп на загальну кількість клієнтів.

Таблиця 2.3. Спільний емпіричний розподіл ймовірностей.

Малюнок 2.1. Емпірична функція розподілу за X=0.

Малюнок 2.2. Емпірична функція розподілу за X =1.

Малюнок 2.3. Гістограма спільного розподілу за X=0.

Малюнок 2.4. Гістограма спільного розподілу за X=1.

Знайдемо емпіричний розподіл ймовірностей попадання до кожної групи. Для цього розділимо кількість клієнтів у кожній групі на загальну кількість клієнтів. Загальна кількість клієнтів.

Таблиця 2.4. Емпіричний розподіл ймовірностей попадання в кожну групу.

Малюнок 2.5. Гістограма потрапляння до групи i.

Виходячи з цього, отримуємо класифікацію:

· Клієнти з групи 60 ризикові

· Клієнти з груп 1-5, 7-12, 15, 17, 25, 31, 32, 33, 35-37, 39, 40, 42, 54-56, 58 - середньоризикові

· Клієнти з груп 6, 13, 14, 16, 18-24, 26-30, 34, 38, 41, 43-53, 57, 59 - надійні

Глава 3. Підхід, заснований на завдання Монжа-Канторовича

3.1 Завдання Монжа-Канторовича

Завдання Монжа.

Дані два імовірнісні простори та й невід'ємна вимірна функція на ...

Подібні документи

    Дискримінантний аналіз як розділ багатовимірного статистичного аналізу. Дискримінантний аналіз за нормального закону розподілу показників. Застосування дискримінантного аналізу за наявності двох навчальних вибірок. Розв'язання задачі у системі statistika.

    курсова робота , доданий 21.01.2011

    Моделі дискримінантного аналізу. Ефективність класичних західних та російських моделей передбачення банкрутства. Галузева специфіка. Опис статей, що включає характеристики вибірки, метод, список факторів та прогнозну силу методу аналізу.

    реферат, доданий 24.07.2016

    Основи лінійного регресійного аналізу. Особливості використання функції Кобба-Дуглас. Застосування множинної лінійної регресії. Сутність методу найменших квадратів. Шляхи уникнення хибної кореляції. Перевірка важливості коефіцієнтів регресії.

    реферат, доданий 31.10.2009

    Економічна класифікація держав, характеристика основних показників економічного розвитку. Статистичні методи аналізу, опис дискримінантного, кластерного, факторного та графічного аналізу. Параметри дослідження економічної безпеки.

    дипломна робота , доданий 14.10.2013

    Історія появи функціонально-вартісного аналізу, його методика, принципи, завдання та етапи проведення. Використання системного аналізу та поелементного відпрацювання конструкції кожної деталі Ю.М. Соболєвим. Застосування функціонально-вартісного аналізу.

    контрольна робота , доданий 08.04.2012

    Теоретичні та методологічні засади економічного аналізу, його предмет, об'єкт, завдання. Характеристика принципів економічного аналізу, підходи та особливості їх використання на практиці. Визначення тенденцій розвитку підприємства з урахуванням аналізу.

    курсова робота , доданий 20.12.2010

    Сутність та застосування методу найменших квадратів для однофакторної лінійної регресії. Знаходження коефіцієнта еластичності для зазначеної моделі у заданій точці X та його економічний аналіз. Прогноз збитковості виходячи з лінійної регресії.

    контрольна робота , доданий 15.06.2009

    Сутність моделі Ольсона як однієї з найперспективніших сучасних розробок у теорії оцінки вартості компанії. ЕВО у практичній оцінці, особливості її роботи в Росії. Особливості лінійної інформаційної динаміки Ольсона та Фельтхама-Ольсона.

    контрольна робота , доданий 07.04.2011

    Поняття економічної інформації, її сутність та особливості, класифікація та різновиди, характеристика та відмінні риси. Сутність, предмет та об'єкти економічного аналізу, цілі та завдання. Взаємозв'язок аналізу коїться з іншими науками, його організація.

    шпаргалка, доданий 05.04.2009

    Методи розробки економіко-математичної моделі: постановка задачі, система змінних та обмежень. Види розв'язання економіко-математичної моделі оптимізації виробничої структури сільськогосподарського підприємства, аналіз двоїстих оцінок.


Для побудови скорингових моделей (причому незалежно від обраного математичного підходу) береться репрезентативна вибірка з попередніх заявників (від кількох тисяч до сотень тисяч – що не проблема галузі, яка обслуговує десятки мільйонів клієнтів). Для кожного заявника вибирається повна інформація з анкети-заяви та інформація з його кредитної історії за фіксований період часу (зазвичай 12, 18 або 24 міс.). Потім приймається експертне рішення, яку вважати прийнятною, тобто. чи є клієнт "хорошим" чи "поганим". Найчастіше "поганим" вважається клієнт, який не виплатив за кредитом 3 місяці поспіль. Завжди виявляється кілька клієнтів, яких не можна віднести ні до "хороших", ні до "поганих", оскільки
вони або недостатньо давно отримали кредит (пройшло занадто мало часу), або їхня кредитна історія "незрозуміла" (наприклад, були затримки по 3 місяці, але не поспіль). Як правило, такі "проміжні" клієнти виключаються із вибірки.
Емпіричні вимоги до бази даних, що використовуються для побудови скорингової моделі:
розмір вибірки - щонайменше 1500 всього, щонайменше 500 поганих;
чітке визначення критерію "поганий"/"хороший". Не завжди зрозуміло, якому етапі кредитної історії, за яким ознакою і якому рівні розділяти " поганих " і " хороших " ;
чітке визначення тимчасового відрізка - періоду життя продукту (залежить від самого продукту та може змінюватися від місяця - мобільний телефон до десятиліть - іпотека);
стабільність складу клієнтської групи – демографія, міграції, збереження навичок споживання;
неявна, але обов'язкова вимога: стабільність економічних, політичних, соціальних та інших умов.
При побудові кредитних моделей суттєвим є вибір тимчасового горизонту - відрізка часу між подачею заяви (видачею кредиту) та класифікацією "поганий"/"хороший". Аналіз показує, що відсоток дефолту як функція тривалості перебування клієнта з організацією спочатку зростає і лише через 12 місяців (кредитні картки) і більше (разові позики) починає стабілізуватися. Таким чином, менший часовий обрій призводить до недооцінки і не враховує повністю всіх характеристик, що передбачають дефолт. З іншого боку, тимчасовий горизонт понад два роки залишає модель схильної до зрушень у складі клієнтської групи протягом цього часу, т.к. як склад клієнтів у вибірці на початку тимчасового горизонту може виявитися суттєво відмінним від складу клієнтів, які зараз приходять. Фактично використовуються два одноразові зрізи (на початку та наприкінці тимчасового горизонту) для створення моделі, яка стабільна за часом (за межами початкового тимчасового відрізка). Це і диктує вибір довжини тимчасового відрізка – тимчасового горизонту під час моделювання.
Іншим надзвичайно важливим і дискутованим питанням залишається співвідношення "хороших" та "поганих" у вибірці. Чи має воно відображати реальне співвідношення їх у складі населення або їх має бути рівне число (таке співвідношення різко полегшує побудову моделі з математичної точки зору)?
Далі побудова скорингової моделі перетворюється на класифікаційну проблему, де вхідними характеристиками (або параметрами) є відповіді на запитання анкети-заяви та параметри (або дані), які отримуються в результаті перевірок з різних організацій (наприклад, поліції, судів, місцевих рад, кредитних бюро та т.д.), а вихідними характеристиками (відповіддю) - шуканим результатом - є поділ клієнтів на "хороших" і поганих" згідно з наявними кредитними історіями, зіставленими за цими вхідними характеристиками.
Власне рейтингова таблиця (scorecard) - це система надання чисельних балів (рахунку) характеристикам (або параметрам) позичальника для отримання шуканого числового значення, яке відображає, з якою ймовірністю у позичальника по відношенню до інших позичальників станеться певна подія або він здійснить певну дію (аспект "відносно" у визначенні дуже важливий).
Кредитна рейтингова таблиця, наприклад, не показує, який рівень ризику слід очікувати (скажімо, який відсоток кредитів цього типу, ймовірно, не буде повернено); натомість вона показує, як ця позика, швидше за все, поводитиметься стосовно інших позик. Наприклад, чи очікується, що відсоток неповернень або дефолтів для кредитів з цим набором атрибутів буде більшим або меншим, ніж у кредитів з іншим набором.
Більшість рейтингових таблиць побудовано за допомогою розрахунку регресійної моделі - статистичної моделі, яка перевіряє, як окремий параметр (характеристика) впливає інший параметр чи (найчастіше) цілий набір інших параметрів.
Регресійна модель дає в результаті свого застосування набір коефіцієнтів (factors), званих регресійними, які можна інтерпретувати як кореляцію між параметрами (які необхідно визначити) і пояснювальними параметрами, зберігаючи незмінними всі інші впливу на параметри, що шукаються. Ці коефіцієнти перетворюються на ваги балів (point weights) у рейтинговій таблиці.
Найпоширеніший метод побудови рейтингових таблиць
Найчастіше для побудови рейтингових таблиць використовується статистичний метод логістичної регресії. Однак для пояснення цього підходу варто почати з простої лінійної регресії, а потім перейти до логістичної - як особливого лінійного випадку.
У найпростішому випадку лінійна регресія намагається знайти лінійний зв'язок між двома змінними: X і К. Змінна Y, яку намагаються спрогнозувати, визначається як залежна (оскільки вона залежить від X). Змінна X пояснює, оскільки вона "пояснює", чому У змінюється від одного індивідуума до іншого.
За допомогою лінійної регресії намагаються з'ясувати таке: якщо змінюється X, то наскільки

ймовірно, що в результаті цього також зміниться і Для того щоб це зробити, необхідний набір даних, в якому можна спостерігати безліч пар X і відповідних йому До Коли вони будуть відкладені на площині XY і буде отримано деяке безліч, може виявитися, що воно лягає на якусь пряму, тобто. є певний зв'язок між X і Y, який можна спробувати апроксимувати за допомогою рівняння:
Y = B_0 + B_1 x X_1
де
B0 – це величина Y, коли X = 0;
B1 – нахил прямої лінії.
Ці Ст є коефіцієнтами регресії. На практиці, швидше за все, виявиться кілька змінних, що пояснюють:
Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n.
Логістична регресія порівняно з лінійною регресією
При використанні скорингу, як правило, залежна змінна набуває значення в дуже невеликому діапазоні. Найчастіше працюють із бінарною змінною, тобто. такий, що набирає лише два цілих значення: так, наприклад, за кредитом дефолт або стався, або ні; клієнт, який отримав каталог поштою чи відповів, чи ні. Зазвичай, у разі дефолту приписують значення " 1 " , а виплаченому кредиту - значення " 0 " .
Модель у результаті має оцінити можливість дефолту за кредитом (або відповіді клієнта на каталог).
І хоча лінійна модель іноді використовується для розрахунку рейтингової таблиці, логістична регресія виявляється набагато зручнішою, оскільки вона спеціально побудована для випадків, коли залежна змінна – бінарна (тобто приймає, як ми вже говорили, лише два значення).
Лінійна регресія може давати значення ймовірності і менше нуля, і більше одиниці, що не має сенсу. Логістична модель уникає цього, оскільки працює не з самим бінарним значенням залежної змінної, а з ймовірністю чи шансами (odds), що це значення справді реалізується. Логарифм відношення ймовірності реалізації до ймовірності нереалізації називають логітом (logit), який може набувати будь-яких значень, як негативних, так і позитивних. Тому для логітів можна використовувати модель лінійної регресії (звідси і назва "логістична").
У моделі логістичної регресії пояснюють змінні, помножені на свої коефіцієнти, передбачаються лінійними по відношенню не до Y, як у лінійній регресії, а до логіту - натурального логарифму відношення шансів:
ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n, де
р - ймовірність того, що V відбудеться;
р/(1 – р) – відношення шансів.
Шанси та співвідношення шансів
Співвідношення шансів дає змогу порівнювати рівні ризиків для різних кредитів. Так, якщо одного р1/(1 - p_1) = 0,11, а іншого р2/(1 - р2) = 0,052, їх ставлення становитиме 0,46, тобто. ризик неповернення за одним кредитом становить трохи менше половини ризику неповернення за другим кредитом.
Найважливіші висновки з цього такі: необхідно отримувати самі шанси та його відносини щодо різних кредитів з логістичних регресій, т.к. Тільки так вдається прямо зіставити і врахувати як вплив окремих показників до рівня ризику, і відносний ризик одного кредиту стосовно іншого. Спроби обійтися однією рейтинговою таблицею не дозволяють оцінити ризиковість одного кредиту щодо іншого через можливий вплив характеристик, які були враховані для одного та не враховані для іншого.
Обчислення відносних ваг окремих характеристик рейтингової таблиці
Побудувавши та оцінивши логістичну модель, можна підставити величини X для будь-якого заявника чи кредиту та обчислити рахунок (score), використовуючи рівняння:

Однак цей рахунок представлений у шкалі натуральних логарифмів, що є незручним для інтерпретації. Тому рахунок переводиться в лінійну шкалу, де певна кількість балів вибирається так, щоб це число забезпечувало подвоєння шансів того, що подія відбудеться. Для цього необхідно помножити рахунок на множник, що дорівнює числу балів, яке має представляти подвоєння шансів, а потім поділити на 1n(2):
рахунок за лінійною шкалою = (В 1 х Х 1 + ... + Вп х Хп) х (20/1п(2)),
якщо бажане число балів, необхідне подвоєння шансів, дорівнює 20.
Інакше, якщо треба дізнатися, скільки саме балів дає кожна характеристика, можна помножити кожне В_1 (20/(1n(2)), а потім помножити на значення параметра X_1.
Використання КС-статистики для оцінки отриманої рейтингової таблиці
Скорингова таблиця конструюється те щоб ранжувати різні кредити у термінах шансів стосовно певному події. Необхідно, щоб така скорингова таблиця приписувала кредити, з якими відбувається певна подія, і кредити, з якими вона не відбувається, різні рахунки.
Наприклад, кредитна скорингова таблиця (скорингова карта) приписує менший рахунок тим кредитам, які згодом зазнають серйозних труднощів із поверненням чи перейдуть у дефолт, отже загалом група поганих кредитів повинна мати менші рахунки, ніж група хороших кредитів.
Для визначення якості отриманої таблиці будуються графіки - криві розподілу відсотків хороших та відсотків поганих кредитів (від відповідного загального числа хороших та поганих) залежно від величини рахунку, і якість скорингової таблиці (картки) характеризується тим, наскільки ці дві криві поділяються.
Саме для чисельного визначення якості поділу використовується статистика Колмогорова-Смирнова (K-S statistics), яка дає числову міру цього поділу. Статистика КС обчислюється просто: це максимум різниці між кумулятивним відсотком розподілу "добрих" та кумулятивним відсотком розподілу "поганих". Теоретично статистика КС може набувати значень від 0 до 100, проте на практиці вона зазвичай виявляється в діапазоні від 25 до 75.
Зразкова градація виглядає так:
менше 20 – напевно, скорингова таблиця непридатна до застосування;
20-40 – непогана таблиця;
41-50 – хороша таблиця;
51-60 – дуже хороша таблиця; />61-75 - напрочуд хороша таблиця;
більше 75 - мабуть, надто хороший результат, щоб бути правдою, мабуть, щось неправильно * (128).
Слід зазначити, що якість скорингових моделей слід постійно перевіряти та моніторинг є обов'язковою процедурою в процесі експлуатації. Згодом можуть змінюватися як економічні умови, так і поведінкові особливості позичальників, і лише своєчасне підстроювання або навіть заміна скорингових моделей забезпечить ефективне управління кредитними ризиками.

Термін «скоринг» у дослівному перекладі з англійської означає «підрахунок очок». Так називають систему та метод оцінки ризиків щодо кредитування конкретної особи, управління ризиками на основі математичного прогнозу. Банківський скоринг дозволяє визначити ймовірність прострочення виплат, ґрунтуючись на інформації з кредитної історії та деяких інших даних. Основним критерієм є бали, які раніше нараховувалися співробітниками кредитно-фінансових установ вручну, а зараз дедалі частіше розраховуються спеціальною програмою.

Скоринг ефективно працює у сфері експрес-кредитування, мікрофінансування, де на розгляд заявки спеціаліст має не більше години. У спеціальну програму заводяться дані потенційного позичальника. Система порівнює інформацію із статистикою. Наприклад, якщо у базі даних багато відомостей про те, що люди такого ж віку та/або професії не повертали кредити, то рішення може бути негативним – банк може відмовити без пояснення причин.



Оцінка кредитоспроможності позичальника – фізичної особи – в автоматичному режимі ґрунтується на аналізі різної інформації, серед якої:

  • ідентифікаційні дані. Обробляються дані паспорта, фото заявника. Вже цьому етапі визначаються шахраї, особи, мають погану кредитну історію;
  • соціальне положення. Враховується стать, вік заявника, його освіта та місце роботи. Приймається до уваги адреса реєстрації та проживання, наявність сім'ї, утриманців;
  • фінансове положення. В ідеальному варіанті необхідно мати не лише достатній, а й регулярний дохід. Деякі банки враховують також можливі витрати: оплату комунальних послуг, дитячого садка тощо. Багато заявників йдуть на хитрощі, не заявляючи про утриманців або завищуючи суми доходів. При невеликих позиках це може спрацювати, але при великих кредитах банки зазвичай перевіряють дані набагато ретельніше;
  • кредитна історія. В оцінці кредитоспроможності фізичної особи інформація про попередні позики має одне з вирішальних значень. Визначаються непогашені кредити, наявність прострочок і час, протягом якого вони виплачені. Якщо позички обслуговувалися акуратно, то система видасть високу ймовірність такої поведінки клієнта в майбутньому, збільшивши скоринговий бал. Такий самий принцип працює і у зворотний бік;
  • транзакційна поведінка. Параметр оцінки доступний для заявників, які є клієнтами кредитно-фінансової установи. Власники пластикових карток, депозитних рахунків, учасники зарплатних проектів частіше отримують високу скорингову оцінку. Системою оцінюються суми, куди здійснюються купівлі, категорії точок продажів.

Усі дані перевіряються окремо і порівнюються між собою наявність протиріч. Має бути зв'язок між доходами та витратами, посадою та місцем проживання тощо.

Неупередженість. Скорингова система оцінки кредитоспроможності оперує фактами та цифрами, не враховуючи особистісні особливості людини. Співробітник офісу, який приймає заявку, не може вплинути на алгоритм підрахунку. Кредитний експерт немає права безпідставно відмовити у видачі позички, якщо програма оцінила позичальника як платоспроможна особа.

Оперативність. Підрахунок балів у ручному режимі виконується у формі таблиці. В окремі рядки фахівець самостійно вводить дані та надає бали, орієнтуючись лише на власний досвід та знання. Процес трудомісткий і довгий, заявникам доводиться чекати години і більше. Сучасні програми підраховують скоринговий бал у сотні разів швидше.

Фінансовий зиск. Банки, які використовують скорингову систему оцінки кредитоспроможності, часто пропонують вигідніші умови надання позичок. Прорахунок ризиків та автоматичне відсівання можливих неплатників значно знижує частку неповернення, яку зазвичай закладають у відсоткову ставку. Це вигідно і позичальнику, і кредитору.

Насамперед необхідно сформувати хорошу кредитну історію, без прострочень. Якщо своєчасні виплати неможливі з об'єктивних причин, необхідно якомога раніше повідомити про це банк і довести тимчасову неплатоспроможність. Більшість кредиторів йдуть назустріч клієнтам, надаючи відстрочки платежу, роблячи перерахунок чи пропонуючи інші рішення. І тут історія не буде зіпсована відмовими виплат. Якщо негативні рядки історія вже є, їх можна компенсувати своєчасно виплаченими кредитами.

Ще один спосіб, що дозволяє підвищити скорингову оцінку кредитоспроможності - наявність депозиту. Відкритий внесок у банку дає зрозуміти, що клієнт має кошти для виплати. Те саме стосується власників зарплатних карток, які зазвичай мають високий бал.

Щоб підвищити оцінку, необхідно уважно поставитися до заповнення заяви. Рекомендується вказувати достовірні контактні дані та попередити всіх, чиї телефони ви вписуєте в анкету. Якщо співробітник банку почне продзвонити, він має додзвонитися до всіх абонентів. В іншому випадку інформацію можуть визнати недостовірною та відмовити через це у кредитуванні.

Якщо вам відмовили в позиці через те, що програма скорингу визнала вас некредитоспроможним, не варто впадати у відчай. Можливо, параметри алгоритму несприятливі для вас тільки в цьому банку. Щоб перевірити це, спробуйте пройти скоринг у нашому сайті.

При видачі кредитів банки прагнуть отримати максимальний прибуток та гарантувати повернення переданих позичальнику коштів. Щоб знизити ризик прострочок, фінансові організації ретельно аналізують всіх претендентів і схвалюють лише заявки, зобов'язання за якими виконуватимуться з великою ймовірністю.

Оцінка кредитоспроможності позичальника – фізичної особи часто здійснюється з допомогою (від англійської scoring – «підрахунок очок»). Скорингова модель аналізує фактори, що впливають на ризик неповернення позики, та видає рекомендації щодо схвалення заявки або відмови. При оформленні кредиту позичальнику насамперед пропонується заповнити анкету. На основі цих даних виставляється оцінка. За кожен параметр клієнт отримує певну кількість балів, діють коефіцієнти, що підвищують і знижують. Підсумковий результат раніше підраховували вручну банківські співробітники, сьогодні це робиться автоматично у спеціальних програмах.

Де застосовується скоринг

Скорингова модель широко використовується в галузі мікрофінансування та експрес-кредитування, де розгляд даних потенційного позичальника та ухвалення рішення займають менше 1 години. Для перевірки кредитоспроможності до спеціальної програми вносять інформацію із заповненої заявки. Система автоматично порівнює вказані потенційним позичальником дані зі статистикою. Так, якщо в базі є відомості про те, що люди аналогічного віку чи професії нерідко не повертають кредит, рішення за заявкою може бути негативним. У разі банк чи мікрофінансова організація зазвичай відмовляє потенційному позичальнику без пояснення причин.

Переваги скорингової системи ОЦІНКИ КРЕДИТОЗДАТНОСТІ

Швидкість прийняття рішень.Якщо аналізом платоспроможності позичальника займається співробітник банку, це вимагатиме багато часу. Фахівцю необхідно самостійно перевірити кожен параметр, вручну внести всі отримані результати та зробити висновок. З допомогою сучасних скорингових систем оцінки кредитоспроможності дані обробляються швидко, отже, і рішення приймається оперативно.

Об'єктивність.Навіть досвідчений і кваліфікований фахівець може припуститися помилки у підрахунках або сформувати упереджену думку через особисте ставлення до клієнта. Скоринг-бал – набагато об'єктивніший показник кредитоспроможності, оскільки він обчислюється в автоматичному режимі. Співробітник банку неспроможна вплинути працювати алгоритму.

Фінансова вигідність.Використання скорингової моделі оцінки кредитоспроможності дозволяє значно зменшити частку неповернення. Не лише збільшує прибуток банку, а й дає можливість пропонувати вигідніші тарифи клієнтам. Рівень неповернення прямо впливає на відсоток за кредитами, тому сумлінні платники також зацікавлені у його зниженні.

Від чого залежать результати скорингу

Підсумкова оцінка при використанні будь-якої моделі скоринга складається з цілого ряду показників. Насамперед перевіряються паспортні дані позичальника, інформація про місце проживання та інші контактні дані. Це попередній етап, на якому відсіваються претенденти із недійсними документами. Потім відбувається аналіз інших чинників.

  • Особиста інформація клієнта.Скоринг-оцінка враховує сімейний стан позичальника та наявність у нього неповнолітніх дітей. Також береться до уваги тривалість стажу на останньому місці роботи.
  • Платоспроможність претендента.Один із найвагоміших чинників, що впливають на скоринг-бал. Щоб одержати схвалення, важливо довести наявність не лише достатніх для погашення позики коштів, а й регулярних виплат. Для оцінки фінансового стану та кредитоспроможності в більшості випадків (особливо при видачі великих кредитів) потрібно надати документи з місця роботи: довідку 2-ПДФО або за формою банку. Іноді враховуються також витрати претендента (на утримання утриманців, комунальні послуги тощо).
  • Кредитна історія.При скоринговій оцінці кредитоспроможності клієнтів обов'язково проводиться перевірка заборгованостей і прострочок раніше взятим позичкам. Банк може за наявності згоди отримати дані претенденту з бюро кредитних історій (БКІ), в яких відображається вся необхідна інформація. Також системою береться до уваги наявність або відсутність регулярних виплат за позиками, що діють. У БКІ фіксується історія заявок, зроблених претендентом: наявність великого відсотка відмов від інших фінансових організацій може знизити оцінку.
  • Транзакційна поведінка.Якщо позичальник є зарплатним клієнтом або має депозит у банку, скоринг бал при визначенні кредитоспроможності може бути підвищений. При цьому враховується розмір накопичень на рахунку та їх динаміка.

Всі дані скорингова система перевіряє окремо і порівнює їх між собою, щоб виявити можливі протиріччя. Підтвердженням достовірності зазначених відомостей є наявність зв'язку між доходами та витратами потенційного позичальника, місцем роботи та адресою проживання тощо.

Аналіз даних скорингу

На основі одержаного результату система виносить рішення:

  • схвалення- Оцінка висока, заявка може передаватися на наступний рівень;
  • відмова- претендент набрав надто низький бал, тож розгляд запиту припиняється;
  • потрібен додатковий аналіз- система недостатньо даних для виставлення адекватної оцінки. У цьому випадку фахівець банку самостійно вивчає анкету заявника та уточнює інформацію. Для підтвердження спірних аспектів претендента можуть вимагати додаткові документи. Після ручного розгляду заявки приймається остаточне рішення.

Як отримати високий скоринг-бал

Виключити прострочення за позиками.Щоб збільшити шанси на хорошу оцінку та схвалення заявки, потрібно мати чисту кредитну історію. Це означає, що у претендента не повинно бути прострочення з інших позик або непогашених боргів. Тому навіть у разі виникнення фінансових труднощів важливо стежити за своєю кредитною історією. Краще вчасно надати банку документальне підтвердження тимчасової неплатоспроможності та розробити схему реструктуризації боргу чи відстрочки. Це дозволить закрити поточний кредит та підвищити ймовірність схвалення нового.

Відкрити банківський вклад.У більшості банків можна отримати додаткові скоринг-бали за наявності рахунку, тому краще заздалегідь завести депозит.

Вказати у заявці лише реальні відомості.На оцінку впливає акуратність у заповненні анкети. Інформація має бути об'єктивною та правдивою: сумніви щодо достовірності відомостей можуть стати причиною для відмови у кредиті.

Зверніть увагу на актуальність контактів в анкеті.Щоб підвищити скорингову оцінку кредитоспроможності, необхідно вказувати лише реальні контактні дані. Співробітник банку повинен мати можливість додзвонитися всім абонентам, телефони яких вписав потенційний позичальник. Якщо зв'язатися з ними не вдасться, ці дані можуть визнати недостовірними. Це один із приводів відмовити у кредитуванні.

Якщо скорингова оцінка виявилася занадто низькою і заявку було відхилено, це може свідчити, що модель і алгоритм конкретного банку не підходять позичальнику. Фінансові організації часто використовують власні системи, у яких враховується різний набір чинників.

Що робити при відмові

При низькому скоринг-балі система зазвичай просто відхиляє заявку, при цьому клієнт не повідомляє про причини такого рішення. Співробітники банку часто рекомендують повторити звернення за кілька місяців. В якості альтернативи можна спробувати подати заявку до іншої фінансової організації. Однак робити це слід з обережністю: всі відмови фіксуються в кредитній історії, а якщо їх дуже багато, оцінка знижується. Щоб ще до звернення до банку дізнатися про наявність та кількість відхилених заявок, можна надіслати запит до БКІ.

Скорингова модель не дає об'єктивних та релевантних результатів, якщо клієнт звертається за позикою вперше. Для таких випадків деякі банки використовують лише ручну обробку заявок фахівцями. При цьому фактично таким клієнтам часто пропонують менш вигідні умови, підвищені відсоткові ставки та зменшену суму позички. Так банк знижує збитки від можливого неповернення. Однак якщо погасити першу позику вчасно і без прострочень, це відобразиться в кредитній історії, тому вже наступного разу можна буде розраховувати на більш високу оцінку.

Щоб скористатися послугами НБКІ з розробки та використання методик скорингової системи, заповніть форму заявки на сайті.

Історично скоринг як підхід був уперше використаний у біологічних дослідженнях у другій половині 30-х років. 20 століття для сортування об'єктів, які було неможливо розсортувати на підставі якоїсь однієї ознаки, а іншим способом або дуже утруднено, або навіть неможливо. Наприклад, так сортувалися черепи (за приналежністю до одного чи іншого племені) або цибулини ірисів (за приналежністю до того чи іншого сорту).

Термін « скоринг» означає математичний підхід, за допомогою якого на підставі набору відомих (або вимірюваних) характеристик об'єкта прогнозується певна потрібна характеристика, яку на момент оцінки прямо виміряти неможливо, при цьому навмисно уникає пошук якихось причинно-наслідкових зв'язків.

Кредитний скоринг- це використання скорингових рішень у процесі кредитування, причому як фізичних осіб, так і юридичних (особливо підприємств малого та середнього бізнесу).

Першорядне завдання, яке вирішують при кредитуванні за допомогою скорингу, - це управління ризиками.

Spiegel – великий американський рітейлер – дуже рано почав використовувати кредитний скоринг. Іншою такою фірмою стала Household Finance Corp. Вже 1946 р. її президент Є.Ф. Вандерлік розробив Credit Guide Score для оцінки нових заявників, проте впровадження йшло важко (згодом менеджери його філій зізнавалися, що вони спочатку видавали кредити, а потім підганяли бали, щоб виправдати прийняте рішення).

У 1956 р. на американському фінансовому ринку сталася подія, яка кардинально змінила ситуацію у сфері кредитного скорингу. Американці - інженер Біл Файр та математик Ерл Айзек, які працювали в Стенфордському дослідному інституті, вигадали першу кредитну скорингову модель. Партнери розробили математичний алгоритм, який обчислює рівень кредитоспроможності позичальника у цифровому вираженні. Інакше кажучи, алгоритм дозволяє прораховувати кредитні ризики як тризначного числа, що є кредитним рейтингом. Вони організували компанію Fair, Isaac and Company (2003 р. вона була перейменована на Fair Isaac Corporation, а 2009 р. - FICO).

У Росії масове використання скорингів у роздрібному кредитуванні також стало повсюдною практикою. Російські банки активно використовують і зовнішні скоринги FICO, і власні скорингові карти, розроблені навіть за допомогою американських консультантів.

У сімдесяті роки минулого століття, з одного боку, почався бурхливий розвиток засобів обчислювальної техніки, а з іншого - бум кредитування. І тоді скорингові системи почала впроваджувати більшість банків. Більше того, деякі з них розробили власні системи, не вдаючись по допомогу стороннім компаніям.

Коли середині дев'яностих років у Росії почалося поступове використання скорингових систем, вітчизняні банки зіштовхнулися з дилемою: розробляти їх самостійно чи купувати в західних виробників. Через 15 років з'явився третій варіант: віддати скоринг на аутсорсинг.

З 29 липня 2013 р. Ощадбанк при видачі роздрібних кредитів використовує інтегральну оцінку позичальника, яка заснована на Скорінг Бюро 3 покоління (сервіс надається Об'єднаним Кредитним Бюро (ОКБ)) та системі внутрішнього скорингу кредитної організації.

Тестування сервісу показало, що спільне використання двох моделей скорингу дає додатковий ефект, підвищуючи якість інтегральної моделі банку більш ніж на 10%.

З появою наприкінці 60-х років. кредитних карток і банки, та інші емітенти зрозуміли корисність кредитного скорингу. Велика кількість клієнтів, що подають заявки на кредитні картки щодня, унеможливила - ні економічно, ні з погляду трудовитрат - ніяке інше рішення, крім автоматизації прийняття рішення про кредитування. При використанні кредитного скорингу ці організації швидко виявили, що ця методика є більш надійним прогнозом, ніж експертні оцінки (відсоток дефолтів знизився на 50% і більше).

Види кредитного скорингу

Як правило, виділяють щонайменше три області застосування кредитного скорингу:

  1. скоринг заяв (application scoring);
  2. поведінковий скоринг (behaviour scoring);
  3. скоринг зі стягнення (collection scoring).

Скоринг заяв- це визначення кредитоспроможності (рівня ризику дефолту) заявника при прийнятті рішення про надання кредиту на підставі даних, доступних у момент подання заяви; - інформації власне із заяви, власних даних кредитної організації, даних із кредитного бюро, а також інших доступних баз даних (наприклад , за втраченими паспортами).

При цьому приймається не тільки рішення про надання кредиту, а й про розмір та умови кредитування.

Після того, як кредит виданий, необхідно відстежувати його використання та повернення. І якщо у разі кредитів із фіксованими умовами, тобто. Ключовим є визначення кредитоспроможності клієнта на даний момент видачі кредиту, то кредитної лінії - зокрема револьверної кредитної картки - ситуація відрізняється докорінно. Невідомо, як клієнт користуватиметься кредитом - відразу вибере весь кредитний ліміт або тільки його частину, як повертатиме - відразу все або тільки мінімальний встановлений платіж, і чи не зміниться його кредитоспроможність через шість місяців або через рік. І це – область поведінкового скорингу, де під цією назвою насправді ховається цілий набір розв'язуваних завдань.

Насамперед це оцінка ризику прострочення платежу та/або неповернення та визначення тих дій, які необхідно вжити, - у цьому поведінковий скоринг переходить у скоринг зі стягнення(collection scoring).

p align="justify"> Наступним завданням, що вирішується в рамках поведінкового скорингу, є визначення прибутковості/збитковості клієнта для кредитної організації. Для цього відстежується історія його транзакцій протягом певного відрізка часу (наприклад, шести місяців) і згідно з встановленими критеріями визначається його «цінність», а потім на підставі вже відомих клієнтських історій та профілів клієнтів прогнозується майбутня «прибутковість» клієнтів, які перебувають у кредитному портфелі Наразі.

У цьому класі визначення таких важливих параметрів клієнтів, як ймовірність їх догляду (attrition), схильність їх до використання даного чи інших продуктів (propensity), і навіть збільшення обсягів використання (up-sale) чи придбання інших продуктів (cross-sell) .

Слід зробити два вкрай важливі зауваження:

1) дані щодо транзакцій використовуються для виявлення та запобігання шахрайству (і це теж відносять до поведінкового скорингу);

2) для поведінкового скорингу дедалі більшою мірою застосовуються дані як за конкретним рахунком (продукту), а весь комплекс даних із клієнту, тобто. як він користується всім набором використовуваних продуктів.

Прагматичний підхід, тобто. відмова від пошуку причинно-наслідкових зв'язків між параметрами та використання виявлених залежностей між параметрами для прогнозування поведінки клієнта (ймовірності дефолту за кредитом), викликає у багатьох досить сильне відторгнення та призводить до певних законодавчих обмежень у цій галузі в деяких країнах.

Основи розробки рейтингової таблиці, її перевірки та налаштування

Незважаючи на те, що у кожного банку своя «система цінностей», жоден банк не обходиться без типових скорингових питань.

1. Особисті дані. Стать, вік, сімейний стан, наявність або відсутність утриманців, освіта.

Підлога . Система з більшою симпатією ставиться до жінок, оскільки за статистикою слабка стать більш відповідально підходить до погашення своїх зобов'язань.

Вік. Найбільш привабливим для банку є клієнт віком від 25 до 45 років. Що далі людина перебуває від цього вікового діапазону, то менше його бал.

Сімейний стан. Як правило, наявність сім'ї, навіть у тому випадку, якщо стосунки не узаконені формально, є плюсом. Стабільні відносини, планування бюджету, з погляду банку, дисциплінують потенційного позичальника.

Утриманці. Якщо потенційний позичальник має лише одну дитину, це, як правило, не позбавляє балу, проте чим більше дітей, тим нижче бал.

Освіта . Людина із середньою освітою сприймається як недостатньо успішна і стабільна, потенційно здатна знехтувати своїми зобов'язаннями за кредитом, на відміну від людини, яка здобула вищу освіту.

2. Фінансові показники. Загальний трудовий стаж, загальний стаж на останньому чи останніх двох-трьох місцях роботи, професія, рівень заробітної плати та загальних витрат.

Чим стабільніша людина у плані свого працевлаштуваннятим вище його бал. Часта зміна місць роботи, нетривалість роботи на кожному з них говорять про нестабільність потенційного позичальника і, як наслідок, його прибутку.

Тип професії. Найбільш привабливими для банку є фахівці, робітники, держслужбовці, керівники середньої ланки (постійна робота по найму). Недолюблюють банкіри керівників компаній, фінансових директорів, нотаріусів (що займаються приватною практикою), а також власників та співвласників бізнесу. Важливо розуміти, що, на відміну від найманих співробітників, власник своєї справи не має щомісячного фіксованого доходу. Те саме можна сказати про індивідуальних підприємців – таким позичальникам краще подавати документи як фізичним особам.

Безперечно, банк зверне увагу на співвідношення витрат та доходів. З одного боку, система аналізує, наскільки можна порівняти витрати на оплату кредиту з фінансовими можливостями клієнта і чи не буде обтяжливим для нього додатковий кредитний договір. З іншого боку, якщо позичальник заявляє про високі доходи, але при цьому вимагають незначної суми, це викликає як мінімум настороженість. Навіщо людині з доходом 50 тис. крб. кредит у 6 тис.?

Дуже уважно банки ставляться до наявності раніше взятих та непогашених кредитів. Якщо позичальник вже має щомісячні виплати за кредитним договором, то банк спрогнозує платоспроможність людини з дуже великим (для себе) запасом.

3. Супутня інформація.

Додаткове джерело доходу (додаткове місце роботи, дохід співпозичальника), наявність автомобіля, гаража, дачі, земельної ділянки в особистій власності, безперечно, додадуть балів. Приблизно також справи з вже наявними погашеними кредитами: відсутність колишніх прострочок, своєчасне погашення своїх зобов'язань перед кредитною організацією, відсутність поточних прострочок сприймаються позитивно. Чим більше балів позичальник набрав, тим більше він подобається банку.

В даний час кредитний скорингґрунтується на методах статистичних досліджень чи досліджень операцій (operational research). Статистичні підходи включають дискримінаційний аналіз, в основі якого лежать лінійна регресія і більш ефективна логарифмічна регресія і класифікаційні дерева (classification trees), іноді звані алгоритмами рекурсивного поділу. Методи дослідження операцій включають певні варіанти лінійного програмування. Більшість розробників скорингових моделей застосовують один або кілька вищезгаданих методів, часто в комбінації. Крім того, у розробці скорингових моделей використовується низка методів непараметричної статистики та підходи моделювання за допомогою «штучного інтелекту». Так, в останні десятиліття випробовувалися підходи нейронних мереж, експертних систем, генетичних алгоритмів та методи «найближчих сусідів». Дуже цікаво, що до однієї й тієї класифікаційної проблеми застосовуються настільки різноманітні методи. Частково це обумовлено виключно прагматичним підходом до проблеми зниження ризику при видачі кредитів: якщо працює – треба використати! Мета - спрогнозувати, хто не впорається з поверненням, а не дати пояснення, чому не впорається, або підтвердити ту чи іншу гіпотезу про зв'язок між невиплатою та певними економічними чи соціальними параметрами (що частково спровокувало бурхливі обговорення та прийняття акту ECOA).

Побудова скорингових моделей

Для побудови скорингових моделей (причому незалежно від обраного математичного підходу) береться репрезентативна вибірка з попередніх заявників (від кількох тисяч до сотень тисяч – що не проблема галузі, яка обслуговує десятки мільйонів клієнтів). Для кожного заявника вибирається повна інформація з анкети-заяви та інформація з його кредитної історії за фіксований період часу (зазвичай 12, 18 або 24 міс.). Потім приймається експертне рішення, яку вважати прийнятною, тобто. чи є клієнт «хорошим» чи «поганим».

Емпіричні вимоги до бази даних, що використовуються для побудови скорингової моделі:

  • розмір вибірки - щонайменше 1500 всього, щонайменше 500 поганих;
  • чітке визначення критерію «поганий/хороший»;
  • чітке визначення тимчасового відрізка - періоду життя продукту (залежить від самого продукту та може змінюватися від місяця - мобільний телефон до десятиліть - іпотека);
  • стабільність складу клієнтської групи – демографія, міграції, збереження навичок споживання;
  • неявна, але обов'язкова вимога: стабільність економічних, політичних, соціальних та інших умов.

При побудові кредитних моделей суттєвим є вибір тимчасового горизонту – відрізка часу між подачею заяви (видачею кредиту) та класифікацією «поганий/хороший». Аналіз показує, що відсоток дефолту як функція тривалості перебування клієнта з організацією спочатку зростає і лише через 12 місяців (кредитні картки) і більше (разові позики) починає стабілізуватися. Таким чином, менший часовий обрій призводить до недооцінки і не враховує повністю всіх характеристик, що передбачають дефолт. З іншого боку, тимчасовий горизонт понад два роки залишає модель схильної до зрушень у складі клієнтської групи протягом цього часу, т.к. як склад клієнтів у вибірці на початку тимчасового горизонту може виявитися суттєво відмінним від складу клієнтів, які зараз приходять. Фактично використовуються два одноразові зрізи (на початку та наприкінці тимчасового горизонту) для створення моделі, яка стабільна за часом (за межами початкового тимчасового відрізка). Це і диктує вибір довжини тимчасового відрізка – тимчасового горизонту під час моделювання.

Далі побудова скорингової моделіперетворюється на класифікаційну проблему, де вхідними характеристиками (або параметрами) є відповіді на запитання анкети-заяви та параметри (або дані), які отримуються в результаті перевірок з різних організацій (наприклад, поліції, судів, місцевих рад, кредитних бюро тощо). ), а вихідними характеристиками (відповіддю) - шуканим результатом - є поділ клієнтів на «хороших і поганих» згідно з наявними кредитними історіями, зіставленими за цими вхідними характеристиками.

Власне рейтингова таблиця (scorecard) - це система надання чисельних балів (рахунку) характеристикам (або параметрам) позичальника для отримання шуканого числового значення, яке відображає, з якою ймовірністю у позичальника по відношенню до інших позичальників станеться певна подія або він здійснить певну дію (аспект "по відношенню" у визначенні дуже важливий).

Кредитна рейтингова таблицянаприклад, не показує, який рівень ризику слід очікувати (скажімо, який відсоток кредитів даного типу, ймовірно, не буде повернутий); натомість вона показує, як ця позика, швидше за все, поводитиметься стосовно інших позик. Наприклад, чи очікується, що відсоток неповернень або дефолтів для кредитів з цим набором атрибутів буде більшим або меншим, ніж у кредитів з іншим набором.

Більшість рейтингових таблиць побудовано за допомогою розрахунку регресійної моделі - статистичної моделі, яка перевіряє, як окремий параметр (характеристика) впливає інший параметр чи (найчастіше) цілий набір інших параметрів.

Регресійна модель дає в результаті свого застосування набір коефіцієнтів (factors), званих регресійними, які можна інтерпретувати як кореляцію між параметрами (які необхідно визначити) і пояснювальними параметрами, зберігаючи незмінними всі інші впливу на параметри, що шукаються. Ці коефіцієнти перетворюються на ваги балів (point weights) у рейтинговій таблиці.

Слід зазначити, що якість скорингових моделей слід постійно перевіряти та моніторинг є обов'язковою процедурою в процесі експлуатації. Згодом можуть змінюватися як економічні умови, так і поведінкові особливості позичальників, і лише своєчасне підстроювання або навіть заміна скорингових моделей забезпечить ефективне управління кредитними ризиками.