Seminar despre construirea modelelor de scoring pentru marketing. Formarea unui model de scoring pentru evaluarea bonității unui debitor corporativ

Împrumut

Este ușor să trimiți munca ta bună la baza de cunoștințe. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

Postat pe http://www.allbest.ru/

Postat pe http://www.allbest.ru/

  • Introducere
    • 1.4 Rețele neuronale
    • 1.5 CHAIDanaliză
    • 1.6 Alte metode
    • 2.1 Declarația problemei
    • 3.1 Problema Monge-Kantorovici
    • 3.2 Aplicarea problemei Monge-Kantorovich la punctaj
  • Concluzie
  • Referințe

Introducere

Scorul este o modalitate euristică de a construi evaluări și de a clasifica diferite obiecte în grupuri. Se bazează pe presupunerea că oamenii cu indicatori sociali similari se comportă în același mod. Este folosit în sectorul bancar, marketing, afaceri de asigurări.

Scopul principal al scoring-ului tradițional este de a clasifica clienții băncii în „buni” și „răi”, pe baza cărora creditorul poate alege acțiunile adecvate în raport cu acest client. Un client „rău”, de exemplu, poate fi definit ca un client cu o probabilitate empirică scăzută de a rambursa împrumutul. Dar, de regulă, această definiție a unui client „rău” se extinde la orice comportament al clientului care este nedorit pentru bancă. Clasificarea se realizează pe baza unui card de punctaj, cu ajutorul căruia se calculează scorul de punctaj al clientului. punctaj bayesian discriminant

Din literatura de specialitate privind scoring, remarcăm mai multe lucrări.

„Guide to Credit Scoring”, editat de Elizabeth Maze, 2008, este singura carte despre scoring în limba rusă. Descris concepte generale, sunt examinate metodele de construire a unui card de punctaj și se discută aplicarea punctajului în practică. Cartea constă în articole scrise de experți străini în domeniul finanțelor.

Teza lui Samuel Glasson, „O metodă de eșantionare cenzurată pentru scorul de credit”, 2007. Examinează instrumentele de analiză a supraviețuirii aplicate scorului de credit în condiții de date cenzurate. Se discută aplicarea metodei regresiei liniare și, în special, a metodei Buckley-James. Partea practică a lucrării implică aplicarea acestor metode pentru estimarea momentului de nerambursare a creditului și momentul plății următoarei plăți.

Lucrarea de disertație a lui Christina Bolton „Regresiile logistice și aplicarea lor în scoringul de credit”, 2009. Conceptul de scoring de credit este analizat în raport cu bancarîn Africa de Sud. Metodele de construire a unui model de notare sunt luate în considerare cu accent deosebit pe metoda regresiei logistice. Această metodă este utilizată pentru a crea un model de scor.

Lucrarea de disertație a lui Matthias Krempl „Modele adaptive și aplicarea lor în scoringul creditelor”, 2011. Accentul este pus pe studierea metodelor de construire a modelelor predictive în condiții de deriva și întârziere a datelor. Este prezentată o nouă metodă de construire a modelelor de punctare bazate pe metoda arborelui de decizie. Metoda prezentată este aplicată pentru a estima deviația în două seturi de date financiare reale.

În lucrările de mai sus există problemă comună: aplicarea metodelor la construirea modelelor de scoring nu este justificată. Acest lucru ridică îndoieli cu privire la corectitudinea datelor obținute. Sarcina este de a construi o metodă a cărei aplicare ar fi justificată. Această lucrare prezintă o metodă care rezolvă această problemă.

Există multe abordări pentru construirea unui model de notare. Capitolul 1 al acestei lucrări descrie metodele utilizate în disertațiile de mai sus. Capitolul 2 introduce model matematic scoring și examinează abordarea empirică bayesiană pentru construirea unui model de notare: abordarea este descrisă teoretic și apoi aplicată datelor reale de la Sberbank din Rusia pentru a construi un model de notare. Capitolul 3 introduce o metodă bazată pe problema Monge-Kantorovovich. Se oferă o justificare teoretică pentru utilizarea acestei metode. Acesta este apoi folosit pentru a construi un model de scor pe datele utilizate în Capitolul 2.

Capitolul 1. Metode de construire a modelelor de notare

1.1 Istoricul apariției și dezvoltării punctajului

Scorul a fost dezvoltat inițial pentru a automatiza procesul de decizie privind împrumutul. Înainte de introducerea punctajului, s-a luat decizia cu privire la cine să acorde un împrumut în ce sumă expert în credite. A decis acest lucru pe baza experienței și a propriei opinii, ghidat de parametrii clientului care îi afectează bonitatea.

În anii 1940 a început introducerea sistemelor de punctare. În 1941, David Durand a publicat prima lucrare de cercetare despre credit scoring, care a evaluat rolul diverșilor factori într-un sistem predictiv. După sfârșitul celui de-al Doilea Război Mondial, cererea de produse de credit, și a devenit clar că metodele tradiționale de luare a deciziilor nu funcționează bine în condiții număr mare clientii. O explozie a cererii de împrumuturi, determinată parțial de introducerea carduri de credit, creditori motivați să implementeze sisteme automatizate luarea deciziilor privind acordarea de împrumuturi. Dezvoltarea paralelă a tehnologiei informatice a contribuit la aceasta și a făcut posibilă procesarea unor cantități mari de date financiare.

În 1956 a fost creată compania FICO, angajată în dezvoltări în domeniul creditelor de consum. În anii 60 a început introducerea tehnologiei informatice în domeniul punctajului. În 1963, s-a propus utilizarea analizei discriminante a datelor pentru evaluarea creditului. Și în cele din urmă, în 1975, odată cu adoptarea Legii SUA privind egalitatea de șanse de credit I, scorul a fost în sfârșit recunoscut.

Un pas important în dezvoltarea scoring-ului de credit a fost apariția scoring-ului comportamental la începutul anilor 90. Scopul său este de a anticipa plățile de la clienții existenți.

Recent, dezvoltarea sistemelor de notare a fost condusă de reglementări din mediul extern. Ca parte a cerințelor de adecvare a capitalului impuse băncilor în legătură cu intrarea în vigoare a celui de-al doilea acord de la Basel (Comitetul de la Basel pentru Supravegherea Bancară 2001), instituțiile trebuie să monitorizeze îndeaproape riscurile asociate cu portofolii de credite. Metodele de credit scoring vă permit să faceți acest lucru.

De la introducerea primului sistem de notare, multe matematice și metode statistice. Unele dintre cele statistice includ: analiza discriminantă, regresia liniară, regresia logistică și arborele de decizie. Alte metode provin din matematică: programare matematică, rețele neuronale, algoritmi genetici și sisteme expert. În continuare, vom analiza cele mai comune metode și vom vorbi despre avantajele și dezavantajele acestora.

1.2 Analiză discriminantă liniară și regresie liniară

Analiza discriminantă liniară este o metodă de clasificare a obiectelor în categorii predefinite. Ideea este de a găsi o combinație liniară de variabile explicative care să clasifice cel mai bine obiectele în categorii. Prin separare înțelegem cel mai bine una care asigură distanța maximă între mijloacele acestor categorii. Scorul de scor este calculat ca o funcție liniară a valorilor atributelor clientului:

Aici, sunt valorile atributelor clientului, sunt parametrii modelului care maximizează relația

unde este vectorul mediilor pentru bunŞi rău clienți, este matricea generală de covarianță.

Metoda discriminantă liniară presupune că sunt îndeplinite două condiții. În primul rând, matricele de covarianță ale variabilelor independente pentru ambele grupuri trebuie să fie aceleași. În al doilea rând, variabilele independente trebuie să fie distribuite normal. Adesea, în punctare, variabilele independente sunt discrete sau nu sunt distribuite normal. Prin urmare, apar probleme în aplicarea acestei metode. Cu toate acestea, s-a demonstrat că, chiar și în cazul încălcării normalității, această metodă este aplicabilă pe scară largă. Avantajul său este ușurința în utilizare.

O metodă similară de regresie liniară este, de asemenea, utilizată pentru a forma un model de scor. În cazul a două categorii, este echivalentă cu metoda analizei discriminante liniară și exprimă dependența unei variabile (dependente) de altele (independente). ÎN vedere generală arata asa:

Variabila dependenta;

Variabile independente explicative;

Coeficienți de regresie necunoscuți, care se găsesc folosind metoda celor mai mici pătrate;

Pentru a aplica modelul de scoring liniar este necesară următoarea ipoteză: relația dintre variabilele dependente și independente trebuie să fie liniară. În caz contrar, acuratețea estimării se deteriorează semnificativ. Erorile trebuie să fie independente și distribuite normal.

Ca și în cazul analizei discriminante, într-un cadru de punctaj de credit, ipotezele necesare pentru aplicarea regresiei liniare sunt adesea încălcate. Regresia liniară poate produce o estimare a probabilității în afara intervalului, ceea ce este inacceptabil. De exemplu, regresia logistică nu are acest dezavantaj.

1.3 Regresia logistică și regresia probit

Aceste tipuri de regresie sunt mai potrivite pentru construirea unui model de punctare, deoarece permit prezentarea categorică a datelor. Modelul de regresie logistică este specificat după cum urmează:

unde este o estimare a probabilității ca clientul să fie „rău” , - un vector de parametri de regresie necunoscuți, care se calculează prin condiția maximizării raportului de probabilitate.

Modelul de regresie logistică se bazează pe funcția logaritm. La rândul său, regresia probit se bazează pe o distribuție normală și este specificată după cum urmează:

Unde. Vectorul se găsește în același mod ca și în modelul de regresie logistică.

Deoarece regresia logistică și regresia probit utilizează distribuții care sunt similare ca formă, rezultatele acestor modele sunt, de asemenea, similare. Regresia logistică este preferată deoarece calculele sunt mai simple decât regresia probit și există mai multe instrumente pentru a lucra cu aceasta. Datorită naturii sale binare, regresia logistică este de preferat regresiei liniare atunci când este utilizată pentru a construi modele de punctare. În practică, s-a constatat că diferența de acuratețe a rezultatelor prezise este nesemnificativă. Cu toate acestea, există o predominanță a regresiei logistice în sistemele de notare.

1.4 Rețele neuronale

Rețelele neuronale artificiale sunt o simulare a rețelelor neuronale găsite în natură. Acest concept a apărut în încercarea de a modela procesele care au loc în creierul uman.

Rețelele neuronale, numite și perceptron multistrat, sunt deosebit de potrivite pentru rezolvarea problemei de clasificare. Sunt utilizate pe scară largă în diverse domenii: finanțe, informatică, fizică și medicină. Popularitatea rețelelor neuronale se datorează parțial capacității de a simula situatii dificile fără costuri speciale din partea utilizatorului care utilizează această metodă. Prin natura lor, rețelele neuronale detectează automat orice situație neliniară din date și se adaptează la aceasta. De asemenea, rețelele neuronale multistrat sunt aproximatori universali, adică pot aproxima orice funcție cât de precis se dorește.

Rețelele neuronale constau din straturi care, la rândul lor, sunt formate din noduri. Există 3 tipuri de straturi în rețele: intrare, ascuns, ieșire. Stratul de intrare constă din atribute ale clientului, cum ar fi sexul, vârsta etc.

Ieșirea pentru nodul k-lea cu m intrări este reprezentată după cum urmează:

unde este funcția de activare, este vectorul de date de intrare, este vectorul de greutate care denotă puterea conexiunii dintre noduri.

Principalul dezavantaj este că, în ciuda posibilității de a obține o precizie ridicată a prognozei, este imposibil de înțeles motivele pentru care a fost luată o anumită decizie.

În contextul punctajului de credit, s-a dovedit că rețelele neuronale funcționează la fel de bine ca metodele tradiționale.

1.5 Analiza CHAID

Această metodă este excelentă pentru a găsi relații între date, mai ales dacă relațiile sunt neliniare. Este folosit pentru a construi arbori de decizie și are multe în comun cu metode clasice precum analiza discriminantă și regresia liniară.

Abrevierea CHAID înseamnă Chi-squared Automated Interaction Detector.

Flexibilitatea acestei metode o face atractivă de utilizat, dar asta nu înseamnă că ar trebui folosită în locul metodelor tradiționale. Atunci când sunt întâlnite ipoteze de distribuție teoretică stricte, metodele tradiționale sunt de preferat. Ca tehnică de cercetare sau atunci când metodele tradiționale eșuează, analiza CHAID este un instrument de neegalat.

CHAID construiește arbori non-binari (adică arbori care pot avea mai mult de două ramuri) pe baza unui algoritm relativ simplu, care este deosebit de potrivit pentru analiza seturi de date mari. Algoritmul se bazează pe aplicarea testului chi-pătrat.

1.6 Alte metode

Arborele de decizie.

Metoda împarte datele în subseturi, fiecare dintre acestea având un comportament mai uniform decât setul de date original. Fiecare dintre aceste subseturi este împărțit în continuare conform aceluiași algoritm. Rezultatul împărțirii se numește „frunză” a copacului. Există și alte metode care funcționează pe un principiu similar.

Avantajele acestei metode sunt simplitatea și intuitivitatea. Metoda este capabilă să se ocupe de observațiile lipsă. Este aplicabil mai ales în cazul în care nu se știe aproape nimic despre date înainte de a le studia și este imposibil să se facă presupuneri sau ipoteze.

Principalul dezavantaj al acestei metode este complexitatea calculelor computerizate. Datorită volumului copacilor rezultați, procesul de studiere a modelului necesită forță de muncă. Schimbările în situație pot duce la o revizuire a întregului arbore de decizie.

Metoda este utilizată în principal ca metodă auxiliară. De exemplu, pentru a determina variabilele care explică cel mai puternic comportamentul variabilei dependente.

Metodăkvecinii cei mai apropiati. Metodă neparametrică pentru clasificarea obiectelor. Pe baza unei valori care determină asemănarea dintre date.

Inițial, datele de antrenament sunt introduse, împărțite în clase. Se introduc apoi datele de evaluat și se determină asemănarea dintre datele de intrare și cele de antrenament. Pe baza metricii, sunt selectați k vecini cei mai apropiați. Noul element este atribuit clasei căreia îi aparțin majoritatea vecinilor săi.

Numărul de vecini k este determinat de compromisul dintre compensare și varianță. Cu cât clasa este mai mică, cu atât k este selectat mai mic. Nu este necesar ca pentru k mare rezultatul să fie mai bun.

Unul dintre avantajele acestei metode este că este ușor să adăugați date noi fără a schimba modelul. Natura neparametrică a acestei metode vă permite să lucrați cu iraționalități în funcțiile de risc din spațiul de caracteristici.

Lipsa unei metode formale de alegere a k și imposibilitatea interpretării probabilistice a rezultatului, deoarece rezultatul sunt frecvențele așteptate, sunt principalele dezavantaje ale metodei. Aceste dificultăți pot fi rezolvate folosind metoda de aproximare bayesiană.

Această metodă este puțin utilizată în notare. Unul dintre motivele pentru aceasta este că pentru a clasifica un obiect este necesar să existe o bază de date cu toate obiectele.

Mai nou mașină vectorială de sprijin, construit pe învățarea automată, s-a dovedit a nu fi mai rău decât metodele tradiționale de notare. Constă din două procese: primul transformă datele de intrare în date cu dimensiuni mari în spațiul caracteristicilor; al doilea clasifică datele folosind un clasificator liniar. Clasificatorul poate fi, de exemplu, analiza discriminantă liniară.

1.7 Compararea diferitelor metode

Au fost efectuate o serie de studii comparative privind metodele de notare. Criteriile de clasare au fost procentul erorilor de clasificare și curba ROC. Au fost studiate 8 seturi de date.

Evaluare medie

Rețele neuronale

Suport mașini vectoriale

Regresia logistică

Analiza discriminantă liniară

LS-SVM liniar

Arborele Bayes extins

Clasificator naiv Bayes

Funcții de bază radială

k-cei mai apropiați vecini (k=100)

SVM liniar

Analiza discriminantă pătratică

Arborele de decizie

Programare liniară

Arborele de decizie

Arborele de decizie

k-cei mai apropiați vecini (k=10)

Arborele de decizie

Tabelul arată că rețelele neuronale și mașinile vectoriale de suport au fost cele mai bune din cele 8 seturi de date studiate. În plus, metodele tradiționale, cum ar fi analiza liniară și discriminantă, s-au dovedit a fi competitive. Rezultă că majoritatea datelor privind scorul de credit sunt probabil doar ușor neliniare. Ca urmare metode liniare s-au arătat a fi la egalitate cu cele neliniare.

Nu există un model de punctaj optim pentru fiecare situație. Alegerea modelului depinde de date și de scopul pentru care este creat modelul. În plus, metoda care estimează cel mai bine nu este neapărat cea mai bună într-o situație dată.

Capitolul 2. Abordarea empirică bayesiană

În acest capitol, vom analiza abordarea empirică Bayesiană și o vom folosi pentru a construi un model de punctare. Vom construi pe baza statisticilor pe credite de consum banca „Sberbank a Rusiei”.

2.1 Declarația problemei

Să presupunem că există o bancă care oferă împrumuturi persoanelor fizice. Clienții se adresează băncii pentru un împrumut. Banca ia decizia de a acorda un împrumut pe baza informațiilor despre client.

Banca primește informații despre client din diverse surse: de la client însuși, de la birou de creditși din alte surse. Vom lua în considerare informațiile furnizate de client însuși. Banca îl primește printr-un chestionar completat de împrumutat.

În formularul de cerere, împrumutatul indică următoarele date: sex, vârstă, stare civilă, prezența copiilor, venitul lunar, disponibilitatea bunurilor imobiliare etc.

Pe baza acestor date, vom împărți clienții în grupuri în care sunt similari din punct de vedere al anumite semne. Pentru fiecare client, folosind metoda bayesiană, vom găsi un rating - probabilitatea empirică ca clientul să ramburseze împrumutul, cu condiția să aparțină acestui grup.

Pentru a aplica metoda, datele trebuie să îndeplinească următoarele condiții:

· independență - clienții nu sunt de acord să ramburseze împrumutul;

· omogenitate - datele sunt preluate de la o populație generală;

· probabilitate egală - clienții sunt la fel de probabil să fie repartizați în grupuri.

Implementarea lor este verificată mai jos.

2.2 Construirea unui model de punctaj

Să introducem un spațiu de probabilitate. Să notăm în acest spațiu un client bancar.

Fiecare client bancar are un set de caracteristici conform chestionarului completat. De exemplu: căsătorit sau nu, nivelul veniturilor defalcat pe categorii, având mașină și alte caracteristici. Conform acestor caracteristici, introducem o partiție a spațiului în mulțimi

Astfel, mulți clienți sunt împărțiți în grupuri.

Să introducem variabile aleatoare.

Numărul de clienți din al-lea grup.

Din date, putem construi o distribuție de probabilitate empirică comună.

unde este probabilitatea empirică a priori a evenimentului A,

Probabilitatea empirică a evenimentului B dat A,

Probabilitatea empirică a evenimentului A dată condiție B, care se numește probabilitate posterioară,

Probabilitatea empirică a evenimentului B.

Această formulă vă permite să supraestimați probabilitatea evenimentului A, ținând cont de faptul că a avut loc evenimentul B.

Din definiția probabilității condiționate putem scrie:

Exprimând din (1) și substituind expresia pentru în această formulă, obținem:

2.3 Aplicarea modelului la date

Avem date despre 1.977 de clienți ai Sberbank of Russia, inclusiv informații despre dacă au rambursat sau nu împrumutul.

Pentru a aplica abordarea bayesiană, este necesar să ne asigurăm că sunt îndeplinite 3 ipoteze:

· despre independență - clienții nu sunt de acord să ramburseze sau să nu ramburseze împrumutul;

· despre omogenitate - datele sunt preluate de la o populație generală;

· despre tipul de distribuție - datele sunt distribuite la fel de probabil.

Ipoteza independenței

Pentru a testa această ipoteză, vom folosi testul de rang al lui Spearman. Statistica acestui criteriu este coeficientul de corelare a rangului, definit după cum urmează.

Sunt date două serii de observații: i. Pe baza acestor observații, vom construi perechi de ranguri. Prin rang înțelegem numărul de locuri ocupate de o observație în seria de variații. Înțelegem rangul în același mod. Apoi, rearanjam perechile de ranguri în ordinea crescătoare a primei componente. Să notăm seria rezultată.

Coeficientul de corelație se găsește prin formula:

Regiunea critică a criteriului. Pentru a găsi, folosim faptul că legea distribuției tinde să pentru n mare. De aici. Iată funcția de distribuție a legii gaussiene standard.

La nivel de semnificație, =1,959964. Limita zonei critice. Coeficientul de corelație găsit.

Astfel, statistica testului nu se încadrează în regiunea sa critică și putem accepta ipoteza independenței la un nivel de semnificație de 0,05.

Ipoteza omogenității

Ipoteza este formulată după cum urmează. Două mostre sunt date din distribuții și, respectiv, cu funcții de distribuție și. Apoi ipoteza omogenității.

Pentru a testa această ipoteză, vom folosi criteriul Smirnov.

Statistica acestui criteriu este unde sunt funcțiile de distribuție empirice construite din eșantioane și. Regiunea critică este dată sub formă. Pentru n și m mari, limita regiunii critice poate fi considerată egală cu, unde. - Funcția de distribuție Kolmogorov.

Astfel, ipoteza de omogenitate este respinsă dacă. La un nivel de semnificație de 0,05. - limita zonei critice. Statistici.

Statistica testului nu se încadrează în regiunea critică și putem accepta ipoteza de omogenitate la un nivel de semnificație de 0,05.

Ipoteza despre tipul de distribuție

Să formulăm o ipoteză. Ni se oferă un eșantion dintr-o distribuție cu o funcție de distribuție necunoscută. Este necesar să se verifice că este funcția de distribuție a unei distribuții uniforme pe segment.

Pentru a face acest lucru, vom folosi testul de bunăstare a potrivirii Pearson.

Criteriul statistic este. Aici este frecvența observațiilor care se încadrează în segmentul i și este probabilitatea de a cădea în segmentul i. Dacă ipoteza testată este corectă, pentru n mare statisticile respectă o distribuție chi-pătrat cu k-1 grade de libertate.

Ipoteza este respinsă dacă statistica depășește valoarea critică.

Calculăm valoarea statisticii folosind pachetul software Statistica - =24,19468, k-1=39. Limita regiunii critice la nivelul de semnificație.

Astfel, valoarea statisticilor nu depășește nivelul critic și ipoteza despre distribuția uniformă a clienților pe grupuri este acceptată la un nivel de semnificație de 0,05.

Deci, datele satisfac toate ipotezele de mai sus și putem începe să găsim evaluările.

Datele disponibile conțin multe caracteristici diferite ale clienților. Pentru construcție vom folosi 4 dintre ele, cele mai semnificative. Ia Mai mult elemente nu ne sunt permise de limitarea eșantionului nostru (1977 elemente).

Caracteristici selectate: vârsta și sexul împrumutatului, prezența copiilor, plățile împrumutului ca procent din venitul total al împrumutatului. Caracteristica de vârstă ia 3 valori - 18-29, 30-45, 46-...; genul împrumutatului are două semnificații - masculin și feminin; a avea copii are două sensuri - sunt copii și nu există copii; plățile au 5 valori - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

Vom numi fiecare valoare specifică a unei caracteristici o proprietate a împrumutatului. Să împărțim toți clienții noștri în seturi, pe baza prezenței unei proprietăți specifice pentru un anumit client. De exemplu, sunt mulți clienți care nu au copii.

Să dăm aceste notații:

Copii, = Fără copii, = Există copii;

Vârsta, =Vârsta1(18-29), =Vârsta2(30-45), =Vârsta3(46-...);

Gen, =Femeie, =Bărbat;

Plățile împrumutului ca procent din venitul total al împrumutatului, =In1(<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

Formăm seturi noi ca o combinație a tuturor proprietăților posibile ale clientului - pentru toate posibilele De exemplu, setul este format din femei cu vârsta între 18-29 de ani fără copii, plătind<5% от своего суммарного дохода. Количество таких множеств равно 60.

Tabelul 2.1. Setați codificarea.

Fara copii

Sunt copii

Rețineți că - formați o partiție a întregului set de clienți:

Să construim o distribuție empirică comună a două variabile aleatoare discrete - și, unde =(0,1), =(, i=1:60). O vom construi ca raport dintre numărul de clienți care satisfac o pereche de valori ale variabilelor aleatoare (X,Y) și numărul total de clienți.

Să fixăm numărul de clienți corespunzător fiecărei perechi posibile (X,Y).

Tabelul 2.2. Numărul de clienți care au rambursat și nu au rambursat împrumutul din fiecare grupă. 0 - împrumutul a fost rambursat, 1 - împrumutul nu a fost rambursat.

Să construim o distribuție de probabilitate empirică comună. Pentru a face acest lucru, împărțim numărul de clienți care au rambursat și nu au rambursat împrumutul din fiecare grup la numărul total de clienți.

Tabelul 2.3. Distribuția comună de probabilitate empirică.

Figura 2.1. Funcția de distribuție empirică la X=0.

Figura 2.2. Funcția de distribuție empirică la X =1.

Figura 2.3. Histograma distribuției articulațiilor la X=0.

Figura 2.4. Histograma distribuției articulare la X=1.

Să găsim distribuția empirică a probabilităților de a intra în fiecare grup. Pentru a face acest lucru, împărțiți numărul de clienți din fiecare grup la numărul total de clienți. Numărul total de clienți.

Tabelul 2.4. Distribuția empirică a probabilităților de a fi în fiecare grup.

Figura 2.5. Histograma intrării în grupa i.

Pe baza acestui fapt, obținem clasificarea:

· Clienții din grupa 60 sunt riscanți

· Clienți din grupele 1-5, 7-12, 15, 17, 25, 31, 32, 33, 35-37, 39, 40, 42, 54-56, 58 - risc mediu

· Clienți din grupele 6, 13, 14, 16, 18-24, 26-30, 34, 38, 41, 43-53, 57, 59 - de încredere

Capitolul 3. Abordare bazată pe problema Monge-Kantorovici

3.1 Problema Monge-Kantorovici

Problema lui Monge.

Având în vedere două spații de probabilitate și și o funcție măsurabilă nenegativă pe, ...

Documente similare

    Analiza discriminantă ca secțiune a analizei statistice multivariate. Analiza discriminantă conform legii distribuției normale a indicatorilor. Aplicarea analizei discriminante în prezența a două eșantioane de antrenament. Rezolvarea problemei în sistemul statistica.

    lucru curs, adăugat 21.01.2011

    Modele de analiză discriminantă. Eficacitatea modelelor clasice de predicție a falimentului occidental și rusesc. Specificul industriei. Descrierea articolelor, inclusiv caracteristicile eșantionului, metoda, lista de factori și puterea de predicție a metodei de analiză.

    rezumat, adăugat 24.07.2016

    Bazele analizei regresiei liniare. Caracteristici de utilizare a funcției Cobb-Douglas. Aplicarea regresiei liniare multiple. Esența metodei celor mai mici pătrate. Modalități de a evita corelarea falsă. Verificarea semnificației coeficienților de regresie.

    rezumat, adăugat 31.10.2009

    Clasificarea economică a țărilor, caracteristicile principalelor indicatori ai dezvoltării economice. Metode statistice de analiză, descrierea discriminanților, clusterului, factorilor și analizei grafice. Parametrii cercetării securității economice.

    teză, adăugată 14.10.2013

    Istoria apariției analizei costurilor funcționale, metodologia acesteia, principiile, sarcinile și etapele de implementare. Folosind analiza sistemului și dezvoltarea element cu element a designului fiecărei piese Yu.M. Sobolev. Aplicarea analizei costurilor funcționale.

    test, adaugat 04.08.2012

    Fundamentele teoretice și metodologice ale analizei economice, subiectul, obiectul, sarcinile acesteia. Caracteristicile principiilor analizei economice, abordări și caracteristici ale utilizării lor în practică. Determinarea tendințelor de dezvoltare a întreprinderii pe baza analizei.

    lucrare de curs, adăugată 20.12.2010

    Esența și aplicarea metodei celor mai mici pătrate pentru regresia liniară univariată. Găsirea coeficientului de elasticitate pentru modelul specificat la un punct dat X și analiza economică a acestuia. Prognoza rata pierderilor pe baza regresiei liniare.

    test, adaugat 15.06.2009

    Esența modelului Olson ca una dintre cele mai promițătoare evoluții moderne în teoria evaluării companiei. EVO în evaluarea practică, caracteristicile muncii sale în Rusia. Caracteristicile dinamicii informaționale liniare ale lui Olson și Feltham-Olson.

    test, adaugat 04.07.2011

    Conceptul de informație economică, esența și trăsăturile sale, clasificarea și soiurile, caracteristicile și trăsăturile distinctive. Esența, subiectul și obiectele analizei economice, scopuri și obiective. Relația analizei cu alte științe, organizarea acesteia.

    cheat sheet, adăugată 04/05/2009

    Metode de elaborare a unui model economico-matematic: enunţ de problemă, sistem de variabile şi restricţii. Tipuri de soluții la modelul economico-matematic pentru optimizarea structurii de producție a unei întreprinderi agricole, analiza evaluărilor duale.


Pentru a construi modele de notare (și indiferent de abordarea matematică aleasă), este prelevat un eșantion reprezentativ de solicitanți anteriori (de la câteva mii la sute de mii - ceea ce nu este o problemă pentru o industrie care deservește zeci de milioane de clienți). Pentru fiecare solicitant din eșantion, informații complete din formularul de cerere și informații din istoricul său de credit sunt extrase pentru o perioadă fixă ​​de timp (de obicei 12, 18 sau 24 de luni). Apoi se ia o decizie expertă care poveste este acceptabilă, adică dacă clientul este „bun” sau „rău”. Cel mai adesea, un client care nu a plătit împrumutul timp de 3 luni la rând este considerat „rău”. Există întotdeauna un anumit număr de clienți care nu pot fi clasificați nici ca „buni” sau „răi”, deoarece
fie au primit împrumutul nu cu mult timp în urmă (a trecut prea puțin timp), fie istoricul lor de credit este „neclar” (de exemplu, au existat întârzieri de 3 luni, dar nu la rând). De regulă, astfel de clienți „intermediari” sunt excluși din eșantion.
Cerințe empirice pentru baza de date utilizată pentru a construi modelul de scor:
dimensiunea eșantionului - cel puțin 1500 total, cel puțin 500 rău;
o definiție clară a criteriului „rău”/„bun”. Nu este întotdeauna clar în ce stadiu al istoriei creditului, pe ce bază și la ce nivel să se separe „rău” și „bun”;
o definiție clară a perioadei de timp - perioada de viață a produsului (depinde de produsul în sine și poate varia de la o lună - un telefon mobil la zeci de ani - o ipotecă);
stabilitatea grupului de clienți - demografie, migrație, păstrarea obiceiurilor de consum;
cerință implicită, dar obligatorie: stabilitatea condițiilor economice, politice, sociale și de altă natură.
La construirea modelelor de credit, este important să alegeți un orizont de timp - perioada de timp dintre depunerea unei cereri (emiterea unui împrumut) și clasificarea „rău”/„bun”. Analiza arată că rata de nerambursare în funcție de durata șederii clientului la organizație crește inițial și abia după 12 luni (carduri de credit) sau chiar mai multe (împrumuturi unice) începe să se stabilizeze. Astfel, un orizont de timp mai scurt duce la subestimare și nu ține cont în totalitate de toate caracteristicile care prezic implicit. Pe de altă parte, un orizont de timp de peste doi ani lasă modelul susceptibil la schimbări în componența grupului de clienți în acest timp, deoarece modul în care compoziția clienților din eșantion la începutul orizontului de timp poate fi semnificativ diferită de compoziția clienților care intră în prezent. De fapt, două secțiuni simultane sunt utilizate (la începutul și la sfârșitul orizontului de timp) pentru a crea un model care este stabil în timp (dincolo de orizontul de timp inițial). Aceasta dictează alegerea lungimii perioadei de timp - orizontul de timp în timpul modelării.
O altă problemă extrem de importantă și controversată rămâne raportul dintre „bun” și „rău” din eșantion. Ar trebui să reflecte raportul real al acestora în populație sau ar trebui să existe un număr egal (un astfel de raport facilitează foarte mult construcția unui model din punct de vedere matematic)?
În continuare, construirea unui model de punctare se transformă într-o problemă de clasificare, în care caracteristicile de intrare (sau parametrii) sunt răspunsuri la întrebări din formularul de cerere și parametrii (sau date) obținuți în urma verificărilor de la diverse organizații (de exemplu, poliția). , tribunale, consilii locale, birouri de credit etc.), iar caracteristicile de ieșire (răspunsul) - rezultatul dorit - este împărțirea clienților în „buni” și „răi” în funcție de istoricul de credit disponibil, comparat în funcție de aceste intrări. caracteristici.
Tabelul de rating efectiv (tabelul de punctaj) este un sistem de atribuire a punctelor numerice (scorurilor) caracteristicilor (sau parametrilor) împrumutatului pentru a obține valoarea numerică dorită, care reflectă probabilitatea ca împrumutatul în raport cu alți debitori să experimenteze o anumită eveniment sau efectua o anumită acțiune (aspectul „în relație” din definiție este foarte important).
Un tabel de rating de credit, de exemplu, nu indică ce nivel de risc ar trebui să fie așteptat (de exemplu, ce procent de împrumuturi de un anumit tip este probabil să nu fie rambursat); în schimb, arată cum este probabil să se comporte un anumit împrumut în raport cu alte împrumuturi. De exemplu, este de așteptat ca rata implicită sau implicită pentru împrumuturile cu un anumit set de atribute să fie mai mare sau mai mică decât pentru împrumuturile cu un set diferit.
Majoritatea tabelelor sunt construite prin calcularea unui model de regresie - un model statistic care testează modul în care un singur parametru (caracteristică) afectează un alt parametru sau (cel mai adesea) un întreg set de alți parametri.
Un model de regresie are ca rezultat un set de coeficienți, numiți factori de regresie, care pot fi interpretați ca o corelație între parametrii de interes (de stabilire) și parametrii explicativi, menținând constante toate celelalte influențe asupra parametrilor de interes. Acești coeficienți sunt transformați în ponderi de puncte în tabelul de ligă.
Cea mai des folosită metodă pentru construirea tabelelor de ligă
Cel mai adesea, metoda statistică a regresiei logistice este utilizată pentru a construi tabele de evaluare. Cu toate acestea, pentru a explica această abordare, merită să începeți cu o regresie liniară simplă și apoi să treceți la regresia logistică - ca un caz special de liniară.
În forma sa cea mai simplă, regresia liniară încearcă să găsească o relație liniară între două variabile: X și K. Variabila Y care încearcă să fie prezisă este definită ca variabilă dependentă (deoarece depinde de X). Variabila X este explicativă deoarece „explica” de ce Y variază de la un individ la altul.
Folosind regresia liniară, ei încearcă să afle următoarele: dacă X se schimbă, atunci cu cât

este probabil ca și K să se schimbe ca urmare a acestui lucru Pentru a face acest lucru, aveți nevoie de un set de date în care puteți observa un set de perechi de X și K corespunzătoare. Când sunt reprezentate pe planul XY și. se obține un anumit set, se poate dovedi că se află pe o anumită linie dreaptă, adică. există o anumită relație între X și Y, pe care o puteți încerca să o aproximați folosind ecuația:
Y = B_0 + B_1 x X_1
Unde
B0 este valoarea lui Y când X = 0;
B1 - pantă în linie dreaptă.
Acești V. sunt coeficienți de regresie. În practică, este probabil să existe mai multe variabile explicative:
Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n.
Regresia logistică versus regresia liniară
Când se utilizează scoring, de regulă, variabila dependentă ia valori într-un interval foarte mic. Cel mai adesea ele lucrează cu o variabilă binară, de ex. unul care ia doar două valori întregi: de exemplu, un împrumut fie neplată sau nu; clientul care a primit catalogul prin poștă fie a răspuns, fie nu. De obicei, în acest caz, implicit i se atribuie o valoare de „1”, iar împrumutului rambursat i se atribuie o valoare de „0”.
În cele din urmă, modelul ar trebui să estimeze probabilitatea de nerambursare a unui împrumut (sau un răspuns al clientului la catalog).
Și, deși modelul liniar este uneori folosit pentru a calcula clasamentul, regresia logistică se dovedește a fi mult mai convenabilă, deoarece este construită special pentru cazurile în care variabila dependentă este binară (adică este nevoie, așa cum am spus deja, doar două valori).
Regresia liniară poate da valori de probabilitate atât mai mici decât zero, cât și mai mari decât unu, ceea ce este lipsit de sens. Modelul logistic evită acest lucru deoarece se ocupă nu de valoarea binară a variabilei dependente în sine, ci de probabilitatea sau șansele (cotele) ca acea valoare să apară de fapt. Logaritmul raportului dintre probabilitatea de implementare și probabilitatea de nerealizare se numește logit, care poate lua orice valoare, atât negativă, cât și pozitivă. Prin urmare, pentru logiți este destul de posibil să se utilizeze un model de regresie liniară (de unde și numele „logistic”).
Într-un model de regresie logistică, variabilele explicative, înmulțite cu coeficienții lor, sunt presupuse a fi liniare nu în raport cu Y, ca în regresia liniară, ci în raport cu logit - logaritmul natural al raportului de cote:
ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n, unde
p este probabilitatea ca V să apară;
p/(1 - p) - raportul de cote.
Cote și cote
Raportul de cote vă permite să comparați nivelurile de risc pentru diferite împrumuturi. Deci, dacă pentru unul p1/(1 - p_1) = 0,11, iar pentru celălalt p2/(1 - p2) = 0,052, atunci raportul lor va fi 0,46, adică. riscul de nerambursare la un împrumut este puțin mai mic de jumătate din riscul de neplată pentru al doilea împrumut.
Cele mai importante concluzii din aceasta sunt următoarele: este necesar să se obțină cotele în sine și rapoartele acestora pentru diferite împrumuturi din regresii logistice, deoarece Acesta este singurul mod de a compara direct și de a lua în considerare atât influența caracteristicilor individuale asupra nivelului de risc, cât și riscul relativ al unui împrumut în raport cu altul. Încercările de a se mulțumi cu un singur tabel de rating nu permit evaluarea riscului unui împrumut față de altul din cauza posibilei influențe a unor caracteristici care au fost luate în considerare pentru unul și nu au fost luate în considerare pentru celălalt.
Calculul greutăților relative ale caracteristicilor individuale ale tabelului de rating
După ce ați construit și estimat modelul logistic, puteți înlocui valorile X pentru orice solicitant sau împrumut și puteți calcula scorul folosind ecuația:

Cu toate acestea, acest număr este prezentat pe o scară logaritmică naturală, care este dificil de interpretat. Prin urmare, scorul este convertit la o scară liniară, unde se alege un anumit număr de puncte, astfel încât acest număr să ofere dublul șanselor ca un anumit eveniment să se producă. Pentru a face acest lucru, înmulțiți scorul cu un factor egal cu numărul de puncte care ar trebui să reprezinte dublarea cotelor și apoi împărțiți la 1n(2):
numărând pe o scară liniară = (B 1 x X 1 + ... + Bp x Xp) x (20/1p(2)),
dacă numărul dorit de puncte necesare pentru a dubla șansele este 20.
În caz contrar, dacă trebuie să aflați exact câte puncte oferă fiecare caracteristică, puteți înmulți fiecare B_1 cu (20/(1n(2)) și apoi înmulțiți cu valoarea parametrului X_1.
Utilizarea statisticilor KS pentru a evalua tabelul de rating rezultat
Un tabel de punctaj este construit pentru a clasifica diferite împrumuturi în termeni de cote în raport cu un anumit eveniment. Este necesar ca un astfel de tabel de punctaj să aloce diferite conturi împrumuturilor care experimentează un eveniment și împrumuturilor care nu.
De exemplu, o diagramă de credit scoring atribuie un scor mai mic acelor împrumuturi care ulterior au dificultăți serioase de rambursare sau intră în situație de nerambursare, astfel încât, în general, un grup de credite neperformante ar trebui să aibă scoruri mai mici decât un grup de credite bune.
Pentru a determina calitatea tabelului rezultat, sunt trasate grafice - curbe de distribuție a procentului de bun și procent de credite neperformante (din numărul total corespunzător de bune și rele) în funcție de dimensiunea contului și de calitatea punctajului tabelul (harta) se caracterizează prin cât de mult sunt separate aceste două curbe.
Pentru determinarea numerică a calității separării este utilizată statistica Kolmogorov-Smirnov (statistica K-S), care oferă o măsură numerică a acestei separări. Statistica KS se calculează simplu: este diferența maximă dintre procentul cumulat al distribuției „bun” și procentul cumulat al distribuției „rău”. În teorie, statistica KS poate varia de la 0 la 100, dar în practică, de obicei, variază de la 25 la 75.
O gradație aproximativă arată astfel:
mai puțin de 20 - tabelul de punctaj este probabil nepotrivit pentru utilizare;
20-40 este o masă bună;
41-50 este o masă bună;
51-60 este o masă foarte bună; />61-75 este o masă uimitor de bună;
mai mult de 75 este probabil prea frumos pentru a fi adevărat, probabil că ceva nu este în regulă* (128).
Trebuie remarcat faptul că calitatea modelelor de punctare trebuie verificată în mod constant, iar monitorizarea este o procedură obligatorie în timpul funcționării. De-a lungul timpului, atât condițiile economice, cât și caracteristicile comportamentale ale debitorilor se pot schimba și numai ajustarea în timp util sau chiar înlocuirea modelelor de scoring va asigura gestionarea eficientă a riscurilor de credit.

Termenul „notare” tradus literal din engleză înseamnă „numărarea punctelor”. Acesta este denumirea sistemului și a metodei de evaluare a riscurilor de împrumut unei anumite persoane și de gestionare a riscurilor pe baza unei previziuni matematice. Scorul bancar vă permite să determinați probabilitatea de întârziere a plăților pe baza informațiilor din istoricul dvs. de credit și a altor date. Criteriul principal sunt punctele, care anterior erau acordate manual de către angajații instituțiilor financiare, dar acum sunt calculate din ce în ce mai mult printr-un program special.

Scoring-ul funcționează eficient în domeniul creditării expres și al microfinanțelor, unde un specialist nu are la dispoziție mai mult de o oră pentru a analiza o cerere. Datele unui potențial împrumutat sunt introduse într-un program special. Sistemul compară informațiile cu statisticile. De exemplu, dacă baza de date conține multe informații că persoane de aceeași vârstă și/sau profesie nu au rambursat împrumuturile, atunci decizia poate fi negativă - banca poate refuza fără explicații.



O evaluare automată a bonității unui debitor – o persoană fizică – se bazează pe analiza diferitelor informații, inclusiv:

  • date de identificare. Sunt procesate datele pașaportului și fotografia solicitantului. Deja în această etapă sunt identificați fraudătorii și persoanele cu un istoric de credit prost;
  • statutul social. Se iau în considerare sexul, vârsta, educația și locul de muncă ale solicitantului. Se iau în considerare adresa de înregistrare și reședință, prezența familiei și a persoanelor aflate în întreținere;
  • situatia financiara. În mod ideal, trebuie să aveți nu numai venituri suficiente, ci și regulate. Unele bănci țin cont și de eventuale cheltuieli: plata utilităților, grădiniță etc. Mulți solicitanți folosesc trucuri, nedeclarând persoanele aflate în întreținere sau umflând suma veniturilor. Pentru împrumuturile mici, acest lucru poate funcționa, dar pentru împrumuturile mari, băncile verifică de obicei datele mult mai atent;
  • istoric de credit. În evaluarea bonității unei persoane, informațiile despre împrumuturile anterioare sunt de o importanță decisivă. Se determină creditele restante, prezența creditelor restante și timpul în care au fost plătite. Dacă împrumuturile au fost deservite cu acuratețe, sistemul va indica o probabilitate mare de a avea același comportament al clientului în viitor, crescând scorul. Același principiu funcționează în direcția opusă;
  • comportamentul tranzacțional. Opțiunea de evaluare este disponibilă pentru solicitanții care sunt clienți ai unei instituții financiare. Deținătorii de carduri de plastic, conturi de depozit și participanții la proiecte salariale primesc adesea un rating ridicat. Sistemul evaluează sumele pentru care se fac achiziții și categoriile de puncte de vânzare.

Toate datele sunt verificate individual și comparate între ele pentru orice contradicții. Trebuie să existe o legătură între venituri și cheltuieli, poziția și locul de reședință etc.

Imparţialitate. Sistemul de credit scoring funcționează cu fapte și cifre, fără a ține cont de caracteristicile personale ale unei persoane. Angajatul biroului care acceptă cererea nu poate influența în niciun fel algoritmul de calcul. Un expert în credite nu are dreptul de a refuza în mod nerezonabil să emită un împrumut dacă programul a evaluat împrumutatul ca persoană solvabilă.

Eficienţă. Notarea manuală se realizează sub forma unui tabel. Specialistul introduce în mod independent datele în rânduri separate și atribuie puncte, concentrându-se doar pe propria experiență și cunoștințe. Procesul este laborios și îndelungat, solicitanții fiind nevoiți să aștepte o oră sau mai mult. Programele moderne calculează scorul de sute de ori mai rapid.

Beneficiu financiar. Băncile care utilizează un sistem de notare a creditelor oferă adesea condiții de împrumut mai bune. Calcularea riscurilor și filtrarea automată a posibililor debitori reduce semnificativ ponderea nerambursării, care este de obicei inclusă în rata dobânzii. Acest lucru avantajează atât debitorul, cât și creditorul.

În primul rând, trebuie să creați un istoric de credit bun, fără întârzieri. Dacă plățile la timp sunt imposibile din motive obiective, este necesar să se informeze banca despre acest lucru cât mai curând posibil și să se facă dovada insolvenței temporare. Majoritatea creditorilor găzduiesc clienții la jumătatea drumului, oferind amânări de plată, recalculând sau oferind alte soluții. În acest caz, istoricul nu va fi stricat de refuzurile de plată. Dacă există deja linii negative în istorie, acestea pot fi compensate prin împrumuturi rambursate la timp.

O altă modalitate de a vă crește scorul de credit este să aveți un depozit. Un depozit deschis într-o bancă arată clar că clientul are fondurile de plătit. Același lucru este valabil și pentru deținătorii de carduri de salariu, care au de obicei un scor mare.

Pentru a vă îmbunătăți scorul, trebuie să completați cu atenție cererea. Se recomandă să furnizați informații de contact exacte și să anunțați pe toți ale căror numere de telefon le introduceți în formular. Dacă un angajat al băncii începe să sune, el trebuie să contacteze toți abonații. În caz contrar, informațiile pot fi considerate nesigure și împrumutul poate fi refuzat din această cauză.

Dacă ți s-a refuzat un împrumut deoarece programul de punctaj te-a considerat necreditabil, nu dispera. Poate că setările algoritmului sunt nefavorabile pentru tine doar în această bancă. Pentru a verifica acest lucru, încercați să notați pe site-ul nostru.

La acordarea de credite, băncile se străduiesc să obțină profituri maxime și să garanteze returnarea fondurilor transferate împrumutatului. Pentru a reduce riscul de întârzieri, instituțiile financiare analizează cu atenție toți solicitanții și aprobă doar cererile ale căror obligații sunt susceptibile de a fi îndeplinite.

Evaluarea bonității unui împrumutat - o persoană - se realizează adesea folosind (din engleză scoring - „numărarea punctelor”). Modelul de scoring analizează factorii care influențează riscul de nerambursare a creditului și face recomandări privind aprobarea sau refuzul cererii. Atunci când solicită un împrumut, împrumutatului i se cere mai întâi să completeze un formular. Pe baza acestor date se face evaluarea. Pentru fiecare parametru, clientul primește un anumit număr de puncte și există coeficienți crescători și descrescători. Rezultatul final era calculat manual de către angajații băncii astăzi acest lucru se face automat în programe speciale.

Unde se aplică scorul?

Modelul de scoring este utilizat pe scară largă în domeniul microfinanțării și al creditării exprese, unde revizuirea datelor unui potențial împrumutat și luarea unei decizii durează mai puțin de 1 oră. Pentru a vă verifica bonitatea, informațiile din cererea dvs. completată sunt introduse într-un program special. Sistemul compară automat datele specificate de potențialul împrumutat cu statisticile. Așadar, dacă baza de date conține informații că persoanele de o vârstă sau o profesie similară nu rambursează adesea împrumutul, atunci decizia privind cererea poate fi negativă. În astfel de cazuri, o bancă sau o organizație de microfinanțare refuză de obicei un potențial împrumutat fără explicații.

Avantajele sistemului de notare EVALUARE CREDIT

Luare rapidă a deciziilor. Dacă un angajat al băncii analizează solvabilitatea împrumutatului, acest lucru va dura mult timp. Specialistul trebuie să verifice în mod independent fiecare parametru, să introducă manual toate rezultatele obținute și să tragă o concluzie. Cu ajutorul sistemelor moderne de notare a creditelor, datele sunt procesate rapid, ceea ce înseamnă că deciziile sunt luate rapid.

Obiectivitate. Chiar și un specialist experimentat și calificat poate face o eroare în calcule sau își poate forma o opinie părtinitoare din cauza atitudinii sale personale față de client. Scorul de scoring este un indicator mult mai obiectiv al bonității, deoarece este calculat automat. Un angajat al bancii nu poate influenta functionarea algoritmului.

Beneficiu financiar. Utilizarea unui model de scoring pentru evaluarea bonității poate reduce semnificativ rata de nerambursare. Acest lucru nu numai că mărește profiturile băncii, dar îi oferă și posibilitatea de a oferi clienților rate mai favorabile. Nivelul de nerambursare afectează direct rata dobânzii la credite, astfel încât plătitorii conștiincioși sunt interesați să o reducă.

Ce determină rezultatele punctajului?

Scorul final la utilizarea oricărui model de notare constă dintr-un număr de indicatori. În primul rând, sunt verificate detaliile pașaportului împrumutatului, informațiile despre locul de reședință și alte informații de contact. Aceasta este o etapă preliminară în care sunt eliminați solicitanții cu documente nevalide. Apoi sunt analizați alți factori.

  • Informații personale despre client. Evaluarea punctajului ia în considerare starea civilă a împrumutatului și prezența copiilor minori. Se ia în considerare și vechimea în muncă la ultimul loc de muncă.
  • Solvabilitatea solicitantului. Unul dintre cei mai importanți factori care influențează scorul. Pentru a obține aprobarea, este important să dovediți că aveți nu numai fonduri suficiente pentru a rambursa împrumutul, ci și plăți regulate. Pentru evaluarea situației financiare și a bonității, în majoritatea cazurilor (în special la acordarea de împrumuturi mari), este necesară furnizarea de documente de la locul de muncă: un certificat 2-NDFL sau un formular bancar. Uneori sunt luate în considerare și cheltuielile solicitantului (întreținerea persoanelor aflate în întreținere, utilități etc.).
  • Istoricul creditului. La punctarea bonității clienților, este necesar să se verifice datorii și restanțele la creditele luate anterior. Banca poate, cu consimțământ, să obțină date despre solicitant de la biroul de istorie a creditelor (BKI), care reflectă toate informațiile necesare. Sistemul ține cont și de prezența sau absența plăților regulate la creditele existente. BKI înregistrează istoricul cererilor depuse de solicitant: prezența unui procent mare de refuzuri din partea altor organizații financiare poate reduce evaluarea.
  • Comportamentul tranzacțional. Dacă împrumutatul este un client de salarizare sau are un depozit la o bancă, scorul de punctaj la stabilirea bonității poate fi mărit. Aceasta ia în considerare valoarea economiilor din cont și dinamica acestora.

Sistemul de notare verifică toate datele separat și le compară între ele pentru a identifica posibile contradicții. Confirmarea fiabilității informațiilor specificate este prezența unei legături între veniturile și cheltuielile potențialului împrumutat, locul de muncă și adresa rezidențială etc.

Analiza datelor de punctaj

Pe baza rezultatului obținut, sistemul ia o decizie:

  • Bine- scorul este mare, aplicația poate fi transferată la nivelul următor;
  • refuz- solicitantul a obținut un punctaj prea mic, astfel încât examinarea cererii este oprită;
  • sunt necesare analize suplimentare- sistemul nu are suficiente date pentru a oferi o evaluare adecvată. În acest caz, specialistul bancar studiază în mod independent formularul de cerere al solicitantului și clarifică informațiile. Pentru a confirma aspecte controversate, solicitantului i se poate solicita să furnizeze documente suplimentare. După examinarea manuală a cererii, se ia o decizie finală.

Cum să obțineți un scor mare

Eliminați restanțele la împrumuturi. Pentru a vă crește șansele de a obține o evaluare bună și aprobarea cererii dvs., trebuie să aveți un istoric de credit curat. Aceasta înseamnă că solicitantul nu trebuie să aibă restanțe la alte împrumuturi sau datorii restante. Prin urmare, chiar dacă apar dificultăți financiare, este important să vă monitorizați istoricul de credit. Este mai bine să oferiți băncii dovezi documentare de insolvență temporară în timp util și să dezvoltați o restructurare a datoriilor sau o schemă de amânare. Acest lucru vă va permite să vă închideți împrumutul actual și să creșteți probabilitatea aprobării unuia nou.

Deschideți un depozit bancar. Majoritatea băncilor oferă puncte de notare suplimentare dacă aveți un cont, așa că cel mai bine este să faceți o depunere în avans.

Vă rugăm să furnizați numai informații reale în aplicația dvs. Evaluarea este influențată și de acuratețea completării chestionarului. Informațiile trebuie să fie obiective și veridice: îndoielile cu privire la fiabilitatea informațiilor pot deveni un motiv pentru refuzul unui împrumut.

Fiți atenți la relevanța contactelor din chestionar. Pentru a vă îmbunătăți scorul de credit, trebuie să furnizați numai informații de contact reale în formularul de cerere. Un angajat al bancii trebuie sa poata contacta toti abonatii ale caror numere de telefon au fost introduse de potentialul imprumut. Dacă nu este posibil să îi contactați, datele furnizate pot fi considerate nesigure. Acesta este unul dintre motivele pentru a refuza împrumutul.

Dacă scorul a fost prea scăzut și cererea a fost respinsă, acest lucru poate indica faptul că modelul și algoritmul unei anumite bănci nu sunt potrivite pentru împrumutat. Instituțiile financiare folosesc adesea propriile sisteme, care iau în considerare un set diferit de factori.

Ce să faci dacă refuzi

Dacă punctajul este scăzut, sistemul respinge pur și simplu cererea, iar clientul nu este informat despre motivele acestei decizii. Angajații băncii recomandă adesea să repetați cererea după câteva luni. Alternativ, puteți încerca să aplicați la o altă instituție financiară. Totuși, acest lucru trebuie făcut cu prudență: toate refuzurile sunt înregistrate în istoricul de credit, iar dacă sunt prea multe, scorul este redus. Pentru a afla despre disponibilitatea și numărul de cereri respinse înainte de a contacta banca, puteți trimite o solicitare către BKI.

Modelul de scoring nu oferă rezultate obiective și relevante dacă clientul solicită pentru prima dată un împrumut. Pentru astfel de cazuri, unele bănci folosesc doar procesarea manuală a cererilor de către specialiști. Mai mult, de fapt, unor astfel de clienți li se oferă adesea condiții mai puțin favorabile, dobânzi crescute și o sumă redusă a creditului. Astfel banca reduce pierderile din eventuala nerambursare. Cu toate acestea, dacă rambursați primul împrumut la timp și fără întârzieri, acest lucru se va reflecta în istoricul dvs. de credit, astfel încât data viitoare puteți conta pe un scor mai mare.

Pentru a utiliza serviciile NBCI pentru dezvoltarea și/sau utilizarea metodelor sistemului de notare, completați formularul de cerere de pe site.

Din punct de vedere istoric, scorul ca abordare a fost folosit pentru prima dată în cercetarea biologică în a doua jumătate a anilor '30. Secolul 20 pentru sortarea obiectelor care erau imposibil de sortat pe baza oricărei caracteristici, dar într-un alt mod erau fie foarte dificile, fie chiar imposibile. De exemplu, așa se sortau craniile (prin aparținerea unuia sau altui trib) sau bulbii de iris (prin apartenența unuia sau altui soi).

Termenul " punctare„ înseamnă o abordare matematică cu ajutorul căreia, pe baza unui set de caracteristici cunoscute (sau măsurate) ale unui obiect, este prezisă o anumită caracteristică dorită, care în momentul evaluării nu poate fi măsurată direct, în timp ce căutarea vreunei cauze. relațiile -și-efect sunt evitate în mod deliberat.

Scorul de credit- aceasta este utilizarea soluțiilor de scoring în procesul de creditare, atât pentru persoane fizice, cât și pentru persoane juridice (în special întreprinderile mici și mijlocii).

Sarcina principală care se rezolvă atunci când se împrumută folosind scoring este managementul riscurilor.

Spiegel, un mare retailer american, a început să folosească scorul de credit foarte devreme. O altă astfel de companie a fost Household Finance Corp. Deja în 1946 președintele său E.F. Vanderlik a dezvoltat Credit Guide Score pentru a evalua noii solicitanți, dar implementarea a fost dificilă (mai târziu, managerii lui de sucursale au recunoscut că au acordat mai întâi împrumuturi și apoi au ajustat scorurile pentru a justifica decizia).

În 1956, pe piața financiară americană a avut loc un eveniment care a schimbat radical situația în domeniul credit scoring-ului. Americani - inginerul Bill Fire și matematicianul Earl Isaac, care a lucrat la Institutul de Cercetare Stanford, au venit cu primul model de scoring de credit. Partenerii au dezvoltat un algoritm matematic care calculează nivelul de bonitate a împrumutatului în termeni digitali. Cu alte cuvinte, algoritmul vă permite să calculați riscurile de credit sub forma unui număr din trei cifre, care este un rating de credit. Au format Fair, Isaac and Company (rebotezat Fair Isaac Corporation în 2003 și FICO în 2009).

În Rusia, utilizarea masivă a scoring-ului în creditarea cu amănuntul a devenit, de asemenea, o practică răspândită. Băncile rusești folosesc în mod activ atât scoringul extern FICO, cât și propriile carduri de scoring, dezvoltate, printre altele, cu ajutorul consultanților americani.

În anii șaptezeci ai secolului trecut, pe de o parte, a început dezvoltarea rapidă a tehnologiei informatice și, pe de altă parte, un boom de creditare. Și atunci majoritatea băncilor au început să implementeze sisteme de scoring. Mai mult, unii dintre ei și-au dezvoltat propriile sisteme fără ajutorul unor companii terțe.

Când a început introducerea treptată a sistemelor de scoring în Rusia, la mijlocul anilor 90, băncile naționale s-au confruntat cu o dilemă: să le dezvolte independent sau să le cumpere de la producătorii occidentali. După 15 ani, a apărut o a treia opțiune: externalizarea punctajului.

Din 29 iulie 2013, la emiterea de împrumuturi cu amănuntul, Sberbank folosește o evaluare integrală a împrumutatului, care se bazează pe Scoring Bureau de generația a 3-a (un serviciu oferit de United Credit Bureau (UCB)) și sistemul intern de scoring al creditului. instituția însăși.

Testarea serviciului a arătat că utilizarea combinată a două modele de scoring oferă un efect suplimentar, crescând calitatea modelului integrat al băncii cu peste 10%.

Odată cu apariția la sfârșitul anilor 60. Industria cardurilor de credit, băncile și alți emitenți și-au dat seama de utilitatea punctajului de credit. Numărul mare de clienți care solicită carduri de credit în fiecare zi a făcut imposibil – fie din punct de vedere economic, fie din punct de vedere al costurilor cu forța de muncă – să facă altceva decât automatizarea deciziei de creditare. Atunci când au folosit credit scoring, aceste organizații au descoperit rapid că această tehnică era o prognoză mult mai fiabilă decât estimările experților (ratele implicite au scăzut cu 50% sau mai mult).

Tipuri de scoring de credit

De regulă, există cel puțin trei domenii de aplicare a punctajului de credit:

  1. notarea aplicației;
  2. punctaj comportamental;
  3. notarea colectiei.

Punctajul aplicațiilor- aceasta este determinarea bonitatii (nivelul riscului de neplata) a solicitantului la luarea unei decizii de acordare a unui credit pe baza datelor disponibile la momentul depunerii cererii - informatii din cererea in sine, datele proprii ale institutiei de credit, date din birou de credit, precum și alte baze de date disponibile (de exemplu, despre pașapoarte pierdute).

În acest caz, nu se ia doar decizia de a acorda un împrumut, ci și dimensiunea și termenii împrumutului.

Odată ce un împrumut este emis, este necesar să urmăriți utilizarea și rambursarea acestuia. Și dacă în cazul împrumuturilor cu condiții fixe, i.e. În timp ce cheia este determinarea bonității clientului la momentul eliberării împrumutului, pentru o linie de credit - inclusiv un card de credit revolving - situația este radical diferită. Nu se știe cum va folosi clientul împrumutul - va alege imediat întreaga limită de credit sau doar o parte a acesteia, cum va rambursa - toate odată sau doar plata minimă stabilită și dacă bonitatea sa se va schimba în șase luni sau într-un an. Și aceasta este zona punctaj comportamental, unde acest nume ascunde de fapt un întreg set de probleme de rezolvat.

În primul rând, aceasta este evaluarea riscului de întârziere a plății și/sau nereturnare și determinarea acțiunilor care trebuie întreprinse - aici devine scorul comportamental. notarea colectiei(notarea colecției).

Următoarea sarcină rezolvată în cadrul scoring-ului comportamental este determinarea profitabilității/nerentabilității clientului pentru instituția de credit. Pentru a face acest lucru, istoricul tranzacțiilor sale este monitorizat pe o anumită perioadă de timp (de exemplu, șase luni) și, conform criteriilor stabilite, se determină „valoarea” acesteia, iar apoi, pe baza istoricului clienților deja cunoscute și a profilurilor de clienți. , „rentabilitatea” viitoare a clienților din portofoliul de credite în acest moment.

În aceeași clasă, determinarea unor parametri atât de importanți ai clienților, cum ar fi probabilitatea de a părăsi (uzura), tendința lor de a utiliza acest produs sau alte produse (propensitate), precum și creșterea volumului de utilizare (up-sale) sau achiziționarea de alte produse (vânzare încrucișată) .

Există două puncte foarte importante de făcut:

1) datele privind tranzacțiile sunt utilizate pentru a detecta și a preveni frauda (și aceasta este denumită și scoring comportamental);

2) pentru scoring comportamental se folosesc din ce în ce mai mult datele nu numai despre un anumit cont (produs), ci întregul complex de date despre client, i.e. cum anume foloseste intreaga gama de produse folosite.

O abordare pragmatică, de ex. refuzul de a căuta relații cauză-efect între parametri și utilizarea dependențelor identificate între parametri pentru a prezice comportamentul clientului (probabilitatea de neplată a creditului) provoacă respingere destul de puternică în rândul multora și duce la anumite restricții legislative în acest domeniu în unele țări.

Elementele de bază ale dezvoltării unui tabel de rating, verificarea și configurarea acestuia

În ciuda faptului că fiecare bancă are propriul „sistem de valori”, nici o singură bancă nu se poate descurca fără întrebări tipice de scor.

1. Informații personale. Sex, vârstă, stare civilă, prezența sau absența persoanelor aflate în întreținere, educație.

Etajul . Sistemul este mai simpatic pentru femei, deoarece, conform statisticilor, sexul slab este mai responsabil în achitarea obligațiilor sale.

Varsta . Cei mai atrăgători clienți pentru bancă au vârsta cuprinsă între 25 și 45 de ani. Cu cât o persoană este mai departe de această categorie de vârstă, cu atât scorul său este mai scăzut.

Starea civilă. De regulă, a avea o familie, chiar dacă relația nu este legalizată formal, este un plus. Relațiile stabile și planificarea bugetară, din punctul de vedere al băncii, disciplinează potențialul împrumutat.

Dependenti. Dacă un potențial împrumutat are un singur copil, acest lucru de obicei nu scade scorul, dar cu cât sunt mai mulți copii, cu atât scorul este mai mic.

Educație . O persoană cu studii medii este percepută ca fiind insuficient de reușită și stabilă, potențial capabilă să își neglijeze obligațiile de credit, spre deosebire de o persoană cu studii superioare.

2. Indicatori financiari. Vechimea totală, vechimea totală la ultimele sau ultimele două sau trei locuri de muncă, profesie, nivelul salariilor și cheltuielile totale.

Cum o persoană mai stabilă în ceea ce priveşte angajarea sa, cu atât scorul său este mai mare. Schimbările frecvente ale locului de muncă și durata scurtă a muncii la fiecare dintre ele indică instabilitatea potențialului împrumutat și, în consecință, veniturile acestuia.

Tip de profesie. Cei mai atractivi pentru bancă sunt specialiștii, muncitorii, funcționarii publici și managerii de mijloc (angajare permanentă). Bancherilor nu le plac directorii de companii, directorii financiari, notarii (angajați în practică privată), precum și proprietarii de afaceri și coproprietari. Este important de înțeles că, spre deosebire de angajații angajați, proprietarul afacerii sale nu are un venit fix lunar. Același lucru se poate spune despre antreprenorii individuali - este mai bine ca astfel de împrumutați să depună documente ca persoane fizice.

Fără îndoială, banca va acorda atenție raportul dintre cheltuieli și venituri. Pe de o parte, sistemul analizează cât de comparabile sunt costurile plății împrumutului cu capacitățile financiare ale clientului și dacă un contract de împrumut suplimentar va fi împovărător pentru acesta. Pe de altă parte, dacă împrumutatul declară venituri mari, dar cere o sumă mică, acest lucru provoacă cel puțin suspiciuni. De ce o persoană cu un venit de 50 de mii de ruble. împrumut de 6 mii?

Băncile sunt foarte atente la prezența împrumuturilor luate anterior și restante. Dacă împrumutatul are deja plăți lunare conform contractului de împrumut, atunci banca va prezice solvabilitatea persoanei cu o marjă foarte mare (pentru ea însăși).

3. Informații conexe.

O sursă suplimentară de venit (un loc de muncă suplimentar, venitul unui coîmprumutat), prezența unei mașini, a unui garaj, a unei case de vară sau a unui teren în proprietate personală vor adăuga fără îndoială puncte. Situația este aproximativ aceeași cu împrumuturile rambursate existente: absența delicvențelor anterioare, rambursarea la timp a obligațiilor cuiva față de instituția de credit și absența delicvențelor actuale sunt percepute pozitiv. Cu cât câștigă mai multe puncte, cu atât banca îl place mai mult.

În prezent scorul de credit se bazează pe metode de cercetare statistică sau cercetare operațională. Abordările statistice includ analiza discriminativă, bazată pe regresia liniară și regresia logaritmică mai eficientă, și arbori de clasificare, uneori numiți algoritmi de partiționare recursive. Metodele de cercetare operațională includ anumite variații ale programării liniare. Majoritatea dezvoltatorilor de modele de notare folosesc una sau mai multe dintre metodele de mai sus, adesea în combinație. În plus, o serie de metode statistice neparametrice și abordări de modelare care utilizează „inteligență artificială” sunt utilizate în dezvoltarea modelelor de scor. Astfel, în ultimele decenii, au fost testate abordări ale rețelelor neuronale, sisteme expert, algoritmi genetici și metode „cel mai apropiat vecin”. Este foarte interesant că o asemenea varietate de metode sunt aplicate aceleiași probleme de clasificare. Acest lucru se datorează parțial unei abordări pur pragmatice a problemei reducerii riscului la emiterea de împrumuturi: dacă funcționează, folosește-l! Scopul este de a prezice cine nu va reuși să se întoarcă, nu de a oferi o explicație pentru ce nu o va face sau de a confirma una sau alta ipoteză despre relația dintre neplată și anumiți parametri economici sau sociali (care au provocat parțial discuții aprinse și adoptare). din actul ECOA).

Construirea modelelor de punctare

Pentru a construi modele de notare (și indiferent de abordarea matematică aleasă), este prelevat un eșantion reprezentativ de solicitanți anteriori (de la câteva mii la sute de mii - ceea ce nu este o problemă pentru o industrie care deservește zeci de milioane de clienți). Pentru fiecare solicitant din eșantion, informații complete din formularul de cerere și informații din istoricul său de credit sunt extrase pentru o perioadă fixă ​​de timp (de obicei 12, 18 sau 24 de luni). Apoi se ia o decizie expertă care poveste este acceptabilă, adică dacă clientul este „bun” sau „rău”.

Cerințe empirice pentru baza de date utilizată pentru a construi modelul de scor:

  • dimensiunea eșantionului - cel puțin 1500 total, cel puțin 500 rău;
  • o definiție clară a criteriului „rău/bun”;
  • o definiție clară a perioadei de timp - perioada de viață a produsului (depinde de produsul în sine și poate varia de la o lună - un telefon mobil la zeci de ani - o ipotecă);
  • stabilitatea grupului de clienți - demografie, migrație, păstrarea obiceiurilor de consum;
  • cerință implicită, dar obligatorie: stabilitatea condițiilor economice, politice, sociale și de altă natură.

La construirea modelelor de credit, este important să alegeți un orizont de timp - perioada de timp dintre depunerea unei cereri (emiterea unui împrumut) și clasificarea „rău/bun”. Analiza arată că rata de nerambursare în funcție de durata șederii clientului la organizație crește inițial și abia după 12 luni (carduri de credit) sau chiar mai multe (împrumuturi unice) începe să se stabilizeze. Astfel, un orizont de timp mai scurt duce la subestimare și nu ține cont în totalitate de toate caracteristicile care prezic implicit. Pe de altă parte, un orizont de timp de peste doi ani lasă modelul susceptibil la schimbări în componența grupului de clienți în acest timp, deoarece modul în care compoziția clienților din eșantion la începutul orizontului de timp poate fi semnificativ diferită de compoziția clienților care intră în prezent. De fapt, două secțiuni simultane sunt utilizate (la începutul și la sfârșitul orizontului de timp) pentru a crea un model care este stabil în timp (dincolo de orizontul de timp inițial). Aceasta dictează alegerea lungimii perioadei de timp - orizontul de timp în timpul modelării.

Construcție în continuare model de punctaj se transformă într-o problemă de clasificare, în care caracteristicile de intrare (sau parametrii) sunt răspunsuri la întrebări din formularul de cerere și parametrii (sau date) obținuți în urma verificărilor de la diverse organizații (de exemplu, poliție, instanțe, consilii locale, birouri de credit). , etc.), iar caracteristicile de ieșire (răspunsul) - rezultatul dorit - este împărțirea clienților în „buni și răi” în funcție de istoriile de credit disponibile, comparate în funcție de aceste caracteristici de intrare.

Tabelul de rating efectiv (tabelul de punctaj) este un sistem de atribuire a punctelor numerice (scorurilor) caracteristicilor (sau parametrilor) împrumutatului pentru a obține valoarea numerică dorită, care reflectă probabilitatea ca împrumutatul în raport cu alți debitori să experimenteze o anumită eveniment sau efectua o anumită acțiune (aspectul „în relație” din definiție este foarte important).

Tabel de rating de credit, de exemplu, nu indică ce nivel de risc ar trebui să fie așteptat (de exemplu, ce procent din împrumuturile de un anumit tip este probabil să nu fie rambursat); în schimb, arată cum este probabil să se comporte un anumit împrumut în raport cu alte împrumuturi. De exemplu, este de așteptat ca rata implicită sau implicită pentru împrumuturile cu un anumit set de atribute să fie mai mare sau mai mică decât pentru împrumuturile cu un set diferit.

Majoritatea tabelelor sunt construite prin calcularea unui model de regresie - un model statistic care testează modul în care un singur parametru (caracteristică) afectează un alt parametru sau (cel mai adesea) un întreg set de alți parametri.

Un model de regresie are ca rezultat un set de coeficienți, numiți factori de regresie, care pot fi interpretați ca o corelație între parametrii de interes (de stabilire) și parametrii explicativi, menținând constante toate celelalte influențe asupra parametrilor de interes. Acești coeficienți sunt transformați în ponderi de puncte în tabelul de ligă.

Trebuie remarcat faptul că calitatea modelelor de punctare trebuie verificată în mod constant, iar monitorizarea este o procedură obligatorie în timpul funcționării. De-a lungul timpului, atât condițiile economice, cât și caracteristicile comportamentale ale debitorilor se pot schimba și numai ajustarea în timp util sau chiar înlocuirea modelelor de scoring va asigura gestionarea eficientă a riscurilor de credit.