สัมมนาการสร้างโมเดลการให้คะแนนเพื่อการตลาด การสร้างแบบจำลองการให้คะแนนเพื่อประเมินความน่าเชื่อถือทางเครดิตของผู้กู้ยืมนิติบุคคล

การให้ยืม

การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง

นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง

โพสต์เมื่อ http://www.allbest.ru/

โพสต์เมื่อ http://www.allbest.ru/

  • การแนะนำ
    • 1.4 โครงข่ายประสาทเทียม
    • 1.5 ชายการวิเคราะห์
    • 1.6 วิธีการอื่นๆ
    • 2.1 คำชี้แจงปัญหา
    • 3.1 ปัญหามอนเจ-คันโตโรวิช
    • 3.2 การประยุกต์ใช้ปัญหา Monge-Kantorovich ในการให้คะแนน
  • บทสรุป
  • อ้างอิง

การแนะนำ

การให้คะแนนเป็นวิธีฮิวริสติกในการสร้างการให้คะแนนและจำแนกออบเจ็กต์ต่างๆ ออกเป็นกลุ่ม ขึ้นอยู่กับสมมติฐานที่ว่าผู้ที่มีตัวบ่งชี้ทางสังคมคล้ายคลึงกันจะมีพฤติกรรมในลักษณะเดียวกัน มันถูกใช้ใน ภาคการธนาคาร,การตลาด,ธุรกิจประกันภัย.

เป้าหมายหลักของการให้คะแนนแบบดั้งเดิมคือเพื่อจัดประเภทลูกค้าธนาคารเป็น "ดี" และ "ไม่ดี" โดยขึ้นอยู่กับว่าผู้ให้กู้สามารถเลือกการดำเนินการที่เหมาะสมที่เกี่ยวข้องกับลูกค้ารายนี้ได้ ตัวอย่างเช่น ลูกค้าที่ "ไม่ดี" สามารถกำหนดได้ว่าเป็นลูกค้าที่มีความน่าจะเป็นเชิงประจักษ์ต่ำในการชำระคืนเงินกู้ แต่ตามกฎแล้ว คำจำกัดความของลูกค้าที่ "ไม่ดี" นี้ขยายไปสู่พฤติกรรมของลูกค้าที่ไม่พึงประสงค์สำหรับธนาคาร การจำแนกประเภทจะดำเนินการบนพื้นฐานของบัตรให้คะแนน โดยช่วยในการคำนวณคะแนนการให้คะแนนของลูกค้า การให้คะแนนแบบเบย์ที่เลือกปฏิบัติ

จากวรรณกรรมเกี่ยวกับการให้คะแนน เราสังเกตผลงานหลายชิ้น

“Guide to Credit Scoring” แก้ไขโดย Elizabeth Maze, 2008 เป็นหนังสือเล่มเดียวเกี่ยวกับการให้คะแนนในภาษารัสเซีย อธิบายไว้ แนวคิดทั่วไปมีการตรวจสอบวิธีการสร้างบัตรให้คะแนน และหารือถึงการประยุกต์ใช้การให้คะแนนในทางปฏิบัติ หนังสือเล่มนี้ประกอบด้วยบทความที่เขียนโดยผู้เชี่ยวชาญจากต่างประเทศในด้านการเงิน

วิทยานิพนธ์ของซามูเอล กลาสสัน เรื่อง “วิธีการสุ่มตัวอย่างแบบเซ็นเซอร์สำหรับ” การให้คะแนนเครดิต”, 2550 โดยจะตรวจสอบเครื่องมือวิเคราะห์การอยู่รอดที่นำไปใช้กับการให้คะแนนเครดิตภายใต้เงื่อนไขข้อมูลที่ถูกเซ็นเซอร์ มีการตรวจสอบการประยุกต์ใช้วิธีถดถอยเชิงเส้น และโดยเฉพาะวิธีบัคลีย์-เจมส์ ส่วนที่ใช้งานได้จริงของงานเกี่ยวข้องกับการใช้วิธีการเหล่านี้เพื่อประมาณเวลาของการผิดนัดชำระสินเชื่อและเวลาในการชำระเงินครั้งต่อไป

งานวิทยานิพนธ์ของคริสตินา โบลตัน เรื่อง “Logistic regressions and their application in credit scoring”, 2552 แนวคิดของการให้คะแนนเครดิตได้รับการวิเคราะห์สัมพันธ์กับ การธนาคารในแอฟริกาใต้ วิธีการสร้างแบบจำลองการให้คะแนนได้รับการพิจารณาโดยเน้นเป็นพิเศษในวิธีการถดถอยลอจิสติก วิธีการนี้ใช้เพื่อสร้างแบบจำลองการให้คะแนน

งานวิทยานิพนธ์ของ Matthias Krempl เรื่อง “แบบจำลองการปรับตัวและการประยุกต์ในการให้คะแนนเครดิต”, 2554 เน้นที่การศึกษาวิธีการสร้างแบบจำลองการทำนายในสภาวะของการเคลื่อนตัวของข้อมูลและความล่าช้า มีการนำเสนอวิธีการใหม่สำหรับการสร้างแบบจำลองการให้คะแนนตามวิธีแผนผังการตัดสินใจ วิธีการที่นำเสนอนี้ใช้ในการประมาณค่าความคลาดเคลื่อนของข้อมูลทางการเงินจริงสองชุด

ในงานข้างต้นก็มี ปัญหาทั่วไป: การประยุกต์วิธีการในการสร้างแบบจำลองการให้คะแนนไม่สมเหตุสมผล สิ่งนี้ทำให้เกิดข้อสงสัยเกี่ยวกับความถูกต้องของข้อมูลที่ได้รับ ภารกิจคือการสร้างวิธีการที่เหมาะสมในการสมัคร บทความนี้นำเสนอวิธีการแก้ปัญหานี้

มีหลายวิธีในการสร้างแบบจำลองการให้คะแนน บทที่ 1 ของงานนี้ อธิบายวิธีการที่ใช้ในวิทยานิพนธ์ข้างต้น บทที่ 2 แนะนำ แบบจำลองทางคณิตศาสตร์การให้คะแนนและตรวจสอบแนวทางแบบเบย์เซียนเชิงประจักษ์ในการสร้างแบบจำลองการให้คะแนน: วิธีการดังกล่าวได้รับการอธิบายในทางทฤษฎี แล้วนำไปใช้กับข้อมูลจริงจาก Sberbank แห่งรัสเซียเพื่อสร้างแบบจำลองการให้คะแนน บทที่ 3 แนะนำวิธีการตามปัญหา Monge-Kantorovich มีการให้เหตุผลทางทฤษฎีสำหรับการใช้วิธีการนี้ จากนั้นจะใช้เพื่อสร้างแบบจำลองการให้คะแนนกับข้อมูลที่ใช้ในบทที่ 2

บทที่ 1 วิธีการสร้างแบบจำลองการให้คะแนน

1.1 ประวัติความเป็นมาและพัฒนาการของการให้คะแนน

การให้คะแนนได้รับการพัฒนาในช่วงแรกเพื่อทำให้กระบวนการตัดสินใจสินเชื่อเป็นแบบอัตโนมัติ ก่อนที่จะมีการแนะนำการให้คะแนนการตัดสินใจว่าจะให้ใครออกเงินกู้ในจำนวนเท่าใด ผู้เชี่ยวชาญด้านสินเชื่อ- เขาตัดสินใจเรื่องนี้ตามประสบการณ์และความคิดเห็นของเขาเอง โดยพิจารณาจากปัจจัยของลูกค้าที่ส่งผลต่อความน่าเชื่อถือทางเครดิตของเขา

ในทศวรรษที่ 1940 เริ่มมีการนำระบบการให้คะแนนมาใช้ ในปี พ.ศ. 2484 David Durand ได้ตีพิมพ์ผลงานวิจัยฉบับแรกเกี่ยวกับการให้คะแนนเครดิต ซึ่งประเมินบทบาทของปัจจัยต่างๆ ในระบบการทำนาย หลังสงครามโลกครั้งที่ 2 สิ้นสุดลง ก็มีความต้องการ สินเชื่อผลิตภัณฑ์และเห็นได้ชัดว่าวิธีการตัดสินใจแบบเดิมใช้ไม่ได้ผลดีในสภาวะต่างๆ จำนวนมากลูกค้า ความต้องการสินเชื่อที่เพิ่มขึ้นอย่างรวดเร็ว ซึ่งส่วนหนึ่งได้รับแรงหนุนจากการเปิดตัวของ บัตรเครดิตผู้ให้กู้มีแรงจูงใจในการดำเนินการ ระบบอัตโนมัติการตัดสินใจในการออกสินเชื่อ การพัฒนาเทคโนโลยีคอมพิวเตอร์แบบคู่ขนานมีส่วนทำให้เกิดสิ่งนี้และทำให้สามารถประมวลผลข้อมูลทางการเงินจำนวนมากได้

ในปี พ.ศ. 2499 บริษัท FICO ได้ก่อตั้งขึ้นเพื่อพัฒนาด้านสินเชื่ออุปโภคบริโภค ในยุค 60 การนำเทคโนโลยีคอมพิวเตอร์มาใช้ในด้านการให้คะแนนเริ่มขึ้น ในปีพ.ศ. 2506 ได้มีการเสนอให้ใช้การวิเคราะห์ข้อมูลจำแนกเพื่อให้คะแนนเครดิต และในที่สุด ในปี 1975 ด้วยการผ่านกฎหมาย US Equal Credit Opportunity Act I ในที่สุดการให้คะแนนก็ได้รับการยอมรับ

ขั้นตอนสำคัญในการพัฒนาการให้คะแนนเครดิตคือการเกิดขึ้นของพฤติกรรมการให้คะแนนในช่วงต้นทศวรรษที่ 90 มีวัตถุประสงค์เพื่อคาดการณ์การชำระเงินจากลูกค้าปัจจุบัน

เมื่อเร็วๆ นี้ การพัฒนาระบบการให้คะแนนได้รับแรงผลักดันจากกฎระเบียบจากสภาพแวดล้อมภายนอก ในฐานะที่เป็นส่วนหนึ่งของข้อกำหนดความเพียงพอของเงินทุนที่กำหนดกับธนาคารที่เกี่ยวข้องกับการมีผลใช้บังคับของข้อตกลง Basel ฉบับที่ 2 (Basel Committee for Banking Supervision 2001) สถาบันต่างๆ จะต้องติดตามความเสี่ยงที่เกี่ยวข้องกับพวกเขาอย่างใกล้ชิด พอร์ตสินเชื่อ- วิธีการให้คะแนนเครดิตช่วยให้คุณทำเช่นนี้ได้

นับตั้งแต่มีการเปิดตัวระบบการให้คะแนนครั้งแรกหลายระบบทางคณิตศาสตร์และ วิธีการทางสถิติ- ข้อมูลทางสถิติบางส่วนได้แก่: การวิเคราะห์แบบแบ่งแยก การถดถอยเชิงเส้น การถดถอยโลจิสติก และแผนผังการตัดสินใจ วิธีการอื่นๆ มาจากคณิตศาสตร์: การเขียนโปรแกรมทางคณิตศาสตร์ โครงข่ายประสาทเทียม อัลกอริธึมทางพันธุกรรม และระบบผู้เชี่ยวชาญ ต่อไปเราจะวิเคราะห์วิธีการทั่วไปและพูดคุยเกี่ยวกับข้อดีและข้อเสีย

1.2 การวิเคราะห์จำแนกเชิงเส้นและการถดถอยเชิงเส้น

การวิเคราะห์จำแนกเชิงเส้นเป็นวิธีการจำแนกวัตถุเป็นหมวดหมู่ที่กำหนดไว้ล่วงหน้า แนวคิดก็คือการค้นหาชุดค่าผสมเชิงเส้นของตัวแปรอธิบายที่จะจำแนกวัตถุออกเป็นหมวดหมู่ได้ดีที่สุด โดยการแยกที่ดีที่สุดหมายถึงสิ่งที่ให้ระยะห่างสูงสุดระหว่างค่าเฉลี่ยของหมวดหมู่เหล่านี้ คะแนนการให้คะแนนจะคำนวณเป็นฟังก์ชันเชิงเส้นของค่าแอตทริบิวต์ไคลเอ็นต์:

นี่คือค่าแอตทริบิวต์ไคลเอ็นต์ ซึ่งเป็นพารามิเตอร์โมเดลที่เพิ่มความสัมพันธ์ให้สูงสุด

เวกเตอร์ของค่าเฉลี่ยอยู่ที่ไหน ดีและ แย่ลูกค้า คือเมทริกซ์ความแปรปรวนร่วมทั่วไป

วิธีการจำแนกเชิงเส้นจะถือว่าเป็นไปตามเงื่อนไขสองประการ ประการแรก เมทริกซ์ความแปรปรวนร่วมของตัวแปรอิสระสำหรับทั้งสองกลุ่มจะต้องเหมือนกัน ประการที่สอง ตัวแปรอิสระจะต้องมีการแจกแจงแบบปกติ บ่อยครั้ง ในการให้คะแนน ตัวแปรอิสระจะไม่ต่อเนื่องหรือไม่มีการแจกแจงตามปกติ จึงเกิดปัญหาในการใช้วิธีนี้ อย่างไรก็ตาม พบว่าแม้ในกรณีของการละเมิดภาวะปกติ วิธีการนี้ก็สามารถใช้ได้อย่างกว้างขวาง ข้อดีของมันคือใช้งานง่าย

วิธีการถดถอยเชิงเส้นที่คล้ายกันยังใช้เพื่อสร้างแบบจำลองการให้คะแนนด้วย ในกรณีของสองประเภท จะเทียบเท่ากับวิธีการวิเคราะห์จำแนกเชิงเส้น และแสดงการพึ่งพาตัวแปรหนึ่ง (ขึ้นอยู่กับ) กับตัวแปรอื่น ๆ (อิสระ) ใน มุมมองทั่วไปปรากฏดังนี้:

ตัวแปรตาม;

ตัวแปรอิสระที่อธิบายได้

ค่าสัมประสิทธิ์การถดถอยที่ไม่รู้จัก ซึ่งพบโดยใช้วิธีกำลังสองน้อยที่สุด

ในการใช้แบบจำลองการให้คะแนนเชิงเส้น จำเป็นต้องมีสมมติฐานต่อไปนี้: ความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระจะต้องเป็นแบบเชิงเส้น มิฉะนั้นความถูกต้องของการประมาณการจะลดลงอย่างมาก ข้อผิดพลาดจะต้องเป็นอิสระและกระจายตามปกติ

เช่นเดียวกับการวิเคราะห์แบบแบ่งแยก ในการตั้งค่าการให้คะแนนเครดิต สมมติฐานที่จำเป็นในการใช้การถดถอยเชิงเส้นมักถูกละเมิด การถดถอยเชิงเส้นอาจทำให้การประมาณความน่าจะเป็นอยู่นอกช่วง ซึ่งเป็นที่ยอมรับไม่ได้ ตัวอย่างเช่น การถดถอยโลจิสติกไม่มีข้อเสียเปรียบนี้

1.3 การถดถอยโลจิสติกและการถดถอยของโปรบิต

การถดถอยประเภทนี้เหมาะสมกว่าสำหรับการสร้างแบบจำลองการให้คะแนน เนื่องจากทำให้สามารถนำเสนอข้อมูลตามหมวดหมู่ได้ แบบจำลองการถดถอยโลจิสติกมีการระบุดังนี้:

ค่าประมาณความน่าจะเป็นที่ลูกค้า “แย่” อยู่ที่ไหน , - เวกเตอร์ของพารามิเตอร์การถดถอยที่ไม่รู้จัก ซึ่งคำนวณผ่านเงื่อนไขในการเพิ่มอัตราส่วนความน่าจะเป็นให้สูงสุด

แบบจำลองการถดถอยโลจิสติกจะขึ้นอยู่กับฟังก์ชันลอการิทึม ในทางกลับกัน การถดถอยของโปรบิตจะขึ้นอยู่กับการแจกแจงแบบปกติและระบุไว้ดังนี้:

ที่ไหน. เวกเตอร์ถูกพบในลักษณะเดียวกับในแบบจำลองการถดถอยโลจิสติก

เนื่องจากการถดถอยโลจิสติกและการถดถอยแบบโปรบิตใช้การกระจายที่มีรูปทรงคล้ายกัน ผลลัพธ์ของแบบจำลองเหล่านี้จึงคล้ายกันเช่นกัน แนะนำให้ใช้การถดถอยแบบโลจิสติกเนื่องจากการคำนวณจะง่ายกว่าการถดถอยแบบโปรบิต และมีเครื่องมือเพิ่มเติมให้ใช้งาน เนื่องจากธรรมชาติของไบนารี่ การถดถอยแบบลอจิสติกจึงดีกว่าการถดถอยเชิงเส้น เมื่อใช้ในการสร้างแบบจำลองการให้คะแนน ในทางปฏิบัติพบว่าความแตกต่างในความแม่นยำของผลลัพธ์ที่คาดการณ์ไม่มีนัยสำคัญ อย่างไรก็ตาม มีความเหนือกว่าของการถดถอยโลจิสติกในระบบการให้คะแนน

1.4 โครงข่ายประสาทเทียม

โครงข่ายประสาทเทียมเป็นการจำลองโครงข่ายประสาทเทียมที่พบในธรรมชาติ แนวคิดนี้เกิดขึ้นจากความพยายามที่จะจำลองกระบวนการที่เกิดขึ้นในสมองของมนุษย์

โครงข่ายประสาทเทียมหรือที่เรียกว่า multilayer perceptron เหมาะอย่างยิ่งสำหรับการแก้ปัญหาการจำแนกประเภท มีการใช้กันอย่างแพร่หลายในสาขาต่างๆ: การเงิน วิทยาการคอมพิวเตอร์ ฟิสิกส์ และการแพทย์ ความนิยมของโครงข่ายประสาทเทียมส่วนหนึ่งมาจากความสามารถในการจำลอง สถานการณ์ที่ยากลำบากโดยไม่มีค่าใช้จ่ายพิเศษใดๆ ในส่วนของผู้ใช้บริการด้วยวิธีนี้ โดยธรรมชาติแล้ว โครงข่ายประสาทเทียมจะตรวจจับสถานการณ์ที่ไม่เป็นเชิงเส้นในข้อมูลโดยอัตโนมัติและปรับให้เข้ากับสถานการณ์นั้น นอกจากนี้ โครงข่ายประสาทเทียมหลายชั้นยังเป็นตัวประมาณแบบสากล กล่าวคือ พวกมันสามารถประมาณฟังก์ชันใด ๆ ได้อย่างแม่นยำตามต้องการ

โครงข่ายประสาทเทียมประกอบด้วยเลเยอร์ซึ่งในทางกลับกันก็ประกอบด้วยโหนด เลเยอร์ในเครือข่ายมี 3 ประเภท: อินพุต, ซ่อนเร้น, เอาต์พุต เลเยอร์อินพุตประกอบด้วยคุณลักษณะของลูกค้า เช่น เพศ อายุ ฯลฯ

เอาต์พุตสำหรับโหนด k ที่มีอินพุต m จะแสดงดังต่อไปนี้:

โดยที่ฟังก์ชันการเปิดใช้งานคือเวกเตอร์ข้อมูลอินพุต คือเวกเตอร์น้ำหนักซึ่งแสดงถึงความแรงของการเชื่อมต่อระหว่างโหนด

ข้อเสียเปรียบหลักคือแม้จะมีความเป็นไปได้ที่จะได้รับการคาดการณ์ที่แม่นยำสูง แต่ก็เป็นไปไม่ได้ที่จะเข้าใจเหตุผลว่าทำไมจึงตัดสินใจโดยเฉพาะ

ในบริบทของการให้คะแนนเครดิต โครงข่ายประสาทเทียมได้รับการแสดงให้เห็นว่าทำงานได้ดีเช่นเดียวกับวิธีการแบบเดิม

1.5 การวิเคราะห์ CHID

วิธีนี้เหมาะสำหรับการค้นหาความสัมพันธ์ระหว่างข้อมูล โดยเฉพาะอย่างยิ่งหากความสัมพันธ์ไม่เป็นเชิงเส้น มันถูกใช้เพื่อสร้างแผนผังการตัดสินใจ และมีอะไรเหมือนกันหลายอย่าง วิธีการแบบคลาสสิกเช่นการวิเคราะห์จำแนกและการถดถอยเชิงเส้น

ตัวย่อ CHAID ย่อมาจาก Chi-squared Automated Interaction Detector

ความยืดหยุ่นของวิธีนี้ทำให้น่าสนใจในการใช้งาน แต่ไม่ได้หมายความว่าควรใช้แทนวิธีแบบเดิมๆ เมื่อพบสมมติฐานการกระจายทางทฤษฎีที่เข้มงวด วิธีการแบบเดิมจะดีกว่า เนื่องจากเป็นเทคนิคการวิจัยหรือเมื่อวิธีการแบบเดิมๆ ล้มเหลว การวิเคราะห์ CHAID จึงเป็นเครื่องมือที่ไม่มีใครเทียบได้

CHAID สร้างต้นไม้ที่ไม่ใช่ไบนารี่ (นั่นคือ ต้นไม้ที่สามารถมีกิ่งก้านได้มากกว่าสองกิ่ง) โดยใช้อัลกอริธึมที่ค่อนข้างง่ายซึ่งเหมาะอย่างยิ่งสำหรับการวิเคราะห์ชุดข้อมูลขนาดใหญ่ อัลกอริธึมจะขึ้นอยู่กับการประยุกต์ใช้การทดสอบไคสแควร์

1.6 วิธีการอื่นๆ

ต้นไม้การตัดสินใจ

วิธีการแบ่งข้อมูลออกเป็นชุดย่อย ซึ่งแต่ละชุดมีลักษณะการทำงานที่สม่ำเสมอมากกว่าชุดข้อมูลดั้งเดิม แต่ละชุดย่อยเหล่านี้จะถูกแบ่งเพิ่มเติมตามอัลกอริทึมเดียวกัน ผลการแบ่งส่วนเรียกว่า “ใบ” ของต้นไม้ มีวิธีอื่นที่ใช้หลักการเดียวกันนี้

ข้อดีของวิธีนี้คือความเรียบง่ายและสัญชาตญาณ วิธีการนี้สามารถจัดการกับการสังเกตที่ขาดหายไปได้ โดยเฉพาะอย่างยิ่งนำไปใช้ในกรณีที่แทบไม่มีใครรู้ข้อมูลก่อนทำการศึกษาและไม่สามารถคาดเดาหรือตั้งสมมติฐานได้

ข้อเสียเปรียบหลักของวิธีนี้คือความซับซ้อนของการคำนวณด้วยคอมพิวเตอร์ เนื่องจากต้นไม้ที่เกิดมีขนาดใหญ่มาก กระบวนการศึกษาแบบจำลองจึงต้องใช้แรงงานมาก การเปลี่ยนแปลงในสถานการณ์อาจนำไปสู่การแก้ไขแผนผังการตัดสินใจทั้งหมด

วิธีการนี้ส่วนใหญ่จะใช้เป็นวิธีการเสริม ตัวอย่างเช่น เพื่อกำหนดตัวแปรที่อธิบายพฤติกรรมของตัวแปรตามได้ชัดเจนที่สุด

วิธีเคเพื่อนบ้านที่ใกล้ที่สุด วิธีแบบไม่อิงพารามิเตอร์สำหรับการจำแนกวัตถุ อิงตามเมตริกที่กำหนดความคล้ายคลึงกันระหว่างข้อมูล

ขั้นแรกจะป้อนข้อมูลการฝึกอบรมโดยแบ่งออกเป็นชั้นเรียน จากนั้นป้อนข้อมูลที่จะประเมินและพิจารณาความคล้ายคลึงกันระหว่างข้อมูลอินพุตและข้อมูลการฝึกอบรม จากการวัด จะมีการเลือก k เพื่อนบ้านที่ใกล้ที่สุด องค์ประกอบใหม่ถูกกำหนดให้กับคลาสที่เพื่อนบ้านส่วนใหญ่อยู่

จำนวนเพื่อนบ้าน k ถูกกำหนดโดยการแลกเปลี่ยนระหว่างค่าตอบแทนและความแปรปรวน ยิ่งคลาสเล็กลง k ก็ยิ่งถูกเลือกน้อยลง ไม่จำเป็นว่าสำหรับ k ขนาดใหญ่ผลลัพธ์จะดีกว่า

ข้อดีประการหนึ่งของวิธีนี้คือสามารถเพิ่มข้อมูลใหม่ได้ง่ายโดยไม่ต้องเปลี่ยนโมเดล ลักษณะที่ไม่ใช่พารามิเตอร์ของวิธีนี้ทำให้คุณสามารถทำงานกับความไม่ลงตัวในฟังก์ชันความเสี่ยงในพื้นที่คุณลักษณะได้

การขาดวิธีการอย่างเป็นทางการในการเลือก k และความเป็นไปไม่ได้ของการตีความผลลัพธ์ที่น่าจะเป็น เนื่องจากผลลัพธ์คือความถี่ที่คาดหวัง จึงเป็นข้อเสียหลักของวิธีนี้ ปัญหาเหล่านี้สามารถแก้ไขได้โดยใช้วิธีการประมาณแบบเบย์

วิธีนี้ไม่ค่อยมีใครใช้ในการให้คะแนน เหตุผลประการหนึ่งก็คือในการจำแนกวัตถุหนึ่งวัตถุจำเป็นต้องมีฐานข้อมูลของวัตถุทั้งหมด

ใหม่กว่า รองรับเครื่องเวกเตอร์สร้างขึ้นบน การเรียนรู้ของเครื่องได้รับการพิสูจน์แล้วว่าไม่ได้เลวร้ายไปกว่าวิธีการให้คะแนนแบบดั้งเดิม ประกอบด้วยสองกระบวนการ: กระบวนการแรกแปลงข้อมูลอินพุตเป็นข้อมูลมิติสูงในพื้นที่คุณลักษณะ ส่วนที่สองจัดประเภทข้อมูลโดยใช้ตัวแยกประเภทเชิงเส้น ตัวแยกประเภทสามารถเป็นได้ ตัวอย่างเช่น การวิเคราะห์จำแนกเชิงเส้น

1.7 การเปรียบเทียบวิธีการต่างๆ

มีการศึกษาเปรียบเทียบเกี่ยวกับวิธีการให้คะแนนจำนวนหนึ่ง เกณฑ์ในการจัดอันดับคือเปอร์เซ็นต์ของข้อผิดพลาดในการจำแนกประเภทและกราฟ ROC ศึกษาชุดข้อมูลจำนวน 8 ชุด

คะแนนเฉลี่ย

โครงข่ายประสาทเทียม

รองรับเครื่องเวกเตอร์

การถดถอยโลจิสติก

การวิเคราะห์จำแนกเชิงเส้น

เชิงเส้น LS-SVM

ต้นไม้เบย์ขยาย

ตัวแยกประเภท Naive Bayes

ฟังก์ชันพื้นฐานแนวรัศมี

k-เพื่อนบ้านที่ใกล้ที่สุด (k=100)

SVM เชิงเส้น

การวิเคราะห์จำแนกกำลังสอง

ต้นไม้ตัดสินใจ

การเขียนโปรแกรมเชิงเส้น

ต้นไม้ตัดสินใจ

ต้นไม้ตัดสินใจ

k-เพื่อนบ้านที่ใกล้ที่สุด (k=10)

ต้นไม้ตัดสินใจ

ตารางแสดงให้เห็นว่าโครงข่ายประสาทเทียมและเครื่องเวกเตอร์ที่รองรับนั้นดีที่สุดจากชุดข้อมูล 8 ชุดที่ศึกษา นอกจากนี้ วิธีการแบบดั้งเดิม เช่น การวิเคราะห์เชิงเส้นและแบบจำแนกประเภท ได้รับการพิสูจน์แล้วว่าสามารถแข่งขันได้ ตามมาว่าข้อมูลการให้คะแนนเครดิตส่วนใหญ่อาจไม่เป็นเชิงเส้นเพียงเล็กน้อยเท่านั้น ส่งผลให้ วิธีการเชิงเส้นแสดงให้เห็นว่าตนเองทัดเทียมกับสิ่งที่ไม่เชิงเส้น

ไม่มีรูปแบบการให้คะแนนที่เหมาะสมที่สุดสำหรับทุกสถานการณ์ การเลือกแบบจำลองขึ้นอยู่กับข้อมูลและวัตถุประสงค์ในการสร้างแบบจำลอง นอกจากนี้ วิธีการประมาณการที่ดีที่สุดไม่จำเป็นต้องดีที่สุดในสถานการณ์ที่กำหนด

บทที่ 2 แนวทางเบย์เซียนเชิงประจักษ์

ในบทนี้ เราจะวิเคราะห์แนวทางเบย์เซียนเชิงประจักษ์ และใช้เพื่อสร้างแบบจำลองการให้คะแนน เราจะสร้างตามสถิติบน สินเชื่อผู้บริโภคธนาคาร "Sberbank แห่งรัสเซีย"

2.1 คำชี้แจงปัญหา

สมมติว่ามีธนาคารแห่งหนึ่งที่ให้สินเชื่อแก่บุคคลทั่วไป ลูกค้าติดต่อธนาคารเพื่อขอสินเชื่อ ธนาคารตัดสินใจออกเงินกู้ตามข้อมูลเกี่ยวกับลูกค้า

ธนาคารได้รับข้อมูลเกี่ยวกับลูกค้าจากแหล่งต่าง ๆ : จากลูกค้าเองจาก สำนักงานเครดิตและจากแหล่งอื่นๆ เราจะพิจารณาข้อมูลที่ลูกค้าให้มาเอง ธนาคารจะได้รับผ่านแบบสอบถามที่กรอกโดยผู้กู้

ในแบบฟอร์มใบสมัครผู้กู้ระบุข้อมูลต่อไปนี้: เพศ, อายุ, สถานภาพการสมรส, การปรากฏตัวของบุตร, รายได้ต่อเดือน, ความพร้อมของอสังหาริมทรัพย์ ฯลฯ

จากข้อมูลนี้ เราจะแบ่งลูกค้าออกเป็นกลุ่มที่มีความคล้ายคลึงกัน สัญญาณบางอย่าง- เราจะค้นหาคะแนนสำหรับลูกค้าแต่ละรายโดยใช้วิธีแบบเบย์ - ความน่าจะเป็นเชิงประจักษ์ที่ลูกค้าจะชำระคืนเงินกู้โดยมีเงื่อนไขว่าเขาอยู่ในกลุ่มนี้

หากต้องการใช้วิธีการ ข้อมูลต้องเป็นไปตามเงื่อนไขต่อไปนี้:

· ความเป็นอิสระ - ลูกค้าไม่ตกลงที่จะชำระคืนเงินกู้

· ความสม่ำเสมอ - ข้อมูลถูกนำมาจากประชากรทั่วไปกลุ่มหนึ่ง

· ความน่าจะเป็นที่เท่ากัน - ลูกค้ามีแนวโน้มที่จะถูกกระจายออกเป็นกลุ่มเท่าๆ กัน

การใช้งานมีการตรวจสอบด้านล่าง

2.2 การสร้างแบบจำลองการให้คะแนน

ให้เราแนะนำพื้นที่ความน่าจะเป็น ให้เราแสดงในพื้นที่นี้ลูกค้าธนาคาร

ลูกค้าธนาคารแต่ละรายมีชุดคุณลักษณะตามแบบสอบถามที่กรอกแล้ว เช่น แต่งงานแล้วหรือไม่ ระดับรายได้แยกตามประเภท มีรถยนต์ และลักษณะอื่นๆ ตามคุณลักษณะเหล่านี้ เราแนะนำการแบ่งพาร์ติชันของพื้นที่เป็นชุด

ดังนั้นลูกค้าจำนวนมากจึงถูกแบ่งออกเป็นกลุ่ม

ขอแนะนำตัวแปรสุ่ม

จำนวนลูกค้าในกลุ่ม j-th

จากข้อมูล เราสามารถสร้างการแจกแจงความน่าจะเป็นเชิงประจักษ์ร่วมได้

ความน่าจะเป็นเชิงประจักษ์เชิงนิรนัยของเหตุการณ์ A อยู่ที่ไหน

ความน่าจะเป็นเชิงประจักษ์ของเหตุการณ์ B เมื่อให้ A,

ความน่าจะเป็นเชิงประจักษ์ของเหตุการณ์ A ตามเงื่อนไข B ซึ่งเรียกว่าความน่าจะเป็นภายหลัง

ความน่าจะเป็นเชิงประจักษ์ของเหตุการณ์ B

สูตรนี้ช่วยให้คุณประเมินความน่าจะเป็นของเหตุการณ์ A สูงเกินไป โดยคำนึงถึงข้อเท็จจริงที่ว่าเหตุการณ์ B เกิดขึ้น

จากคำจำกัดความของความน่าจะเป็นแบบมีเงื่อนไขเราสามารถเขียนได้:

จาก (1) และการแทนที่นิพจน์สำหรับ ลงในสูตรนี้ เราได้รับ:

2.3 การใช้แบบจำลองกับข้อมูล

เรามีข้อมูลเกี่ยวกับลูกค้า 1,977 รายของ Sberbank แห่งรัสเซีย รวมถึงข้อมูลว่าพวกเขาชำระคืนเงินกู้หรือไม่

หากต้องการใช้แนวทางแบบเบย์ จำเป็นต้องแน่ใจว่าเป็นไปตามสมมติฐาน 3 ข้อ:

· เกี่ยวกับความเป็นอิสระ - ลูกค้าไม่ตกลงที่จะชำระคืนหรือไม่ชำระคืนเงินกู้

· เกี่ยวกับความเป็นเนื้อเดียวกัน - ข้อมูลถูกนำมาจากประชากรทั่วไปกลุ่มหนึ่ง

· เกี่ยวกับประเภทของการกระจาย - ข้อมูลมีการกระจายอย่างเท่าเทียมกัน

สมมติฐานความเป็นอิสระ

เพื่อทดสอบสมมติฐานนี้ เราจะใช้การทดสอบอันดับของสเปียร์แมน สถิติของเกณฑ์นี้คือค่าสัมประสิทธิ์สหสัมพันธ์อันดับซึ่งกำหนดไว้ดังนี้

ให้ข้อสังเกตสองชุด: จากการสังเกตเหล่านี้ เราจะสร้างอันดับเป็นคู่ ตามอันดับ เราหมายถึงจำนวนสถานที่ที่ถูกครอบครองโดยการสังเกตในชุดรูปแบบต่างๆ เราเข้าใจยศไปในทางเดียวกัน จากนั้น เราจะจัดเรียงคู่อันดับใหม่โดยเรียงจากน้อยไปมากขององค์ประกอบแรก ให้เราแสดงถึงซีรีย์ผลลัพธ์

ค่าสัมประสิทธิ์สหสัมพันธ์พบได้จากสูตร:

บริเวณวิกฤตของเกณฑ์ ในการค้นหา เราใช้ข้อเท็จจริงที่ว่ากฎการกระจายมีแนวโน้มที่จะเป็น n ขนาดใหญ่ จากที่นี่. นี่คือฟังก์ชันการกระจายของกฎเกาส์เซียนมาตรฐาน

ที่ระดับนัยสำคัญ =1.959964 ขอบเขตของเขตวิกฤติ ค่าสัมประสิทธิ์สหสัมพันธ์ที่พบ

ดังนั้น สถิติการทดสอบจึงไม่อยู่ภายในขอบเขตวิกฤต และเราสามารถยอมรับสมมติฐานความเป็นอิสระได้ที่ระดับนัยสำคัญที่ 0.05

สมมติฐานความเป็นเนื้อเดียวกัน

สมมติฐานมีดังต่อไปนี้ ตัวอย่างสองตัวอย่างได้รับจากการแจกแจง และตามลำดับ โดยมีฟังก์ชันการแจกแจง และ จากนั้นสมมติฐานความเป็นเนื้อเดียวกัน

เพื่อทดสอบสมมติฐานนี้ เราจะใช้เกณฑ์ของ Smirnov

สถิติของเกณฑ์นี้คือฟังก์ชันการแจกแจงเชิงประจักษ์ที่สร้างจากตัวอย่างและ บริเวณวิกฤตจะแสดงอยู่ในรูปแบบ สำหรับ n และ m ขนาดใหญ่ ขอบเขตของบริเวณวิกฤตสามารถนำมาเท่ากับ โดยที่ - ฟังก์ชั่นการกระจาย Kolmogorov

ดังนั้นสมมติฐานความเป็นเนื้อเดียวกันจึงถูกปฏิเสธหาก ที่ระดับนัยสำคัญ 0.05 - ขอบเขตของภูมิภาควิกฤต สถิติ.

สถิติการทดสอบไม่อยู่ภายในขอบเขตวิกฤต และเราสามารถยอมรับสมมติฐานความเป็นเนื้อเดียวกันได้ที่ระดับนัยสำคัญที่ 0.05

สมมติฐานเกี่ยวกับประเภทของการกระจาย

ลองตั้งสมมติฐานกัน เราได้รับตัวอย่างจากการแจกแจงที่มีฟังก์ชันการแจกแจงที่ไม่ทราบ จำเป็นต้องตรวจสอบว่าเป็นฟังก์ชันการกระจายของการกระจายแบบสม่ำเสมอในส่วนนั้น

ในการดำเนินการนี้ เราจะใช้การทดสอบความฟิตของเพียร์สัน

โดยมีสถิติเกณฑ์คือ นี่คือความถี่ของการสังเกตที่อยู่ในส่วนที่ i และความน่าจะเป็นที่จะตกอยู่ในส่วนที่ i หากสมมติฐานที่กำลังทดสอบนั้นถูกต้อง สำหรับสถิติขนาดใหญ่นั้นเป็นไปตามการแจกแจงไคสแควร์ที่มีดีกรีอิสระ k-1

สมมติฐานจะถูกปฏิเสธหากสถิติเกินค่าวิกฤต

เราคำนวณค่าสถิติโดยใช้ชุดซอฟต์แวร์ Statistica - =24.19468, k-1=39 ขอบเขตของภูมิภาควิกฤตในระดับนัยสำคัญ

ดังนั้นค่าของสถิติจะต้องไม่เกินระดับวิกฤต และสมมติฐานเกี่ยวกับการกระจายลูกค้าแบบสม่ำเสมอระหว่างกลุ่มเป็นที่ยอมรับที่ระดับนัยสำคัญ 0.05

ดังนั้นข้อมูลจึงเป็นไปตามสมมติฐานทั้งหมดข้างต้น และเราสามารถเริ่มค้นหาการให้คะแนนได้

ข้อมูลที่มีอยู่ประกอบด้วยคุณลักษณะของลูกค้าที่แตกต่างกันมากมาย สำหรับการก่อสร้างเราจะใช้ 4 รายการที่สำคัญที่สุด เอา มากกว่าองค์ประกอบที่เราไม่ได้รับอนุญาตตามข้อจำกัดของกลุ่มตัวอย่างของเรา (องค์ประกอบ 1977)

ลักษณะที่เลือก: อายุและเพศของผู้ยืม, การปรากฏตัวของบุตร, การชำระคืนเงินกู้เป็นเปอร์เซ็นต์ของรายได้รวมของผู้ยืม ลักษณะอายุใช้ 3 ค่า - 18-29, 30-45, 46-…; เพศของผู้ยืมมีสองความหมาย - ชายและหญิง การมีลูกมีสองความหมาย - มีลูกและไม่มีลูก การจ่ายเงินใช้ 5 ค่า - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

เราจะเรียกแต่ละมูลค่าเฉพาะของลักษณะเฉพาะว่าเป็นทรัพย์สินของผู้ยืม มาแบ่งลูกค้าของเราทั้งหมดออกเป็นชุดๆ ตามการมีอยู่ของคุณสมบัติเฉพาะสำหรับลูกค้าที่กำหนด เช่น มีลูกค้าจำนวนมากที่ไม่มีบุตร

ให้เราให้สัญลักษณ์เหล่านี้:

เด็ก = ไม่มีลูก = มีเด็ก;

อายุ =อายุ1(18-29), =อายุ2(30-45), =อายุ3(46-...);

เพศ = หญิง = ชาย;

การชำระคืนเงินกู้เป็นเปอร์เซ็นต์ของรายได้รวมของผู้กู้ =In1(<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

เราสร้างชุดใหม่โดยผสมผสานคุณสมบัติที่เป็นไปได้ทั้งหมดของลูกค้า - เพื่อความเป็นไปได้ทั้งหมด ตัวอย่างเช่น ชุดประกอบด้วยผู้หญิงอายุ 18-29 ปีที่ไม่มีบุตร โดยจ่ายเงิน<5% от своего суммарного дохода. Количество таких множеств равно 60.

ตารางที่ 2.1. ตั้งค่าการเข้ารหัส

ไม่มีลูก

มีเด็ก

โปรดทราบว่า - สร้างพาร์ติชันของไคลเอนต์ทั้งชุด:

เรามาสร้างการแจกแจงเชิงประจักษ์ร่วมกันของตัวแปรสุ่มที่ไม่ต่อเนื่องสองตัว - และ โดยที่ =(0,1), =(, i=1:60) เราจะสร้างมันเป็นอัตราส่วนของจำนวนไคลเอนต์ที่ตรงกับค่าคู่ของตัวแปรสุ่ม (X,Y) ต่อจำนวนไคลเอนต์ทั้งหมด

ให้เราแก้ไขจำนวนไคลเอนต์ที่สอดคล้องกับแต่ละคู่ที่เป็นไปได้ (X,Y)

ตารางที่ 2.2. จำนวนลูกค้าที่ชำระคืนและไม่ชำระคืนเงินกู้ในแต่ละกลุ่ม 0 - ชำระคืนเงินกู้แล้ว 1 - ยังไม่ได้ชำระคืนเงินกู้

ให้เราสร้างการแจกแจงความน่าจะเป็นเชิงประจักษ์ร่วมกัน ในการดำเนินการนี้ เราจึงหารจำนวนลูกค้าที่ชำระคืนและไม่ได้ชำระคืนเงินกู้ในแต่ละกลุ่มด้วยจำนวนลูกค้าทั้งหมด

ตารางที่ 2.3. การกระจายความน่าจะเป็นร่วมเชิงประจักษ์

รูปที่ 2.1. ฟังก์ชันการแจกแจงเชิงประจักษ์ที่ X=0

รูปที่ 2.2. ฟังก์ชันการแจกแจงเชิงประจักษ์ที่ X =1

รูปที่ 2.3. ฮิสโตแกรมของการกระจายข้อต่อที่ X=0

รูปที่ 2.4. ฮิสโตแกรมของการกระจายตัวของข้อต่อที่ X=1

มาดูการกระจายตัวเชิงประจักษ์ของความน่าจะเป็นที่จะเข้าแต่ละกลุ่มกันดีกว่า เมื่อต้องการทำเช่นนี้ ให้หารจำนวนลูกค้าในแต่ละกลุ่มด้วยจำนวนลูกค้าทั้งหมด จำนวนลูกค้าทั้งหมด

ตารางที่ 2.4. การกระจายเชิงประจักษ์ของความน่าจะเป็นในแต่ละกลุ่ม

รูปที่ 2.5. ฮิสโตแกรมของการเข้าสู่กลุ่ม i

จากนี้เราได้รับการจำแนกประเภท:

· ลูกค้าจากกลุ่ม 60 มีความเสี่ยง

· ลูกค้ากลุ่ม 1-5, 7-12, 15, 17, 25, 31, 32, 33, 35-37, 39, 40, 42, 54-56, 58 - ความเสี่ยงปานกลาง

· ลูกค้าจากกลุ่ม 6, 13, 14, 16, 18-24, 26-30, 34, 38, 41, 43-53, 57, 59 - เชื่อถือได้

บทที่ 3 แนวทางตามปัญหา Monge-Kantorovich

3.1 ปัญหามอนเจ-คันโตโรวิช

ปัญหาของมง

เมื่อพิจารณาช่องว่างความน่าจะเป็นสองช่องและฟังก์ชันที่วัดได้ไม่เป็นลบบน ...

เอกสารที่คล้ายกัน

    การวิเคราะห์จำแนกเป็นส่วนหนึ่งของการวิเคราะห์ทางสถิติหลายตัวแปร การวิเคราะห์จำแนกภายใต้กฎการแจกแจงแบบปกติของตัวบ่งชี้ การประยุกต์ใช้การวิเคราะห์จำแนกโดยมีตัวอย่างการฝึกอบรมสองตัวอย่าง การแก้ปัญหาในระบบสถิติ

    งานหลักสูตร เพิ่มเมื่อ 21/01/2011

    แบบจำลองการวิเคราะห์จำแนก ประสิทธิผลของแบบจำลองการทำนายการล้มละลายของตะวันตกและรัสเซียคลาสสิก ข้อมูลเฉพาะทางอุตสาหกรรม คำอธิบายของบทความ รวมถึงคุณลักษณะตัวอย่าง วิธีการ รายการปัจจัย และอำนาจการทำนายของวิธีวิเคราะห์

    บทคัดย่อเพิ่มเมื่อ 24/07/2559

    พื้นฐานของการวิเคราะห์การถดถอยเชิงเส้น คุณสมบัติของการใช้ฟังก์ชัน Cobb-Douglas การประยุกต์การถดถอยเชิงเส้นพหุคูณ สาระสำคัญของวิธีกำลังสองน้อยที่สุด วิธีหลีกเลี่ยงความสัมพันธ์ที่ผิดพลาด การทดสอบความสำคัญของสัมประสิทธิ์การถดถอย

    บทคัดย่อ เพิ่มเมื่อ 31/10/2552

    การจำแนกประเภทเศรษฐกิจของประเทศ ลักษณะของตัวชี้วัดหลักของการพัฒนาเศรษฐกิจ วิธีการวิเคราะห์ทางสถิติ คำอธิบายการวิเคราะห์เชิงจำแนก คลัสเตอร์ ปัจจัย และการวิเคราะห์เชิงกราฟ พารามิเตอร์การศึกษาความมั่นคงทางเศรษฐกิจ

    วิทยานิพนธ์เพิ่มเมื่อ 10/14/2013

    ประวัติความเป็นมาของการวิเคราะห์ต้นทุนเชิงฟังก์ชัน วิธีการ หลักการ งาน และขั้นตอนการดำเนินการ โดยใช้การวิเคราะห์ระบบและการพัฒนาแบบองค์ประกอบต่อองค์ประกอบการออกแบบแต่ละส่วน Yu.M. โซโบเลฟ. การประยุกต์การวิเคราะห์ต้นทุนเชิงฟังก์ชัน

    ทดสอบเพิ่มเมื่อ 04/08/2012

    รากฐานทางทฤษฎีและระเบียบวิธีของการวิเคราะห์ทางเศรษฐศาสตร์ หัวข้อ วัตถุประสงค์ งาน ลักษณะของหลักการวิเคราะห์ทางเศรษฐศาสตร์ แนวทาง และคุณลักษณะของการนำไปใช้ในทางปฏิบัติ การกำหนดแนวโน้มการพัฒนาองค์กรโดยอาศัยการวิเคราะห์

    งานหลักสูตร เพิ่มเมื่อ 12/20/2010

    สาระสำคัญและการประยุกต์วิธีกำลังสองน้อยที่สุดสำหรับการถดถอยเชิงเส้นแบบตัวแปรเดียว การค้นหาค่าสัมประสิทธิ์ความยืดหยุ่นสำหรับแบบจำลองที่ระบุ ณ จุด X ที่กำหนด และการวิเคราะห์ทางเศรษฐศาสตร์ การพยากรณ์อัตราส่วนการสูญเสียตามการถดถอยเชิงเส้น

    ทดสอบเพิ่มเมื่อ 15/06/2552

    แก่นแท้ของแบบจำลอง Olson เป็นหนึ่งในการพัฒนาสมัยใหม่ที่มีแนวโน้มมากที่สุดในทฤษฎีการประเมินมูลค่าบริษัท EVO ในการประเมินเชิงปฏิบัติ คุณสมบัติของงานในรัสเซีย คุณลักษณะของพลวัตข้อมูลเชิงเส้นของโอลสันและเฟลแธม-โอลสัน

    ทดสอบเพิ่มเมื่อ 04/07/2554

    แนวคิดเกี่ยวกับข้อมูลทางเศรษฐกิจ สาระสำคัญและลักษณะเฉพาะ การจำแนกประเภทและพันธุ์ ลักษณะเฉพาะและลักษณะเด่น สาระสำคัญ หัวข้อและวัตถุประสงค์ของการวิเคราะห์ทางเศรษฐศาสตร์ เป้าหมายและวัตถุประสงค์ ความสัมพันธ์ของการวิเคราะห์กับศาสตร์อื่นๆ การจัดองค์กร

    แผ่นโกงเพิ่มเมื่อ 04/05/2552

    วิธีการพัฒนาแบบจำลองทางเศรษฐศาสตร์-คณิตศาสตร์ การแถลงปัญหา ระบบตัวแปรและข้อจำกัด ประเภทของการแก้ปัญหาแบบจำลองทางเศรษฐศาสตร์-คณิตศาสตร์เพื่อปรับโครงสร้างการผลิตขององค์กรเกษตรกรรมให้เหมาะสม การวิเคราะห์การประเมินแบบคู่


ในการสร้างแบบจำลองการให้คะแนน (และไม่คำนึงถึงวิธีการทางคณิตศาสตร์ที่เลือก) จะมีการสุ่มตัวอย่างที่เป็นตัวแทนของผู้สมัครก่อนหน้านี้ (จากหลายพันถึงหลายแสนราย ซึ่งไม่เป็นปัญหาสำหรับอุตสาหกรรมที่ให้บริการลูกค้าหลายสิบล้านราย) สำหรับผู้สมัครแต่ละคนในกลุ่มตัวอย่าง ข้อมูลที่สมบูรณ์จากแบบฟอร์มใบสมัครและข้อมูลจากประวัติเครดิตของเขาจะถูกดึงออกมาในระยะเวลาที่กำหนด (ปกติคือ 12, 18 หรือ 24 เดือน) จากนั้นจะมีการตัดสินใจของผู้เชี่ยวชาญว่าเรื่องใดที่ยอมรับได้ เช่น ไม่ว่าลูกค้าจะ "ดี" หรือ "แย่" ส่วนใหญ่แล้วลูกค้าที่ไม่ได้จ่ายเงินกู้ติดต่อกัน 3 เดือนจะถือว่า “ไม่ดี” มีลูกค้าจำนวนหนึ่งเสมอที่ไม่สามารถจำแนกได้ว่า "ดี" หรือ "ไม่ดี" เนื่องจาก
ได้รับเงินกู้ไม่นานพอ (เวลาผ่านไปน้อยเกินไป) หรือประวัติเครดิต “ไม่ชัดเจน” (เช่น มีความล่าช้า 3 เดือนแต่ไม่ติดต่อกัน) ตามกฎแล้ว ไคลเอนต์ "ระดับกลาง" ดังกล่าวจะถูกแยกออกจากตัวอย่าง
ข้อกำหนดเชิงประจักษ์สำหรับฐานข้อมูลที่ใช้ในการสร้างแบบจำลองการให้คะแนน:
ขนาดตัวอย่าง - รวมอย่างน้อย 1,500 ชิ้น อย่างน้อย 500 ชิ้นไม่ดี
คำจำกัดความที่ชัดเจนของเกณฑ์ "ไม่ดี"/"ดี" ไม่ชัดเจนเสมอไปว่าประวัติเครดิตในขั้นตอนใดบนพื้นฐานใดและในระดับใดที่จะแยก "ไม่ดี" และ "ดี"
คำจำกัดความที่ชัดเจนของช่วงเวลา - ระยะเวลาอายุการใช้งานของผลิตภัณฑ์ (ขึ้นอยู่กับตัวผลิตภัณฑ์เองและอาจแตกต่างกันไปตั้งแต่หนึ่งเดือน - โทรศัพท์มือถือไปจนถึงหลายทศวรรษ - การจำนอง)
ความมั่นคงขององค์ประกอบกลุ่มลูกค้า - ข้อมูลประชากร การย้ายถิ่น การรักษาพฤติกรรมการบริโภค
ข้อกำหนดโดยนัยแต่บังคับ: เสถียรภาพทางเศรษฐกิจ การเมือง สังคม และเงื่อนไขอื่นๆ
เมื่อสร้างแบบจำลองเครดิต สิ่งสำคัญคือต้องเลือกระยะเวลา - ระยะเวลาระหว่างการส่งใบสมัคร (การออกเงินกู้) และการจัดประเภท "ไม่ดี"/"ดี" การวิเคราะห์แสดงให้เห็นว่าอัตราการผิดนัดตามระยะเวลาที่ลูกค้าอยู่กับองค์กรเริ่มเพิ่มขึ้นและหลังจาก 12 เดือน (บัตรเครดิต) หรือมากกว่านั้น (สินเชื่อครั้งเดียว) เริ่มมีเสถียรภาพ ดังนั้น ระยะเวลาที่สั้นกว่าจะนำไปสู่การประเมินต่ำไป และไม่ได้คำนึงถึงคุณลักษณะทั้งหมดที่คาดการณ์การผิดนัดชำระหนี้ได้ครบถ้วน ในทางกลับกัน ระยะเวลาที่มากกว่าสองปีทำให้โมเดลมีความอ่อนไหวต่อการเปลี่ยนแปลงในองค์ประกอบของกลุ่มลูกค้าในช่วงเวลานี้ เนื่องจาก องค์ประกอบของลูกค้าในกลุ่มตัวอย่างที่จุดเริ่มต้นของกรอบเวลาอาจแตกต่างอย่างมีนัยสำคัญจากองค์ประกอบของลูกค้าที่เข้ามาในปัจจุบันอย่างไร ส่งผลให้มีการใช้ชิ้นส่วนสองชิ้นพร้อมกัน (ที่จุดเริ่มต้นและจุดสิ้นสุดของขอบฟ้าเวลา) เพื่อสร้างแบบจำลองที่มีความเสถียรเมื่อเวลาผ่านไป (เกินขอบฟ้าเวลาเริ่มต้น) นี่เป็นตัวกำหนดการเลือกความยาวของช่วงเวลา - ขอบฟ้าเวลาระหว่างการสร้างแบบจำลอง
ปัญหาที่สำคัญและเป็นที่ถกเถียงกันอีกประการหนึ่งยังคงเป็นอัตราส่วนของ "ดี" และ "ไม่ดี" ในกลุ่มตัวอย่าง ควรสะท้อนอัตราส่วนที่แท้จริงของประชากรหรือควรมีจำนวนเท่ากัน (อัตราส่วนดังกล่าวช่วยอำนวยความสะดวกในการสร้างแบบจำลองอย่างมากจากมุมมองทางคณิตศาสตร์)
ต่อไป การสร้างแบบจำลองการให้คะแนนจะกลายเป็นปัญหาการจำแนกประเภท โดยลักษณะการป้อนข้อมูล (หรือพารามิเตอร์) เป็นการตอบคำถามในแบบฟอร์มการสมัครและพารามิเตอร์ (หรือข้อมูล) ที่ได้รับจากการตรวจสอบจากองค์กรต่างๆ (เช่น ตำรวจ , ศาล, สภาท้องถิ่น, สำนักงานเครดิตและอื่น ๆ ) และลักษณะผลลัพธ์ (คำตอบ) - ผลลัพธ์ที่ต้องการ - คือการแบ่งลูกค้าออกเป็น "ดี" และ "ไม่ดี" ตามประวัติเครดิตที่มีอยู่ เมื่อเปรียบเทียบตามข้อมูลเหล่านี้ ลักษณะเฉพาะ.
ตารางคะแนนจริง (ดัชนีชี้วัด) คือระบบการกำหนดคะแนนตัวเลข (คะแนน) ให้กับคุณลักษณะ (หรือพารามิเตอร์) ของผู้ยืมเพื่อให้ได้ค่าตัวเลขที่ต้องการซึ่งสะท้อนถึงโอกาสของผู้ยืมที่เกี่ยวข้องกับผู้ยืมรายอื่นที่จะประสบกับบางอย่าง เหตุการณ์หรือดำเนินการบางอย่าง (แง่มุม "สัมพันธ์กัน" ในคำจำกัดความมีความสำคัญมาก)
ตัวอย่างเช่น ตารางอันดับเครดิตไม่ได้ระบุระดับความเสี่ยงที่ควรคาดหวัง (เช่น เปอร์เซ็นต์ของสินเชื่อประเภทที่กำหนดที่ไม่น่าจะได้รับการชำระคืน) แต่จะแสดงให้เห็นว่าเงินกู้ที่ให้มามีแนวโน้มที่จะประพฤติตัวอย่างไรเมื่อเทียบกับสินเชื่ออื่นๆ ตัวอย่างเช่น คือค่าเริ่มต้นหรืออัตราเริ่มต้นสำหรับสินเชื่อที่มีชุดคุณลักษณะที่กำหนดซึ่งคาดว่าจะสูงหรือต่ำกว่าสำหรับสินเชื่อที่มีชุดอื่น
ตารางลีกส่วนใหญ่สร้างขึ้นโดยการคำนวณแบบจำลองการถดถอย ซึ่งเป็นแบบจำลองทางสถิติที่ทดสอบว่าพารามิเตอร์ตัวเดียว (ลักษณะเฉพาะ) ส่งผลต่อพารามิเตอร์อื่นหรือ (บ่อยที่สุด) ต่อพารามิเตอร์อื่นทั้งชุดอย่างไร
แบบจำลองการถดถอยส่งผลให้เกิดชุดของสัมประสิทธิ์ เรียกว่าปัจจัยการถดถอย ซึ่งสามารถตีความได้ว่าเป็นความสัมพันธ์ระหว่างพารามิเตอร์ที่สนใจ (ที่จะกำหนด) และพารามิเตอร์อธิบาย โดยคงอิทธิพลอื่นๆ ทั้งหมดที่มีต่อพารามิเตอร์ที่สนใจให้คงที่ ค่าสัมประสิทธิ์เหล่านี้จะถูกแปลงเป็นน้ำหนักคะแนนในตารางลีก
วิธีที่ใช้กันมากที่สุดในการสร้างตารางลีก
ส่วนใหญ่แล้ว วิธีการทางสถิติของการถดถอยโลจิสติกจะใช้ในการสร้างตารางการให้คะแนน อย่างไรก็ตาม เพื่ออธิบายแนวทางนี้ ควรเริ่มต้นด้วยการถดถอยเชิงเส้นอย่างง่าย จากนั้นจึงไปยังการถดถอยโลจิสติก - เป็นกรณีพิเศษของการถดถอยเชิงเส้น
ในรูปแบบที่ง่ายที่สุด การถดถอยเชิงเส้นพยายามค้นหาความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว: X และ K ตัวแปร Y ที่พยายามทำนายถูกกำหนดให้เป็นตัวแปรตาม (เนื่องจากขึ้นอยู่กับ X) ตัวแปร X นั้นอธิบายได้เพราะมัน "อธิบาย" ว่าทำไม Y จึงแตกต่างกันไปในแต่ละคน
เมื่อใช้การถดถอยเชิงเส้น พวกเขาพยายามค้นหาสิ่งต่อไปนี้: ถ้า X เปลี่ยนแปลงเท่าใด

มีแนวโน้มว่า K จะเปลี่ยนไปด้วย ด้วยเหตุนี้ คุณต้องมีชุดข้อมูลที่คุณสามารถสังเกตชุดของ X และ K ที่สอดคล้องกันได้ เมื่อพวกมันถูกพล็อตบนระนาบ XY และ ได้รับชุดหนึ่งอาจกลายเป็นว่ามันอยู่ในเส้นตรงบางเส้นเช่น มีความสัมพันธ์บางอย่างระหว่าง X และ Y ซึ่งคุณสามารถลองประมาณได้โดยใช้สมการ:
วาย = B_0 + B_1 x X_1
ที่ไหน
B0 คือค่าของ Y เมื่อ X = 0;
B1 - ความชันของเส้นตรง
V เหล่านี้เป็นค่าสัมประสิทธิ์การถดถอย ในทางปฏิบัติอาจมีตัวแปรอธิบายหลายประการ:
Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n
การถดถอยโลจิสติกกับการถดถอยเชิงเส้น
ตามกฎแล้วเมื่อใช้การให้คะแนน ตัวแปรตามจะใช้ค่าในช่วงที่เล็กมาก ส่วนใหญ่มักจะทำงานกับตัวแปรไบนารี่เช่น อันที่รับค่าจำนวนเต็มเพียงสองค่า เช่น เงินกู้ผิดนัดหรือไม่ ลูกค้าที่ได้รับแค็ตตาล็อกทางไปรษณีย์ตอบกลับหรือไม่ก็ตาม โดยทั่วไป ในกรณีนี้ การผิดนัดชำระหนี้จะได้รับการกำหนดค่าเป็น "1" และการชำระคืนเงินกู้จะได้รับการกำหนดค่าเป็น "0"
ในที่สุดแบบจำลองควรประเมินความน่าจะเป็นของการผิดนัดชำระหนี้ (หรือการตอบกลับของลูกค้าต่อแค็ตตาล็อก)
และแม้ว่าบางครั้งแบบจำลองเชิงเส้นจะใช้ในการคำนวณตารางลีก แต่การถดถอยแบบโลจิสติกกลับกลายเป็นว่าสะดวกกว่ามาก เนื่องจากมันถูกสร้างขึ้นเป็นพิเศษสำหรับกรณีที่ตัวแปรตามเป็นไบนารี่ (นั่นคือ ต้องใช้เวลา ดังที่เราได้กล่าวไปแล้ว) เพียงสองค่าเท่านั้น)
การถดถอยเชิงเส้นสามารถให้ค่าความน่าจะเป็นทั้งน้อยกว่าศูนย์และมากกว่าหนึ่งซึ่งไม่มีความหมาย โมเดลโลจิสติกหลีกเลี่ยงสิ่งนี้เนื่องจากไม่ได้เกี่ยวข้องกับค่าไบนารี่ของตัวแปรตาม แต่เกี่ยวข้องกับความน่าจะเป็นหรืออัตราต่อรอง (อัตราต่อรอง) ที่ค่านั้นเกิดขึ้นจริง ลอการิทึมของอัตราส่วนของความน่าจะเป็นของการดำเนินการต่อความน่าจะเป็นของการไม่รับรู้เรียกว่า logit ซึ่งสามารถรับค่าใดก็ได้ทั้งค่าลบและค่าบวก ดังนั้น สำหรับ logits จึงค่อนข้างเป็นไปได้ที่จะใช้แบบจำลองการถดถอยเชิงเส้น (เพราะฉะนั้นชื่อ "logistic")
ในแบบจำลองการถดถอยโลจิสติก ตัวแปรอธิบายที่คูณด้วยสัมประสิทธิ์ของตัวแปรจะถือว่าเป็นเชิงเส้นที่ไม่สัมพันธ์กับ Y เช่นเดียวกับในการถดถอยเชิงเส้น แต่สัมพันธ์กับลอจิท - ลอการิทึมธรรมชาติของอัตราส่วนอัตราต่อรอง:
ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n โดยที่
p คือความน่าจะเป็นที่ V จะเกิดขึ้น
p/(1 - p) - อัตราส่วนราคาต่อรอง
อัตราต่อรองและอัตราต่อรอง
อัตราต่อรองทำให้คุณสามารถเปรียบเทียบระดับความเสี่ยงของสินเชื่อต่างๆ ดังนั้น หาก p1/(1 - p_1) หนึ่งตัว = 0.11 และสำหรับ p2/(1 - p2) อีกตัวหนึ่ง = 0.052 อัตราส่วนของมันจะเท่ากับ 0.46 กล่าวคือ ความเสี่ยงในการผิดนัดชำระหนี้เงินกู้หนึ่งจะน้อยกว่าครึ่งหนึ่งของความเสี่ยงในการผิดนัดชำระหนี้เงินกู้ครั้งที่สองเล็กน้อย
ข้อสรุปที่สำคัญที่สุดจากเรื่องนี้มีดังต่อไปนี้: จำเป็นต้องได้รับอัตราต่อรองและอัตราส่วนสำหรับสินเชื่อที่แตกต่างกันจากการถดถอยโลจิสติก เพราะ นี่เป็นวิธีเดียวที่จะเปรียบเทียบและพิจารณาโดยตรงทั้งอิทธิพลของลักษณะเฉพาะส่วนบุคคลต่อระดับความเสี่ยงและความเสี่ยงสัมพัทธ์ของสินเชื่อหนึ่งที่เกี่ยวข้องกับอีกสินเชื่อหนึ่ง ความพยายามที่จะดำเนินการกับตารางอันดับเครดิตหนึ่งไม่อนุญาตให้ประเมินความเสี่ยงของสินเชื่อหนึ่งเมื่อเทียบกับอีกตารางหนึ่งเนื่องจากอิทธิพลที่เป็นไปได้ของลักษณะที่นำมาพิจารณาสำหรับรายการหนึ่งและไม่ได้คำนึงถึงอีกรายการหนึ่ง
การคำนวณน้ำหนักสัมพัทธ์ของคุณลักษณะเฉพาะของตารางคะแนน
เมื่อสร้างและประมาณแบบจำลองลอจิสติกส์แล้ว คุณสามารถแทนที่ค่า X สำหรับผู้สมัครหรือสินเชื่อและคำนวณคะแนนโดยใช้สมการ:

อย่างไรก็ตาม การนับนี้แสดงเป็นสเกลลอการิทึมธรรมชาติ ซึ่งยากต่อการตีความ ดังนั้น คะแนนจะถูกแปลงเป็นสเกลเชิงเส้น โดยจะมีการเลือกคะแนนจำนวนหนึ่ง เพื่อให้ตัวเลขนี้ให้โอกาสเป็นสองเท่าของเหตุการณ์หนึ่งที่เกิดขึ้น เมื่อต้องการทำเช่นนี้ ให้คูณคะแนนด้วยปัจจัยเท่ากับจำนวนคะแนนที่ควรแสดงถึงอัตราต่อรองที่เพิ่มขึ้นเป็นสองเท่า แล้วหารด้วย 1n(2):
การนับตามสเกลเชิงเส้น = (B 1 x X 1 + ... + Bp x Xp) x (20/1p(2))
หากจำนวนคะแนนที่ต้องการเพื่อเพิ่มโอกาสเป็นสองเท่าคือ 20
มิฉะนั้น หากคุณต้องการทราบว่าแต่ละคุณลักษณะให้คะแนนเท่าไร คุณสามารถคูณ B_1 แต่ละตัวด้วย (20/(1n(2)) แล้วคูณด้วยค่าของพารามิเตอร์ X_1
การใช้สถิติ KS เพื่อประเมินตารางคะแนนผลลัพธ์
ตารางการให้คะแนนถูกสร้างขึ้นเพื่อจัดอันดับสินเชื่อที่แตกต่างกันในแง่ของอัตราต่อรองที่สัมพันธ์กับเหตุการณ์เฉพาะ จำเป็นที่ตารางการให้คะแนนดังกล่าวจะกำหนดบัญชีที่แตกต่างกันให้กับสินเชื่อที่ประสบกับเหตุการณ์และสินเชื่อที่ไม่ประสบ
ตัวอย่างเช่น แผนภูมิคะแนนเครดิตจะกำหนดคะแนนที่ต่ำกว่าให้กับสินเชื่อเหล่านั้นซึ่งต่อมามีปัญหาร้ายแรงในการชำระคืนหรือผิดนัดชำระ ดังนั้นโดยรวมแล้ว กลุ่มสินเชื่อที่ไม่ดีควรมีคะแนนต่ำกว่ากลุ่มสินเชื่อที่ดี
เพื่อกำหนดคุณภาพของตารางผลลัพธ์ กราฟจะถูกวาด - เส้นโค้งการกระจายของเปอร์เซ็นต์ของสินเชื่อที่ดีและเปอร์เซ็นต์ของสินเชื่อที่ไม่ดี (จากจำนวนรวมของดีและไม่ดีที่สอดคล้องกัน) ขึ้นอยู่กับขนาดของบัญชีและคุณภาพของการให้คะแนน ตาราง (แผนที่) มีลักษณะเฉพาะว่าเส้นโค้งทั้งสองนี้แยกจากกันมากน้อยเพียงใด
ใช้สำหรับการกำหนดเชิงตัวเลขของคุณภาพของการแยกที่ใช้สถิติ Kolmogorov-Smirnov (สถิติ K-S) ซึ่งให้การวัดเชิงตัวเลขของการแยกนี้ สถิติ KS คำนวณง่ายๆ: คือความแตกต่างสูงสุดระหว่างเปอร์เซ็นต์สะสมของการกระจายของ "ดี" และเปอร์เซ็นต์สะสมของการกระจายของ "ไม่ดี" ตามทฤษฎี สถิติ KS สามารถอยู่ในช่วงตั้งแต่ 0 ถึง 100 แต่ในทางปฏิบัติมักจะอยู่ในช่วง 25 ถึง 75
การไล่สีโดยประมาณมีลักษณะดังนี้:
น้อยกว่า 20 - ตารางการให้คะแนนอาจไม่เหมาะสมกับการใช้งาน
20-40 เป็นโต๊ะที่ดี
41-50 เป็นตารางที่ดี
51-60 เป็นตารางที่ดีมาก />61-75 เป็นโต๊ะที่ดีอย่างน่าอัศจรรย์
มากกว่า 75 อาจดีเกินจริง มีบางอย่างผิดปกติ* (128)
ควรสังเกตว่าคุณภาพของแบบจำลองการให้คะแนนควรได้รับการตรวจสอบอย่างต่อเนื่อง และการตรวจสอบเป็นขั้นตอนบังคับระหว่างการดำเนินการ เมื่อเวลาผ่านไป ทั้งภาวะเศรษฐกิจและลักษณะพฤติกรรมของผู้กู้ยืมอาจเปลี่ยนแปลงได้ และการปรับเปลี่ยนแบบจำลองการให้คะแนนอย่างทันท่วงทีเท่านั้นที่จะรับประกันการบริหารความเสี่ยงด้านเครดิตที่มีประสิทธิภาพ

คำว่า "การให้คะแนน" แปลตามตัวอักษรจากภาษาอังกฤษแปลว่า "การนับคะแนน" นี่คือชื่อของระบบและวิธีการประเมินความเสี่ยงในการให้กู้ยืมแก่บุคคลใดบุคคลหนึ่งและจัดการความเสี่ยงตามการพยากรณ์ทางคณิตศาสตร์ การให้คะแนนจากธนาคารทำให้คุณสามารถกำหนดความเป็นไปได้ของการชำระเงินล่าช้าโดยพิจารณาจากข้อมูลจากประวัติเครดิตของคุณและข้อมูลอื่นๆ เกณฑ์หลักคือคะแนนซึ่งก่อนหน้านี้มอบให้โดยพนักงานของสถาบันการเงินด้วยตนเอง แต่ปัจจุบันมีการคำนวณมากขึ้นโดยโปรแกรมพิเศษ

การให้คะแนนทำงานได้อย่างมีประสิทธิภาพในด้านการกู้ยืมด่วนและการเงินรายย่อย โดยผู้เชี่ยวชาญมีเวลาไม่เกินหนึ่งชั่วโมงในการตรวจสอบใบสมัคร ข้อมูลของผู้กู้ที่มีศักยภาพจะถูกป้อนเข้าสู่โปรแกรมพิเศษ ระบบเปรียบเทียบข้อมูลกับสถิติ ตัวอย่างเช่น หากฐานข้อมูลมีข้อมูลจำนวนมากที่คนในวัยเดียวกันและ/หรือวิชาชีพไม่สามารถชำระคืนเงินกู้ได้ การตัดสินใจอาจเป็นเชิงลบ - ธนาคารอาจปฏิเสธโดยไม่มีคำอธิบาย



การประเมินความน่าเชื่อถือทางเครดิตของผู้กู้ยืมรายบุคคลโดยอัตโนมัติ จะขึ้นอยู่กับการวิเคราะห์ข้อมูลต่างๆ ซึ่งรวมถึง:

  • ข้อมูลประจำตัว- ข้อมูลหนังสือเดินทางและรูปถ่ายของผู้สมัครได้รับการประมวลผล ในขั้นตอนนี้ มีการระบุผู้ฉ้อโกงและผู้ที่มีประวัติเครดิตไม่ดี
  • สถานะทางสังคม- โดยคำนึงถึงเพศ อายุ การศึกษา และสถานที่ทำงานของผู้สมัครด้วย คำนึงถึงที่อยู่ของการลงทะเบียนและถิ่นที่อยู่ การปรากฏตัวของครอบครัวและผู้อยู่ในความอุปการะ
  • สถานการณ์ทางการเงิน- ตามหลักการแล้ว คุณไม่เพียงต้องมีรายได้เพียงพอ แต่ยังต้องมีรายได้สม่ำเสมอด้วย ธนาคารบางแห่งยังคำนึงถึงค่าใช้จ่ายที่เป็นไปได้ด้วย เช่น ค่าสาธารณูปโภค โรงเรียนอนุบาล ฯลฯ ผู้สมัครจำนวนมากใช้กลอุบาย ไม่ประกาศผู้อยู่ในอุปการะหรือเพิ่มจำนวนรายได้ สำหรับสินเชื่อรายย่อยอาจใช้ได้ผล แต่สำหรับสินเชื่อรายใหญ่ ธนาคารมักจะตรวจสอบข้อมูลอย่างระมัดระวังมากขึ้น
  • ประวัติเครดิต- ในการประเมินความน่าเชื่อถือทางเครดิตของแต่ละบุคคล ข้อมูลสินเชื่อก่อนหน้านี้มีความสำคัญอย่างยิ่ง เงินให้กู้ยืมคงค้าง การมีอยู่ของเงินกู้ยืมที่ค้างชำระ และเวลาในระหว่างที่ชำระหนี้จะถูกกำหนด หากสินเชื่อได้รับการบริการอย่างถูกต้อง ระบบจะระบุถึงความเป็นไปได้สูงที่จะมีพฤติกรรมเดียวกันของลูกค้าในอนาคต โดยจะเพิ่มคะแนนการให้คะแนน หลักการเดียวกันนี้ทำงานในทิศทางตรงกันข้าม
  • พฤติกรรมการทำธุรกรรม- ตัวเลือกการประเมินมีให้สำหรับผู้สมัครที่เป็นลูกค้าของสถาบันการเงิน ผู้ถือบัตรพลาสติก บัญชีเงินฝาก และผู้เข้าร่วมโครงการเงินเดือน มักได้รับคะแนนสูง ระบบจะประเมินจำนวนเงินที่ทำการซื้อและประเภทของจุดขาย

ข้อมูลทั้งหมดได้รับการตรวจสอบเป็นรายบุคคลและเปรียบเทียบกันเพื่อหาข้อขัดแย้งใดๆ จะต้องมีความเชื่อมโยงระหว่างรายได้และค่าใช้จ่าย ตำแหน่ง และสถานที่อยู่อาศัย เป็นต้น

ความเป็นกลาง- ระบบการให้คะแนนเครดิตดำเนินการด้วยข้อเท็จจริงและตัวเลขโดยไม่คำนึงถึงลักษณะส่วนบุคคลของบุคคล พนักงานสำนักงานที่ยอมรับใบสมัครไม่สามารถมีอิทธิพลต่ออัลกอริธึมการคำนวณได้ในทางใดทางหนึ่ง ผู้เชี่ยวชาญด้านสินเชื่อไม่มีสิทธิ์ปฏิเสธที่จะออกเงินกู้โดยไม่มีเหตุผลหากโปรแกรมประเมินผู้กู้ว่าเป็นตัวทำละลาย

ประสิทธิภาพ- การให้คะแนนด้วยตนเองจะดำเนินการในรูปแบบของตาราง ผู้เชี่ยวชาญป้อนข้อมูลในบรรทัดแยกกันอย่างอิสระและให้คะแนนโดยเน้นเฉพาะประสบการณ์และความรู้ของตนเองเท่านั้น กระบวนการนี้ใช้แรงงานเข้มข้นและใช้เวลานาน โดยผู้สมัครต้องรอหนึ่งชั่วโมงหรือมากกว่านั้น โปรแกรมสมัยใหม่คำนวณคะแนนได้เร็วกว่าหลายร้อยเท่า

ผลประโยชน์ทางการเงิน- ธนาคารที่ใช้ระบบการให้คะแนนเครดิตมักเสนอเงื่อนไขการกู้ยืมที่ดีกว่า การคำนวณความเสี่ยงและการคัดกรองอัตโนมัติของผู้ผิดนัดชำระหนี้จะช่วยลดส่วนแบ่งการไม่ชำระหนี้ได้อย่างมาก ซึ่งโดยปกติจะรวมอยู่ในอัตราดอกเบี้ย สิ่งนี้เป็นประโยชน์ต่อทั้งผู้ยืมและผู้ให้กู้

ก่อนอื่นคุณต้องสร้างประวัติเครดิตที่ดีโดยไม่มีการค้างชำระ หากการชำระเงินตรงเวลาเป็นไปไม่ได้ด้วยเหตุผลวัตถุประสงค์ จำเป็นต้องแจ้งให้ธนาคารทราบโดยเร็วที่สุดและพิสูจน์การล้มละลายชั่วคราว ผู้ให้กู้ส่วนใหญ่อำนวยความสะดวกแก่ลูกค้าได้ครึ่งทางโดยการเลื่อนการชำระเงิน คำนวณใหม่ หรือเสนอวิธีแก้ปัญหาอื่น ๆ ในกรณีนี้ ประวัติจะไม่เสียหายจากการปฏิเสธการชำระเงิน หากมีเส้นลบในประวัติศาสตร์อยู่แล้ว ก็สามารถชดเชยได้ด้วยเงินกู้ที่ชำระคืนทันเวลา

อีกวิธีในการเพิ่มคะแนนเครดิตของคุณคือการมีเงินฝาก การเปิดเงินฝากในธนาคารทำให้ชัดเจนว่าลูกค้ามีเงินที่จะจ่าย เช่นเดียวกับผู้ถือบัตรเงินเดือนที่มักจะมีคะแนนสูง

เพื่อปรับปรุงคะแนนของคุณ คุณต้องกรอกใบสมัครอย่างระมัดระวัง ขอแนะนำให้ระบุข้อมูลติดต่อที่ถูกต้องและแจ้งให้ทุกคนที่คุณกรอกหมายเลขโทรศัพท์ทราบในแบบฟอร์ม หากพนักงานธนาคารเริ่มโทรหาเขาจะต้องเข้าถึงสมาชิกทั้งหมด มิฉะนั้นข้อมูลอาจถูกพิจารณาว่าไม่น่าเชื่อถือและการกู้ยืมอาจถูกปฏิเสธด้วยเหตุนี้

หากคุณถูกปฏิเสธการกู้ยืมเนื่องจากโปรแกรมการให้คะแนนถือว่าคุณไม่น่าเชื่อถือ อย่าสิ้นหวัง บางทีการตั้งค่าอัลกอริทึมอาจไม่เอื้ออำนวยสำหรับคุณในธนาคารนี้เท่านั้น หากต้องการตรวจสอบสิ่งนี้ ให้ลองให้คะแนนบนเว็บไซต์ของเรา

เมื่อออกสินเชื่อ ธนาคารมุ่งมั่นที่จะได้รับผลกำไรสูงสุดและรับประกันการคืนเงินที่โอนไปยังผู้กู้ เพื่อลดความเสี่ยงของความล่าช้า สถาบันการเงินจะวิเคราะห์ผู้สมัครทั้งหมดอย่างรอบคอบ และอนุมัติเฉพาะใบสมัครที่มีแนวโน้มว่าจะปฏิบัติตามภาระผูกพันเท่านั้น

การประเมินความน่าเชื่อถือทางเครดิตของผู้กู้ - บุคคล - มักจะดำเนินการโดยใช้ (จากการให้คะแนนภาษาอังกฤษ - "การนับคะแนน") โมเดลการให้คะแนนจะวิเคราะห์ปัจจัยที่มีอิทธิพลต่อความเสี่ยงของการไม่ชำระคืนเงินกู้ และให้คำแนะนำเกี่ยวกับการอนุมัติหรือการปฏิเสธการสมัคร เมื่อสมัครขอสินเชื่อผู้กู้จะต้องกรอกแบบฟอร์มก่อน การประเมินจะได้รับบนพื้นฐานของข้อมูลนี้ สำหรับแต่ละพารามิเตอร์ ลูกค้าจะได้รับคะแนนตามจำนวนที่กำหนด และมีค่าสัมประสิทธิ์การเพิ่มขึ้นและลดลง ผลลัพธ์สุดท้ายเคยคำนวณด้วยตนเองโดยพนักงานธนาคาร ในปัจจุบันนี้จะดำเนินการโดยอัตโนมัติในโปรแกรมพิเศษ

การให้คะแนนใช้ที่ไหน?

โมเดลการให้คะแนนมีการใช้กันอย่างแพร่หลายในด้านการเงินรายย่อยและการกู้ยืมแบบด่วน ซึ่งการตรวจสอบข้อมูลของผู้มีโอกาสกู้ยืมและการตัดสินใจใช้เวลาน้อยกว่า 1 ชั่วโมง เพื่อตรวจสอบความน่าเชื่อถือทางเครดิตของคุณ ข้อมูลจากใบสมัครที่กรอกเรียบร้อยแล้วจะถูกป้อนเข้าสู่โปรแกรมพิเศษ ระบบจะเปรียบเทียบข้อมูลที่ระบุโดยผู้มีโอกาสยืมกับสถิติโดยอัตโนมัติ ดังนั้นหากฐานข้อมูลมีข้อมูลที่คนในวัยหรืออาชีพใกล้เคียงกันมักไม่ชำระคืนเงินกู้ การตัดสินใจเกี่ยวกับการสมัครอาจเป็นผลลบ ในกรณีเช่นนี้ ธนาคารหรือองค์กรการเงินรายย่อยมักจะปฏิเสธผู้มีโอกาสกู้ยืมโดยไม่มีคำอธิบาย

ข้อดีของระบบการให้คะแนนการประเมินเครดิต

การตัดสินใจที่รวดเร็วหากพนักงานธนาคารวิเคราะห์ความสามารถในการละลายของผู้กู้ยืม ก็จะใช้เวลานาน ผู้เชี่ยวชาญจำเป็นต้องตรวจสอบแต่ละพารามิเตอร์อย่างอิสระ ป้อนผลลัพธ์ทั้งหมดที่ได้รับด้วยตนเอง และสรุปผล ด้วยความช่วยเหลือของระบบการให้คะแนนเครดิตที่ทันสมัย ​​ข้อมูลจะได้รับการประมวลผลอย่างรวดเร็ว ซึ่งหมายความว่าการตัดสินใจจะเกิดขึ้นอย่างรวดเร็ว

ความเที่ยงธรรมแม้แต่ผู้เชี่ยวชาญที่มีประสบการณ์และมีคุณสมบัติก็สามารถสร้างข้อผิดพลาดในการคำนวณหรือสร้างความคิดเห็นที่มีอคติเนื่องจากทัศนคติส่วนตัวของเขาที่มีต่อลูกค้า คะแนนการให้คะแนนเป็นตัวบ่งชี้ความน่าเชื่อถือทางเครดิตที่มีวัตถุประสงค์มากกว่ามากเนื่องจากมีการคำนวณโดยอัตโนมัติ พนักงานธนาคารไม่สามารถมีอิทธิพลต่อการทำงานของอัลกอริทึมได้

ผลประโยชน์ทางการเงินการใช้แบบจำลองการให้คะแนนเพื่อประเมินความน่าเชื่อถือทางเครดิตสามารถลดอัตราการไม่ชำระคืนได้อย่างมาก สิ่งนี้ไม่เพียงเพิ่มผลกำไรของธนาคารเท่านั้น แต่ยังให้โอกาสในการเสนออัตราที่ดีกว่าให้กับลูกค้าอีกด้วย ระดับของการไม่ชำระคืนส่งผลโดยตรงต่ออัตราดอกเบี้ยของเงินกู้ยืม ดังนั้นผู้จ่ายเงินที่รอบคอบจึงสนใจที่จะลดอัตราดอกเบี้ยลงด้วย

อะไรเป็นตัวกำหนดผลการให้คะแนน?

คะแนนสุดท้ายเมื่อใช้แบบจำลองการให้คะแนนใดๆ ประกอบด้วยตัวบ่งชี้จำนวนหนึ่ง ก่อนอื่นจะมีการตรวจสอบข้อมูลหนังสือเดินทางของผู้ยืมข้อมูลเกี่ยวกับสถานที่อยู่อาศัยและข้อมูลการติดต่ออื่น ๆ นี่เป็นขั้นตอนเบื้องต้นที่ผู้สมัครที่มีเอกสารไม่ถูกต้องจะถูกตัดออก จากนั้นจึงวิเคราะห์ปัจจัยอื่นๆ

  • ข้อมูลส่วนบุคคลเกี่ยวกับลูกค้าการประเมินการให้คะแนนจะพิจารณาถึงสถานภาพการสมรสของผู้กู้ยืมและการมีอยู่ของบุตรที่ยังไม่บรรลุนิติภาวะ ระยะเวลาการทำงาน ณ สถานที่ทำงานสุดท้ายก็ถูกนำมาพิจารณาด้วย
  • ความสามารถในการละลายของผู้สมัครปัจจัยที่สำคัญที่สุดประการหนึ่งที่มีอิทธิพลต่อคะแนนการให้คะแนน เพื่อให้ได้รับการอนุมัติ สิ่งสำคัญคือต้องพิสูจน์ว่าคุณมีเงินทุนไม่เพียงพอที่จะชำระคืนเงินกู้ แต่ยังมีการชำระเงินเป็นประจำด้วย เพื่อประเมินสถานการณ์ทางการเงินและความน่าเชื่อถือทางเครดิต ในกรณีส่วนใหญ่ (โดยเฉพาะอย่างยิ่งเมื่อออกสินเชื่อขนาดใหญ่) จำเป็นต้องจัดเตรียมเอกสารจากสถานที่ทำงาน: ใบรับรอง 2-NDFL หรือแบบฟอร์มธนาคาร บางครั้งค่าใช้จ่ายของผู้สมัคร (ค่าบำรุงรักษาผู้อยู่ในอุปการะ ค่าสาธารณูปโภค ฯลฯ) ก็จะถูกนำมาพิจารณาด้วย
  • ประวัติเครดิต.ในการให้คะแนนความน่าเชื่อถือทางเครดิตของลูกค้า จำเป็นต้องตรวจสอบหนี้และยอดค้างชำระของสินเชื่อที่ได้รับก่อนหน้านี้ ธนาคารสามารถรับข้อมูลเกี่ยวกับผู้สมัครได้จากสำนักประวัติเครดิต (BKI) ซึ่งสะท้อนถึงข้อมูลที่จำเป็นทั้งหมดโดยได้รับความยินยอม ระบบยังคำนึงถึงการมีหรือไม่มีการชำระเงินปกติสำหรับสินเชื่อที่มีอยู่ BKI บันทึกประวัติการสมัครของผู้สมัคร: การมีอยู่ของการปฏิเสธจำนวนมากจากองค์กรทางการเงินอื่น ๆ สามารถลดการประเมินได้
  • พฤติกรรมการทำธุรกรรมหากผู้กู้ยืมเป็นลูกค้าบัญชีเงินเดือนหรือมีเงินฝากกับธนาคาร คะแนนการให้คะแนนในการพิจารณาความน่าเชื่อถือทางเครดิตอาจเพิ่มขึ้น สิ่งนี้จะคำนึงถึงจำนวนเงินออมในบัญชีและการเปลี่ยนแปลง

ระบบการให้คะแนนจะตรวจสอบข้อมูลทั้งหมดแยกกันและเปรียบเทียบกันเพื่อระบุข้อขัดแย้งที่อาจเกิดขึ้น การยืนยันความน่าเชื่อถือของข้อมูลที่ระบุคือการมีความเชื่อมโยงระหว่างรายได้และค่าใช้จ่ายของผู้กู้ที่มีศักยภาพสถานที่ทำงานและที่อยู่อาศัย ฯลฯ

การวิเคราะห์ข้อมูลการให้คะแนน

จากผลลัพธ์ที่ได้รับ ระบบจะตัดสินใจ:

  • ตกลง- คะแนนสูง แอปพลิเคชันสามารถโอนไปยังระดับถัดไปได้
  • การปฏิเสธ- ผู้สมัครได้คะแนนต่ำเกินไป การพิจารณาคำขอจึงหยุดลง
  • จำเป็นต้องมีการวิเคราะห์เพิ่มเติม- ระบบมีข้อมูลไม่เพียงพอที่จะให้คะแนนที่เพียงพอ ในกรณีนี้ ผู้เชี่ยวชาญธนาคารจะศึกษาแบบฟอร์มใบสมัครของผู้สมัครอย่างอิสระและชี้แจงข้อมูล เพื่อยืนยันประเด็นที่เป็นข้อขัดแย้ง ผู้สมัครอาจต้องจัดเตรียมเอกสารเพิ่มเติม หลังจากตรวจสอบใบสมัครด้วยตนเองแล้ว จะมีการตัดสินใจขั้นสุดท้าย

ทำอย่างไรจึงจะได้คะแนนสูง

กำจัดการค้างชำระสินเชื่อเพื่อเพิ่มโอกาสในการได้รับการประเมินและการอนุมัติใบสมัครที่ดี คุณจำเป็นต้องมีประวัติเครดิตที่สะอาด ซึ่งหมายความว่าผู้สมัครจะต้องไม่มีหนี้ค้างชำระอื่น ๆ หรือหนี้คงค้าง ดังนั้นแม้ว่าปัญหาทางการเงินจะเกิดขึ้น การตรวจสอบประวัติเครดิตของคุณเป็นสิ่งสำคัญ เป็นการดีกว่าที่จะจัดเตรียมเอกสารหลักฐานการล้มละลายชั่วคราวให้กับธนาคารในเวลาที่เหมาะสมและพัฒนาโครงการปรับโครงสร้างหนี้หรือการเลื่อนออกไป วิธีนี้จะทำให้คุณสามารถปิดเงินกู้ปัจจุบันและเพิ่มโอกาสในการอนุมัติสินเชื่อใหม่ได้

เปิดเงินฝากธนาคารธนาคารส่วนใหญ่เสนอคะแนนเพิ่มเติมหากคุณมีบัญชี ดังนั้นทางที่ดีควรทำการฝากเงินล่วงหน้า

กรุณาระบุข้อมูลจริงในใบสมัครของคุณเท่านั้นการประเมินยังได้รับอิทธิพลจากความถูกต้องในการกรอกแบบสอบถามด้วย ข้อมูลจะต้องมีวัตถุประสงค์และเป็นความจริง: ความสงสัยเกี่ยวกับความน่าเชื่อถือของข้อมูลอาจกลายเป็นเหตุผลในการปฏิเสธเงินกู้

ให้ความสนใจกับความเกี่ยวข้องของผู้ติดต่อในแบบสอบถามเพื่อปรับปรุงการให้คะแนนเครดิตของคุณ คุณต้องระบุเฉพาะข้อมูลติดต่อจริงในแบบฟอร์มใบสมัครเท่านั้น พนักงานธนาคารจะต้องสามารถเข้าถึงสมาชิกทั้งหมดที่มีหมายเลขโทรศัพท์ที่ผู้มีโอกาสยืมป้อนไว้ หากไม่สามารถติดต่อได้ ข้อมูลที่ให้ไว้อาจถือว่าไม่น่าเชื่อถือ นี่คือหนึ่งในเหตุผลที่จะปฏิเสธการให้กู้ยืม

หากคะแนนต่ำเกินไปและใบสมัครถูกปฏิเสธ อาจบ่งชี้ว่ารูปแบบและอัลกอริทึมของธนาคารใดธนาคารหนึ่งไม่เหมาะกับผู้กู้ยืม สถาบันการเงินมักจะใช้ระบบของตนเอง ซึ่งคำนึงถึงปัจจัยหลายประการ

จะทำอย่างไรถ้าคุณปฏิเสธ

หากคะแนนคะแนนต่ำ ระบบมักจะปฏิเสธการสมัคร และลูกค้าจะไม่ได้รับแจ้งถึงเหตุผลในการตัดสินใจครั้งนี้ พนักงานธนาคารมักแนะนำให้สมัครซ้ำอีกครั้งหลังจากผ่านไป 2-3 เดือน หรือคุณสามารถลองสมัครกับสถาบันการเงินอื่นได้ อย่างไรก็ตาม ควรทำด้วยความระมัดระวัง: การปฏิเสธทั้งหมดจะถูกบันทึกไว้ในประวัติเครดิต และหากมีมากเกินไป คะแนนจะลดลง หากต้องการทราบความพร้อมและจำนวนใบสมัครที่ถูกปฏิเสธก่อนติดต่อธนาคาร คุณสามารถส่งคำขอไปที่ BKI ได้

โมเดลการให้คะแนนไม่ได้ให้ผลลัพธ์ที่เป็นกลางและเกี่ยวข้องหากลูกค้าสมัครขอสินเชื่อเป็นครั้งแรก ในกรณีดังกล่าว ธนาคารบางแห่งใช้เฉพาะการประมวลผลใบสมัครด้วยตนเองโดยผู้เชี่ยวชาญเท่านั้น ยิ่งไปกว่านั้น ในความเป็นจริง ลูกค้าดังกล่าวมักจะได้รับเงื่อนไขที่ไม่เอื้ออำนวย อัตราดอกเบี้ยที่เพิ่มขึ้น และจำนวนเงินกู้ที่ลดลง วิธีนี้จะทำให้ธนาคารลดผลขาดทุนจากการไม่ชำระหนี้ที่อาจเกิดขึ้นได้ อย่างไรก็ตาม หากคุณชำระคืนเงินกู้ครั้งแรกตรงเวลาและไม่ล่าช้า ข้อมูลนี้จะปรากฏในประวัติเครดิตของคุณ ดังนั้นในครั้งต่อไปคุณสามารถนับคะแนนที่สูงขึ้นได้

หากต้องการใช้บริการของ NBCI เพื่อการพัฒนาและ/หรือการใช้วิธีการระบบการให้คะแนน โปรดกรอกแบบฟอร์มใบสมัครบนเว็บไซต์

ในอดีต การให้คะแนนเป็นแนวทางถูกนำมาใช้ครั้งแรกในการวิจัยทางชีววิทยาในช่วงครึ่งหลังของทศวรรษที่ 30 ศตวรรษที่ 20 สำหรับการคัดแยกวัตถุที่ไม่สามารถคัดแยกตามลักษณะใดลักษณะหนึ่งได้ แต่ในอีกแง่หนึ่งก็เป็นเรื่องยากมากหรือเป็นไปไม่ได้เลยด้วยซ้ำ ตัวอย่างเช่น นี่คือวิธีการจัดเรียงกะโหลก (โดยเป็นของเผ่าหนึ่งหรืออีกเผ่าหนึ่ง) หรือหัวม่านตา (โดยเป็นของพันธุ์หนึ่งหรืออีกเผ่าหนึ่ง)

คำว่า " การให้คะแนน" หมายถึงวิธีการทางคณิตศาสตร์ด้วยความช่วยเหลือซึ่งขึ้นอยู่กับชุดของคุณลักษณะที่ทราบ (หรือวัดได้) ของวัตถุ ทำนายคุณลักษณะที่ต้องการบางอย่างซึ่งในขณะที่ประเมินไม่สามารถวัดได้โดยตรงในขณะที่ค้นหาสาเหตุใด ๆ -และความสัมพันธ์ที่มีผลกระทบถูกจงใจหลีกเลี่ยง

การให้คะแนนเครดิต- นี่คือการใช้โซลูชันการให้คะแนนในกระบวนการกู้ยืมทั้งสำหรับบุคคลและนิติบุคคล (โดยเฉพาะธุรกิจขนาดเล็กและขนาดกลาง)

งานหลักที่แก้ไขได้เมื่อให้ยืมโดยใช้การให้คะแนนคือ การบริหารความเสี่ยง.

Spiegel ซึ่งเป็นผู้ค้าปลีกรายใหญ่ในอเมริกา เริ่มใช้การให้คะแนนเครดิตตั้งแต่เนิ่นๆ อีกบริษัทหนึ่งคือ Household Finance Corp. ในปี 1946 ประธานบริษัท E.F. Vanderlik พัฒนาคะแนน Credit Guide เพื่อประเมินผู้สมัครใหม่ แต่การดำเนินการเป็นเรื่องยาก (ผู้จัดการสาขาของเขายอมรับในภายหลังว่าพวกเขาออกเงินกู้ก่อน จากนั้นจึงปรับคะแนนเพื่อประกอบการตัดสินใจ)

ในปี 1956 มีเหตุการณ์หนึ่งเกิดขึ้นในตลาดการเงินของอเมริกา ซึ่งเปลี่ยนแปลงสถานการณ์ในด้านการให้คะแนนเครดิตอย่างรุนแรง ชาวอเมริกัน - วิศวกร Bill Fire และนักคณิตศาสตร์ Earl Isaac ซึ่งทำงานที่สถาบันวิจัยสแตนฟอร์ดได้คิดค้นสิ่งแรกขึ้นมา รูปแบบการให้คะแนนเครดิต- พันธมิตรได้พัฒนาอัลกอริธึมทางคณิตศาสตร์ที่คำนวณระดับความน่าเชื่อถือทางเครดิตของผู้ยืมในรูปแบบดิจิทัล กล่าวอีกนัยหนึ่ง อัลกอริทึมช่วยให้คุณสามารถคำนวณความเสี่ยงด้านเครดิตในรูปแบบของตัวเลขสามหลักซึ่งเป็นอันดับเครดิต พวกเขาก่อตั้ง Fair, Isaac and Company (เปลี่ยนชื่อเป็น Fair Isaac Corporation ในปี 2546 และ FICO ในปี 2552)

ในรัสเซีย การใช้การให้คะแนนจำนวนมากในการให้กู้ยืมรายย่อยได้กลายเป็นแนวทางปฏิบัติที่แพร่หลายเช่นกัน ธนาคารรัสเซียใช้ทั้งการให้คะแนน FICO ภายนอกและบัตรให้คะแนนของตนเองอย่างจริงจัง ซึ่งได้รับการพัฒนาเหนือสิ่งอื่นใดด้วยความช่วยเหลือจากที่ปรึกษาชาวอเมริกัน

ในช่วงทศวรรษที่เจ็ดสิบของศตวรรษที่ผ่านมา ในด้านหนึ่งการพัฒนาอย่างรวดเร็วของเทคโนโลยีคอมพิวเตอร์เริ่มต้นขึ้น และอีกด้านหนึ่งก็มีการกู้ยืมอย่างเฟื่องฟู จากนั้นธนาคารส่วนใหญ่ก็เริ่มใช้ระบบการให้คะแนน นอกจากนี้ บางส่วนยังได้พัฒนาระบบของตนเองโดยไม่ได้รับความช่วยเหลือจากบริษัทบุคคลที่สาม

เมื่อการแนะนำระบบการให้คะแนนอย่างค่อยเป็นค่อยไปเริ่มขึ้นในรัสเซียในช่วงกลางทศวรรษที่ 1990 ธนาคารในประเทศต้องเผชิญกับภาวะที่กลืนไม่เข้าคายไม่ออก: พัฒนาระบบเหล่านี้อย่างอิสระหรือซื้อจากผู้ผลิตชาวตะวันตก หลังจากผ่านไป 15 ปี ทางเลือกที่สามก็ปรากฏขึ้น: การให้คะแนนจากภายนอก

ตั้งแต่วันที่ 29 กรกฎาคม 2013 เมื่อออกสินเชื่อรายย่อย Sberbank ใช้การประเมินแบบบูรณาการของผู้ยืมซึ่งอิงตาม Scoring Bureau รุ่นที่ 3 (บริการโดย United Credit Bureau (UCB)) และระบบการให้คะแนนภายในของเครดิต สถาบันเอง

การทดสอบบริการแสดงให้เห็นว่าการใช้โมเดลการให้คะแนนทั้งสองแบบร่วมกันให้ผลเพิ่มเติม โดยเพิ่มคุณภาพของโมเดลบูรณาการของธนาคารมากกว่า 10%

ด้วยการปรากฏตัวในช่วงปลายยุค 60 อุตสาหกรรมบัตรเครดิต ธนาคาร และผู้ออกบัตรอื่นๆ ได้ตระหนักถึงประโยชน์ของ Credit Scoring ลูกค้าจำนวนมากที่สมัครบัตรเครดิตทุกวันทำให้เป็นไปไม่ได้ - ไม่ว่าจะในเชิงเศรษฐกิจหรือในแง่ของค่าแรง - ที่จะทำสิ่งอื่นนอกเหนือจากการตัดสินใจสินเชื่อโดยอัตโนมัติ เมื่อใช้การให้คะแนนเครดิต องค์กรเหล่านี้ค้นพบอย่างรวดเร็วว่าเทคนิคนี้เป็นการคาดการณ์ที่เชื่อถือได้มากกว่าการประมาณการของผู้เชี่ยวชาญอย่างมีนัยสำคัญ (อัตราเริ่มต้นลดลง 50% หรือมากกว่า)

ประเภทของการให้คะแนนเครดิต

ตามกฎแล้ว การใช้การให้คะแนนเครดิตมีอย่างน้อยสามด้าน:

  1. การให้คะแนนแอปพลิเคชัน
  2. การให้คะแนนพฤติกรรม
  3. คะแนนสะสม

การให้คะแนนแอปพลิเคชัน- นี่คือการกำหนดความน่าเชื่อถือทางเครดิต (ระดับความเสี่ยงเริ่มต้น) ของผู้สมัครเมื่อทำการตัดสินใจในการให้สินเชื่อโดยพิจารณาจากข้อมูลที่มีอยู่ ณ เวลาที่สมัคร - ข้อมูลจากใบสมัครเอง ข้อมูลของสถาบันสินเชื่อเอง ข้อมูลจาก สำนักงานข้อมูลเครดิต รวมถึงฐานข้อมูลอื่นๆ ที่มีอยู่ (เช่น หนังสือเดินทางที่สูญหาย)

ในกรณีนี้ ไม่เพียงแต่การตัดสินใจให้กู้ยืมเท่านั้น แต่ยังรวมถึงขนาดและเงื่อนไขของเงินกู้ด้วย

เมื่อมีการออกเงินกู้แล้ว จำเป็นต้องติดตามการใช้และการชำระคืน และหากเป็นสินเชื่อที่มีเงื่อนไขคงที่ เช่น แม้ว่าสิ่งสำคัญคือการพิจารณาความน่าเชื่อถือทางเครดิตของลูกค้า ณ เวลาที่ออกเงินกู้ แต่สำหรับวงเงินเครดิต รวมถึงบัตรเครดิตแบบหมุนเวียน สถานการณ์จะแตกต่างอย่างสิ้นเชิง ไม่มีใครรู้ว่าลูกค้าจะใช้เงินกู้อย่างไร - จะเลือกวงเงินเครดิตทั้งหมดทันทีหรือเพียงบางส่วน เขาจะชำระคืนอย่างไร - ทั้งหมดในครั้งเดียวหรือเฉพาะการชำระเงินขั้นต่ำที่กำหนด และความน่าเชื่อถือทางเครดิตของเขาจะเปลี่ยนแปลงในหกเดือนหรือ ในหนึ่งปี และนี่คือพื้นที่ การให้คะแนนพฤติกรรมโดยที่ชื่อนี้ซ่อนปัญหาที่ต้องแก้ไขไว้ทั้งหมด

ประการแรก นี่คือการประเมินความเสี่ยงของการชำระล่าช้าและ/หรือการไม่คืนสินค้า และกำหนดการดำเนินการที่จำเป็นต้องดำเนินการ - นี่คือจุดที่การให้คะแนนเชิงพฤติกรรมกลายมาเป็น คะแนนสะสม(คะแนนสะสม)

งานถัดไปที่แก้ไขได้ภายในกรอบการให้คะแนนตามพฤติกรรมคือการกำหนดความสามารถในการทำกำไร/ความสามารถในการทำกำไรของลูกค้าสำหรับสถาบันสินเชื่อ ในการดำเนินการนี้ ประวัติการทำธุรกรรมจะถูกตรวจสอบในช่วงเวลาหนึ่ง (เช่น หกเดือน) และตามเกณฑ์ที่กำหนด "มูลค่า" จะถูกกำหนด จากนั้นขึ้นอยู่กับประวัติลูกค้าและโปรไฟล์ลูกค้าที่ทราบอยู่แล้ว อนาคต “ความสามารถในการทำกำไร” ของลูกค้าในกลุ่มสินเชื่อในปัจจุบัน

ในชั้นเรียนเดียวกัน การกำหนดพารามิเตอร์ของลูกค้าที่สำคัญ เช่น ความน่าจะเป็นของการจากไป (การเลิกจ้าง) แนวโน้มที่จะใช้ผลิตภัณฑ์นี้หรือผลิตภัณฑ์อื่น ๆ (แนวโน้ม) รวมถึงการเพิ่มปริมาณการใช้งาน (การขายต่อยอด) หรือการซื้อ สินค้าอื่นๆ (cross-sell) .

มีสองประเด็นที่สำคัญมากที่ต้องทำ:

1) ข้อมูลธุรกรรมใช้เพื่อตรวจจับและป้องกันการฉ้อโกง (และเรียกอีกอย่างว่าการให้คะแนนตามพฤติกรรม)

2) สำหรับการให้คะแนนตามพฤติกรรม ข้อมูลไม่เพียงแต่ในบัญชีเฉพาะ (ผลิตภัณฑ์) เท่านั้น แต่ยังมีการใช้ข้อมูลที่ซับซ้อนทั้งหมดของลูกค้าเพิ่มมากขึ้น เช่น เขาใช้ผลิตภัณฑ์ทั้งหมดที่ใช้อย่างไร

แนวทางเชิงปฏิบัติเช่น การปฏิเสธที่จะค้นหาความสัมพันธ์ระหว่างเหตุและผลระหว่างพารามิเตอร์และการใช้การพึ่งพาที่ระบุระหว่างพารามิเตอร์เพื่อทำนายพฤติกรรมของลูกค้า (ความน่าจะเป็นของการผิดนัดชำระหนี้) ทำให้เกิดการปฏิเสธที่ค่อนข้างรุนแรงในหมู่หลาย ๆ คน และนำไปสู่ข้อจำกัดทางกฎหมายบางประการในพื้นที่นี้ในบางประเทศ

พื้นฐานของการพัฒนาตารางอันดับ การตรวจสอบ และการตั้งค่า

แม้ว่าแต่ละธนาคารจะมี "ระบบมูลค่า" ของตัวเอง แต่ก็ไม่มีธนาคารใดสามารถทำได้หากไม่มีคำถามในการให้คะแนนโดยทั่วไป

1. ข้อมูลส่วนบุคคล เพศ อายุ สถานภาพสมรส การมีอยู่หรือไม่มีผู้อยู่ในอุปการะ การศึกษา

พื้น . ระบบนี้เห็นอกเห็นใจผู้หญิงมากกว่า เนื่องจากตามสถิติแล้ว เพศที่อ่อนแอกว่ามีหน้าที่รับผิดชอบในการชำระภาระผูกพันมากกว่า

อายุ . ลูกค้าที่น่าดึงดูดที่สุดสำหรับธนาคารคืออายุระหว่าง 25 ถึง 45 ปี ยิ่งบุคคลนั้นมาจากช่วงอายุนี้มาก คะแนนก็จะยิ่งต่ำลง

สถานภาพการสมรส- ตามกฎแล้ว การมีครอบครัวแม้ว่าความสัมพันธ์จะไม่ได้ถูกกฎหมายอย่างเป็นทางการก็ตามก็ยังเป็นข้อดี ความสัมพันธ์ที่มั่นคงและการวางแผนงบประมาณจากมุมมองของธนาคาร จะทำให้ผู้มีโอกาสกู้ยืมมีวินัย

ผู้อยู่ในความอุปการะ. หากผู้มีสิทธิ์กู้ยืมมีลูกเพียงคนเดียว โดยปกติแล้วจะไม่ทำให้คะแนนลดลง แต่ยิ่งมีบุตรมาก คะแนนก็จะยิ่งต่ำลง

การศึกษา . บุคคลที่มีการศึกษาระดับมัธยมศึกษาจะถูกมองว่าไม่ประสบความสำเร็จและมั่นคงเพียงพอ และอาจละเลยภาระผูกพันในการกู้ยืมได้ ตรงกันข้ามกับบุคคลที่มีการศึกษาระดับสูง

2. ตัวชี้วัดทางการเงิน- ระยะเวลาการทำงานทั้งหมด ระยะเวลาการทำงานทั้งหมด ณ สถานที่ทำงานสองหรือสามแห่งสุดท้ายหรือสามแห่งสุดท้าย วิชาชีพ ระดับค่าจ้าง และค่าใช้จ่ายทั้งหมด

ยังไง เป็นคนที่มั่นคงมากขึ้นในแง่ของการจ้างงานยิ่งคะแนนของเขาสูงเท่าไร การเปลี่ยนแปลงงานบ่อยครั้งและระยะเวลาการทำงานสั้นในแต่ละงานบ่งบอกถึงความไม่มั่นคงของผู้มีโอกาสกู้ยืมและผลที่ตามมาก็คือรายได้ของเขา

ประเภทของอาชีพ สิ่งที่น่าสนใจที่สุดสำหรับธนาคารคือผู้เชี่ยวชาญ คนงาน ข้าราชการ และผู้จัดการระดับกลาง (การจ้างงานถาวร) นายธนาคารไม่ชอบผู้บริหารบริษัท ผู้อำนวยการฝ่ายการเงิน โนตารี (ทำธุรกิจส่วนตัว) รวมถึงเจ้าของธุรกิจและเจ้าของร่วม สิ่งสำคัญคือต้องเข้าใจว่าเจ้าของธุรกิจของเขาไม่มีรายได้คงที่ต่อเดือนต่างจากพนักงานรับจ้าง ผู้ประกอบการรายบุคคลอาจพูดได้เช่นเดียวกัน - เป็นการดีกว่าสำหรับผู้กู้ดังกล่าวในการส่งเอกสารในฐานะบุคคล

ไม่ต้องสงสัยเลยว่าธนาคารจะให้ความสนใจ อัตราส่วนค่าใช้จ่ายต่อรายได้- ในด้านหนึ่ง ระบบจะวิเคราะห์ว่าต้นทุนการชำระเงินกู้สามารถเปรียบเทียบได้กับความสามารถทางการเงินของลูกค้าอย่างไร และข้อตกลงเงินกู้เพิ่มเติมจะเป็นภาระสำหรับเขาหรือไม่ ในทางกลับกัน หากผู้กู้แจ้งรายได้สูงแต่ขอเพียงเล็กน้อยก็ทำให้เกิดความสงสัยเป็นอย่างน้อย ทำไมคนที่มีรายได้ 50,000 รูเบิล เงินกู้ 6 พัน?

ธนาคารให้ความใส่ใจเป็นอย่างมาก การปรากฏตัวของสินเชื่อที่ดำเนินการก่อนหน้านี้และคงค้าง- หากผู้กู้มีการชำระเงินรายเดือนตามสัญญาเงินกู้แล้ว ธนาคารจะคาดการณ์ความสามารถในการชำระหนี้ของบุคคลนั้นด้วยส่วนต่างที่สูงมาก (สำหรับตัวมันเอง)

3. ข้อมูลที่เกี่ยวข้อง.

แหล่งรายได้เพิ่มเติม (งานเพิ่มเติม, รายได้ของผู้ยืมร่วม), การมีรถยนต์, ที่จอดรถ, บ้านพักฤดูร้อนหรือที่ดินที่เป็นกรรมสิทธิ์ส่วนบุคคลจะเพิ่มคะแนนอย่างไม่ต้องสงสัย สถานการณ์ใกล้เคียงกันกับสินเชื่อที่ชำระคืนที่มีอยู่: การไม่มีการผิดนัดชำระในอดีตการชำระหนี้ตามกำหนดเวลาต่อสถาบันสินเชื่อและการไม่มีการผิดนัดชำระในปัจจุบันถือเป็นการรับรู้ในเชิงบวก ยิ่งผู้กู้ได้คะแนนมากเท่าไร ธนาคารก็ยิ่งชอบเขามากขึ้นเท่านั้น

ตอนนี้ การให้คะแนนเครดิตขึ้นอยู่กับวิธีการวิจัยทางสถิติหรือการวิจัยเชิงปฏิบัติการ วิธีการทางสถิติประกอบด้วยการวิเคราะห์แบบเลือกปฏิบัติ โดยอาศัยการถดถอยเชิงเส้นและการถดถอยแบบลอการิทึมที่มีประสิทธิภาพมากกว่า และแผนผังการจำแนกประเภท ซึ่งบางครั้งเรียกว่าอัลกอริธึมการแบ่งพาร์ติชันแบบเรียกซ้ำ วิธีการวิจัยการดำเนินงานประกอบด้วยรูปแบบการเขียนโปรแกรมเชิงเส้นบางรูปแบบ นักพัฒนาโมเดลการให้คะแนนส่วนใหญ่ใช้วิธีการข้างต้นอย่างน้อยหนึ่งวิธี ซึ่งมักจะใช้ร่วมกัน นอกจากนี้ ยังมีการใช้วิธีทางสถิติแบบไม่ใช้พารามิเตอร์และวิธีการสร้างแบบจำลองจำนวนหนึ่งโดยใช้ "ปัญญาประดิษฐ์" ในการพัฒนาแบบจำลองการให้คะแนน ดังนั้นในทศวรรษที่ผ่านมา จึงมีการทดสอบแนวทางของโครงข่ายประสาทเทียม ระบบผู้เชี่ยวชาญ อัลกอริธึมทางพันธุกรรม และวิธีการ "เพื่อนบ้านที่ใกล้ที่สุด" เป็นเรื่องที่น่าสนใจมากที่มีการใช้วิธีการที่หลากหลายดังกล่าวกับปัญหาการจำแนกประเภทเดียวกัน ส่วนหนึ่งเป็นผลมาจากแนวทางเชิงปฏิบัติอย่างแท้จริงในการแก้ไขปัญหาการลดความเสี่ยงเมื่อออกสินเชื่อ: ถ้ามันได้ผลก็ใช้มัน! เป้าหมายคือการคาดเดาว่าใครจะล้มเหลวในการคืนสินค้า ไม่ต้องให้คำอธิบายว่าทำไมพวกเขาถึงไม่คืน หรือเพื่อยืนยันสมมติฐานหนึ่งหรือข้ออื่นเกี่ยวกับความสัมพันธ์ระหว่างการไม่ชำระเงินและพารามิเตอร์ทางเศรษฐกิจหรือสังคมบางอย่าง (ซึ่งส่วนหนึ่งกระตุ้นให้เกิดการอภิปรายและการยอมรับอย่างดุเดือด ของพระราชบัญญัติ ECOA)

การสร้างแบบจำลองการให้คะแนน

ในการสร้างแบบจำลองการให้คะแนน (และไม่คำนึงถึงวิธีการทางคณิตศาสตร์ที่เลือก) จะมีการสุ่มตัวอย่างที่เป็นตัวแทนของผู้สมัครก่อนหน้านี้ (จากหลายพันถึงหลายแสนราย ซึ่งไม่เป็นปัญหาสำหรับอุตสาหกรรมที่ให้บริการลูกค้าหลายสิบล้านราย) สำหรับผู้สมัครแต่ละรายในกลุ่มตัวอย่าง ข้อมูลที่สมบูรณ์จากแบบฟอร์มใบสมัครและข้อมูลจากประวัติเครดิตของเขาจะถูกดึงออกมาในระยะเวลาที่กำหนด (ปกติคือ 12, 18 หรือ 24 เดือน) จากนั้นจะมีการตัดสินใจของผู้เชี่ยวชาญว่าเรื่องใดที่ยอมรับได้ เช่น ไม่ว่าลูกค้าจะ "ดี" หรือ "แย่"

ข้อกำหนดเชิงประจักษ์สำหรับฐานข้อมูลที่ใช้ในการสร้างแบบจำลองการให้คะแนน:

  • ขนาดตัวอย่าง - รวมอย่างน้อย 1,500 ชิ้น อย่างน้อย 500 ชิ้นไม่ดี
  • คำจำกัดความที่ชัดเจนของเกณฑ์ “เลว/ดี”
  • คำจำกัดความที่ชัดเจนของช่วงเวลา - ระยะเวลาอายุการใช้งานของผลิตภัณฑ์ (ขึ้นอยู่กับตัวผลิตภัณฑ์เองและอาจแตกต่างกันไปตั้งแต่หนึ่งเดือน - โทรศัพท์มือถือไปจนถึงหลายทศวรรษ - การจำนอง)
  • ความมั่นคงขององค์ประกอบกลุ่มลูกค้า - ข้อมูลประชากร การย้ายถิ่น การรักษาพฤติกรรมการบริโภค
  • ข้อกำหนดโดยนัยแต่บังคับ: เสถียรภาพทางเศรษฐกิจ การเมือง สังคม และเงื่อนไขอื่นๆ

เมื่อสร้างแบบจำลองเครดิต สิ่งสำคัญคือต้องเลือกระยะเวลา - ระยะเวลาระหว่างการส่งใบสมัคร (การออกเงินกู้) และการจัดประเภท "ไม่ดี/ดี" การวิเคราะห์แสดงให้เห็นว่าอัตราการผิดนัดตามระยะเวลาที่ลูกค้าอยู่กับองค์กรเริ่มเพิ่มขึ้นและหลังจาก 12 เดือน (บัตรเครดิต) หรือมากกว่านั้น (สินเชื่อครั้งเดียว) เริ่มมีเสถียรภาพ ดังนั้น ระยะเวลาที่สั้นกว่าจะนำไปสู่การประเมินต่ำไป และไม่ได้คำนึงถึงคุณลักษณะทั้งหมดที่คาดการณ์การผิดนัดชำระหนี้ได้ครบถ้วน ในทางกลับกัน ระยะเวลาที่มากกว่าสองปีทำให้โมเดลมีความอ่อนไหวต่อการเปลี่ยนแปลงในองค์ประกอบของกลุ่มลูกค้าในช่วงเวลานี้ เนื่องจาก องค์ประกอบของลูกค้าในกลุ่มตัวอย่างที่จุดเริ่มต้นของกรอบเวลาอาจแตกต่างอย่างมีนัยสำคัญจากองค์ประกอบของลูกค้าที่เข้ามาในปัจจุบันอย่างไร ส่งผลให้มีการใช้ชิ้นส่วนสองชิ้นพร้อมกัน (ที่จุดเริ่มต้นและจุดสิ้นสุดของขอบฟ้าเวลา) เพื่อสร้างแบบจำลองที่มีความเสถียรเมื่อเวลาผ่านไป (เกินขอบฟ้าเวลาเริ่มต้น) นี่เป็นตัวกำหนดการเลือกความยาวของช่วงเวลา - ขอบฟ้าเวลาระหว่างการสร้างแบบจำลอง

การก่อสร้างเพิ่มเติม โมเดลการให้คะแนนกลายเป็นปัญหาการจำแนกประเภทโดยที่ลักษณะการป้อนข้อมูล (หรือพารามิเตอร์) เป็นการตอบคำถามในแบบฟอร์มใบสมัครและพารามิเตอร์ (หรือข้อมูล) ที่ได้รับจากการตรวจสอบจากองค์กรต่างๆ (เช่น ตำรวจ ศาล สภาท้องถิ่น สำนักงานเครดิต ฯลฯ ) และลักษณะผลลัพธ์ (คำตอบ) - ผลลัพธ์ที่ต้องการ - คือการแบ่งลูกค้าออกเป็น "ดีและไม่ดี" ตามประวัติเครดิตที่มีอยู่ เปรียบเทียบตามลักษณะอินพุตเหล่านี้

ตารางคะแนนจริง (ดัชนีชี้วัด) คือระบบการกำหนดคะแนนตัวเลข (คะแนน) ให้กับคุณลักษณะ (หรือพารามิเตอร์) ของผู้ยืมเพื่อให้ได้ค่าตัวเลขที่ต้องการซึ่งสะท้อนถึงโอกาสของผู้ยืมที่เกี่ยวข้องกับผู้ยืมรายอื่นที่จะประสบกับบางอย่าง เหตุการณ์หรือการกระทำบางอย่าง (แง่มุม "สัมพันธ์กัน" ในคำจำกัดความมีความสำคัญมาก)

ตารางอันดับความน่าเชื่อถือตัวอย่างเช่น ไม่ได้ระบุระดับความเสี่ยงที่ควรคาดหวัง (เช่น เปอร์เซ็นต์ของเงินกู้ประเภทที่กำหนดที่ไม่น่าจะได้รับการชำระคืน) แต่จะแสดงให้เห็นว่าเงินกู้ที่ให้มามีแนวโน้มที่จะประพฤติตัวอย่างไรเมื่อเทียบกับสินเชื่ออื่นๆ ตัวอย่างเช่น คือค่าเริ่มต้นหรืออัตราเริ่มต้นสำหรับสินเชื่อที่มีชุดคุณลักษณะที่กำหนดซึ่งคาดว่าจะสูงหรือต่ำกว่าสำหรับสินเชื่อที่มีชุดอื่น

ตารางลีกส่วนใหญ่สร้างขึ้นโดยการคำนวณแบบจำลองการถดถอย ซึ่งเป็นแบบจำลองทางสถิติที่ทดสอบว่าพารามิเตอร์ตัวเดียว (ลักษณะเฉพาะ) ส่งผลต่อพารามิเตอร์อื่นหรือ (บ่อยที่สุด) ต่อพารามิเตอร์อื่นทั้งชุดอย่างไร

แบบจำลองการถดถอยส่งผลให้เกิดชุดของสัมประสิทธิ์ เรียกว่าปัจจัยการถดถอย ซึ่งสามารถตีความได้ว่าเป็นความสัมพันธ์ระหว่างพารามิเตอร์ที่สนใจ (ที่จะกำหนด) และพารามิเตอร์อธิบาย โดยคงอิทธิพลอื่นๆ ทั้งหมดที่มีต่อพารามิเตอร์ที่สนใจให้คงที่ ค่าสัมประสิทธิ์เหล่านี้จะถูกแปลงเป็นน้ำหนักคะแนนในตารางลีก

ควรสังเกตว่าคุณภาพของแบบจำลองการให้คะแนนควรได้รับการตรวจสอบอย่างต่อเนื่อง และการตรวจสอบเป็นขั้นตอนบังคับระหว่างการดำเนินการ เมื่อเวลาผ่านไป ทั้งภาวะเศรษฐกิจและลักษณะพฤติกรรมของผู้กู้ยืมอาจเปลี่ยนแปลงได้ และการปรับเปลี่ยนแบบจำลองการให้คะแนนอย่างทันท่วงทีเท่านั้นที่จะรับประกันการบริหารความเสี่ยงด้านเครดิตที่มีประสิทธิภาพ