Loan Default Prediction: A Complete Revision of LendingClub

José Antonio Núñez Mora, Pamela Moncayo, Carlos Franco, Pilar Madrazo-Lemarroy, Jaime Beltrán

Resumen


Predicción del default: Una revisión completa de LendingClub 

El objetivo del estudio es determinar un modelo de predicción de default crediticio usando la base de datos de LendingClub. La metodología consiste en estimar las variables que influyen en el proceso de predicción de préstamos pagados y no pagados utilizando el algoritmo Random Forest. El algoritmo define los factores con mayor influencia sobre el pago o el impago, generando un modelo reducido a nueve predictores relacionados con el historial crediticio del prestatario y el historial de pagos dentro de la plataforma. La medición del desempeño del modelo genera un resultado F1 Macro Score con una precisión mayor al 90% de la muestra de evaluación. Las contribuciones de este estudio incluyen, el haber utilizado la base de datos completa de toda la operación de LendingClub disponible, para obtener variables trascendentales para la tarea de clasificación y predicción, que pueden ser útiles para estimar la morosidad en el mercado de préstamos de persona a persona. Podemos sacar dos conclusiones importantes, primero confirmamos la capacidad del algoritmo Random Forest para predecir problemas de clasificación binaria en base a métricas de rendimiento obtenidas y segundo, denotamos la influencia de las variables tradicionales de puntuación de crédito en los problemas de predicción por defecto.


Palabras clave


Random Forest, Préstamos persona a persona, LendingClub, SMOTE, Fintech. Predicción del Default

Texto completo:

PDF (English)


DOI: https://doi.org/10.21919/remef.v18i3.886

Enlaces refback

  • No hay ningún enlace refback.


Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.
Métricas de artículo
Cargando métricas ...

Metrics powered by PLOS ALM