El objetivo de este trabajo, basado en técnicas de Data Mining, es llegar a identificar el mejor método de predicción de riesgos para el sistema bancario español, teniendo en cuenta tanto sus características específicas, como la situación económica de España en el período objeto de estudio. Para ello, se definen, en primer lugar, catorce ratios que permiten identificar, en términos de riesgos, la situación de los bancos y cajas de ahorros españoles durante el período examinado. Mediante una técnica de reducción de dimensiones con la que se simplifica la interpretación de resultados, se obtienen cuatro factores latentes sobre los que se evalúa, junto con cuatro variables macroeconómicas adicionales,un conjunto de algoritmos de Data Mining, siendo seleccionado finalmente el arbol CHAID, a diferencia de trabajos previos, en los que nunca se había llegado a proponer la aplicación de técnicas de Data Mining y Machine Learning en la identificación de situaciones de riesgo en la industria bancaria española. Una limitación de este trabajo ha sido la imposibilidad de incorporar variables regulatorias, por tratarse de información reservada que, de haber estado disponible, nos habría permitido incorporar una nueva dimensión en la predicción de riesgos.
The objective of this work, based on Data Mining techniques, is to identify the best risk prediction method for the Spanish banking system, taking into account its specific characteristics and the economic situation of Spain during the period understudy. For this purpose, first of all, fourteen ratios are defined in order to identify, in terms of risks, the situation of Spanish banks and savings banks during the period under review. Through a technique of reduction of dimensions which simplifies the interpretation of results, four latent factors are obtained on which are evaluated, together with four additional macroeconomic variables, a set of algorithms of Data Mining, being finally selected the CHAID tree, unlike previous works, in which it hadnever come to propose the application of techniques of Data Mining and Machine Learning in the identification of situations of risk in the Spanish banking industry. One limitation of this work has been the impossibility of incorporating regulatory variables, due that this information is confidential, otherwise, we would have been able to incorporate a new dimension in the prediction of risks.
A partir de 2008, coincidiendo con el inicio de la última crisis financiera, se aprobaron diversas normativas en distintos ámbitos -nacional e internacional- con el objetivo común de permitir actuar anticipadamente sobre aquellas entidades que presentaran problemas de solvencia. Concretamente, en el ámbito de la Unión Europea se debe destacar la
Este estudio se inicia con una revisión de los trabajos previos realizados en la materia aplicando metodologías similares o, directamente, modelos estadísticos con nuestro mismo objetivo; la identificación de entidades con problemas de solvencia, incluidos aquellos trabajos que toman únicamente variables microprudenciales, si bien en este trabajo se incluyen además variables macroeconómicas, representativas de la situación económica española en el período objeto de análisis.
La investigación propiamente dicha se inicia con un análisis de los datos obtenidos de las cuentas anuales consolidadas de todos los bancos y cajas de ahorros que integran el sistema financiero español para el período comprendido entre los años 2005 y 2012, ambos inclusive, previa definición y cálculo de catorce ratios, a los que se ha aplicado un análisis factorial que nos ha permitido obtener cuatro factores subyacentes, capaces de explicar la evolución de la situación económico-financiera decada entidad a lo largo del período analizado.
El estudio se completa incorporando los cuatro factores obtenidos, junto con una selección de cinco variables macroeconómicas, a los siguientes modelos predictivos: árboles de decisión (CRT, QUEST, y CHAID) redes neuronales (perceptrón multicapa y defunciones de base radial) y regresión logística y nominal, concluyendo que todos los modelos podrían resultar equivalentes en términos de predicción de riesgos (detección de entidades con problemas), si se toma como criterio el área bajo la curva ROC. Sin embargo, se ha optado por seleccionar el modelo CHAID (en su versión exhaustiva) por ser el algoritmo que obtiene la mayor precisión y por su sencillez, incorporando únicamente tres variables predictoras; dos microeconómicas y una macroeconómica.
Desde los trabajos pioneros en materia de predicción de quiebra de
De toda la literatura examinada en materia de análisis factorial destaca el trabajo de
Otro de los elementos característicos de nuestro trabajo reside en la incorporación de variables macroeconómicas en la fase de análisis y selección del mejor método de predicción de riesgos bancarios. Entre los trabajos que incorporan variables “macro” destaca el de
En cuanto a los métodos de predicción de quiebra, son numerosos los trabajos realizados en todas las industrias, basándose en la comparación de diversos modelos de predicción y búsqueda de aquél con mayor capacidad predictiva. Así, en el caso de la industria bancaria, objeto de este trabajo, destaca el de
Entre los trabajos que obtienen los mejores resultados con las redes neuronales, cabe citar, además del de
Entre los trabajos que avalan los buenos rendimientos de los árboles de decisión, aunque no se circunscriben a la industria bancaria, cabe citar el realizado por
Dadas las características del sistema bancario español, en este trabajo se llega a la conclusión de que a través de una metodología sencilla y fácil de explicar, como es un árbol de decisión, se puede proporcionar un sistema que permita al supervisor identificar aquellas entidades que podrían encontrarse próximas a la quiebra o con serios problemas de solvencia.
Para identificar el mejor método de predicción de situaciones de riesgo en las entidades de depósito del sistema bancario español se ha aplicado, en una primera etapa, el análisis factorial, metodología que nos ha permitido identificar las características latentes (variables microeconómicas) de los bancos y cajas de ahorro españoles. A continuación, se han aplicado los siguientes modelos de predicción de riesgos: red neuronal preceptrón multicapa y funciones de base radial, árboles de decición CRT, QUEST, y CHAID (versión eshaustiva), regresión logística y nominal, a las cuatro características latentes obtenidas y a otras cuatro variables macroeconómicas, a fin de identificar aquel modelo que muestre mayor capacidad predictiva en términos de riesgos bancarios.
En cualquier estudio que pretenda analizar la situación económico-financiera de una entidad al objeto de identificar posibles problemas o, simplemente, desequilibrios en alguna de las dimensiones indicadas, se deben identificar cuatro magnitudes fundamentales: solvencia
En este trabajo, a diferencia de otros realizados sobre una muestra, se ha partido del censo de todos los Bancos y Cajas de Ahorro que integran el sistema financiero español para el período comprendido entre los años 2005 Y 2012 (ambos inclusive). Todos los datos se han obtenido directamente de las cuentas anuales consolidadas publicadas por la Asociación Española de Banca (AEB) y por la Confederación Española de las Cajas de Ahorro (CECA), disponibles en sus respectivas páginas web
Se definen y justifican, a continuación, los valores medios obtenidos para cada uno de los factores latentes obtenidos. Concretamente, en los
En el caso de las cajas de ahorros el comportamiento de todos los factores es similar, en la medida que todos experimentan una suave caída, en cualquier caso, menos acusada que en los bancos, a excepción de la rentabilidad, que sufre una brusca caída en 2012, circunstancia que se podría explicar en gran medida, de nuevo, por el comportamiento del ratio número (10), que en dicho año pasa de un valor medio de “0,0” a un valor negativo.
En el
En el Anexo de este trabajo se muestra la estadística descriptiva de las variables utilizadas en el análisis factorial. Concretamente, en la
(1) Patrimonio neto Activo
(2) Patrimonio neto Pasivo
(3) Patrimonio neto Pasivo + cuentas orden
(4) Pasivos financieros a coste amortizado Activo
(5) Inversión crediticia Activo
(6) Crédito a clientes Activo
(7) Depósitos de clientes Préstamos concedidos
(8) Activos financieros disponibles para la venta Activo
(9) Resultado del ejercicio Activo
(10) Rdo de explotación Activo
(11) Margen bruto Activo
(14) Costes operativos Ingresos operativos Fuente: elaboración propia.
Microeconómicas
Variable
Descripción
Mide la capacidad de una entidad para soportar pérdidas potenciales o disminuciones inesperadas en el valor de sus activos, sin que los acreedores o depositantes sufran pérdidas.
Medida de solvencia y apalancamiento de una entidad. Cuanto mayores sean los valores que toma el ratio mejor será la solvencia de la entidad y, al tiempo, menor será su apalancamiento.
Medida de solvencia y apalancamiento, en la que, además, se incorpora aquellas cuentas representativas de obligaciones potenciales de la entidad, como garantías financieras o compromisos de compra, entre otros (cuentas de orden).
Medida de solvencia de una entidad que indica la porción de la estructura financiera ajena de una entidad que no tiene carácter especulativo (pasivos financieros a coste amortizado como los depósitos, los pasivos subordinados y los débitos por valores negociables). Cuanto mayor sea el valor de este ratio mayores serán las obligaciones de la entidad, con la consiguiente erosión de su solvencia.
Medida de liquidez de una entidad. Se asume que cuanto mayor sea este ratio menor será la liquidez, al estar invertidos los recursos financieros en préstamos y valores a largo plazo.
Mide la proporción de la inversión total de la entidad que está materializada en “crédito a la clientela” independientemente de la cartera en la que esté clasificado dicho crédito: i) negociación (presenta principalmente riesgo de mercado); ii) otros activos financieros a valor razonable con cambios en pérdidas en ganancias; e iii) inversiones crediticias. Permite intuir la política de gestión del riesgo de crédito de una entidad observando la composición y ponderación de estas carteras, principalmente la de inversión crediticia, por ser la de mayor tamaño y representar el negocio tradicional de las entidades de crédito. De manera que si este ratio toma valores próximos a los de la variable (5) la actividad de la entidad estará centrada en el negocio tradicional bancario, al tener un peso residual las carteras de “negociación” y de “otros activos financieros a valor razonable con cambios en pérdidas en ganancias”.
Este ratio permite distinguir la financiación con depósitos de clientela, más estable al estar protegida por el Fondo de Garantía de Depósitos (FGD) y no quedar expuestos al riesgo de crédito, de la financiación mayorista que presenta el riesgo de no ser renovada y que durante la crisis fue la causa de numerosos problemas de liquidez en numerosas entidades, que recurrieron a ella para financiar su activo.
Medida de liquidez de una entidad, en la medida que la cartera de activos disponibles para la venta recoge instrumentos de deuda y de capital que suelen negociarse en mercados líquidos.
Mide la capacidad global de una entidad para generar rendimientos con sus recursos económicos. Se trata de una medida de la calidad de la gestión de una entidad que puede identificarse con la rentabilidad económica (ROA).
Mide la rentabilidad generada por el negocio recurrente. Se obtiene agregando al margen bruto los gastos de administración, de personal, otros gastos generales de administración, amortización, dotación de provisiones (neto) y las pérdidas por deterioro de activos financieros (neto).
Medida de rentabilidad más próxima al núcleo de la actividad bancaria sobre la que se asume que, en principio, los directivos tendrán una menor liberalidad para operar, al no incluir partidas como amortizaciones, gastos de administración o las pérdidas por deterioro de activos financieros.
(12) Logaritmo del activo
Partiendo de que el tamaño constituye una variable relevante, al determinar economías de escala y posibilitar la aplicación de políticas de diversificación de riesgos más activas, para medirlo, se ha tomado el logaritmo de los activos, realizando un cambio de escala. Todo ello, sin perjuicio de que un mayor tamaño incrementa el riesgo moral (“demasiado grande para caer”), tal y como se manifiesta en que, en Basilea III, el tamaño se incluye en la “exposición total” a efectos del coeficiente de solvencia, para identificar bancos con riesgo sistémico e imponerles mayores requerimientos de capital.
(13) Logaritmo de los ingresos por intereses
Medida que atiende al volumen de negocio, si bien, centrándose exclusivamente en los ingresos por intereses que, como se conoce, se encuadran dentro del negocio tradicional bancario.
Medida de ineficiencia, dado que cuanto mayores sean los valores que toma este ratio más ineficiente será la entidad.
Saldo Balanza corriente
Mide la posición neta de ahorro de una economía en relación con el resto del mundo. Es el concepto económico más utilizado al analizar desequilibrios globales.
Financiación total a hogares
Variable que mide el grado de endeudamiento de las economías domésticas.
Inflación
Se trata de una variable que determina el grado de estabilidad de una economía.
Variación del PIB
Variable que permite identificar si una economía se encuentra en fase de expansión o de recesión.
Variación de la Deuda Pública
Variable medida como porcentaje del PIB, que permite analizar la evolución de la financiación del sector público en una economía.
En cuanto a las variables macroeconómicas seleccionadas: i) saldo de la balanza por cuenta corriente; ii) financiación total a los hogares; iii) inflación; iv) variación del PIB y; v) variación de la Deuda Pública, su elección se ha basado en que permiten identificar desequilibrios internos y externos (deuda pública, saldo de la balanza de pagos o financiación a los hogares), así como variaciones coyunturales de una economía (inflación y variación del PIB). Al igual que en el caso de las variables microeconómicas, los datos corresponden a los años 2005 a 2012, ambos inclusive, y se han obtenido directamente del Boletín estadístico del Banco de España, disponible en su página web
El Análisis Factorial busca obtener factores que expliquen la mayor parte de la varianza común de las variables analizadas; en nuestro caso, los catorce ratios definidos ad hoc y calculados. Se trata, por tanto, de calcular nuevas “variables ficticias” que, aunque no observables, son combinación lineal de las originales y recogen la mayor parte de la información correspondiente a las primeras. Como se puede observar en la
Fuente: elaboración propia
Kaiser-Meyer-Olkin Medida de adecuación muestral
0,705
Test de Esfericidad de Bartlet
Aprox. Chi-cuadrado
9.315,945
Df
91
Sig
0,000
En la
Fuente: elaboración propia.
Factor
Autovalores iniciales
Suma de las saturaciones al cuadrado de la extracción
Suma de las saturaciones al cuadrado de la rotación
Total
% Varianza
% Acum.
Total
% Varianza
% Acum.
Total
% Varianza
% Acum.
1
4,933
35,238
35,238
4,933
35,238
35,238
4,030
28,784
28,784
2
3,128
22,342
57,579
3,128
22,342
57,579
2,984
21,318
50,101
3
2,008
14,342
71,921
2,008
14,342
71,921
2,287
16,338
66,439
4
1,265
9,034
80,955
1,265
9,034
80,955
2,032
14,516
80,955
5
0,734
5,246
86,201
Para simplificar la estructura factorial se ha realizado una rotación de los ejes factoriales. De entre los diferentes procedimientos existentes, se ha utilizado el método Varimax (
Fuente: Elaboración propia.
Componente
Solvencia (1)
Liquidez (2)
Tamaño (3)
Rentabilidad (4)
(2)
,923
(1)
,906
(3)
,896
(4)
-,792
(11)
,688
(5)
,917
(6)
,905
(7)
-,818
(8)
-,754
(12)
-,937
(13)
-,919
(10)
,894
(9)
,871
(14)
-,578
Se analiza y discute a continuación, los resultados obtenidos para cada uno de los cuatro factores seleccionados:
a) El Adicionalmente, se puede afirmar que las entidades más solventes son las que presentan un mayor margen bruto sobre los activos totales medios porque, por un lado, y teniendo en cuenta que el componente principal de dicho margen es el “margen por intereses”, elemento nuclear del negocio bancario tradicional, dichas entidades tienen menores costes de financiación, circunstancia que se puede justificar, por una parte, en un mayor valor del ratio (2) que, en última instancia, redunda en un menor riesgopercibido por los mercados, con el consiguiente efecto de rebaja en los costes de financiación. Adicionalmente, las entidades más solventes obtienen un mejor resultado por operaciones financieras, al presentar menores dificultades para obtener liquidezpor la vía de la enajenación de carteras, circunstancia que evita tener que realizar ventas a bajos precios que puedan perjudicar dichos resultados. b) El c) El d) El
La segunda fase del trabajo se centra en la realización de un proceso de Data Mining, proceso interactivo que combina la experiencia sobre un problema dado con variedad de técnicas tradicionales de análisis de datos y tecnología avanzada de aprendizaje automático, con el objetivo de descubrir patrones y relaciones en los datos para la realización de predicciones válidas.
La minería de datos es una parte de un proceso más general que se denomina Descubrimiento de conocimiento en las bases de datos (Knowledge Discovery in Databases o KDD), si bien, en la mayor parte de la bibliografía sobre el tema el concepto de Data Mining toma el significado global del proceso.
Una definición más general de la minería de datos es referirse a ella como la extracción no trivial de la información implícita, previamente desconocida y potencialmente útil, a partir de los datos.
La determinación de estos modelos se ha realizado teniendo en cuenta las características de la muestra, en este caso un censo, y en concreto, los modelos finalmente considerados de cara a ser testados son los siguientes:
Estadística clásica: regresión logística o modelo logit y regresión nominal. Redes neuronales artificiales: perceptrón multicapa y funciones de base radial. Árboles de decisión: CRT, QUEST Y CHAID, en su versión exhaustiva.
Para alcanzar el objetivo indicado más arriba, el suceso seleccionado en nuestro análisis fue que la entidad se encontrara en alguna de las situaciones siguientes:
Participación en procedimientos de recapitalización, bien por la vía de inyecciones de capital o por la de las fusiones y adquisiciones, o Participación en sistemas institucionales de protección como la concesión de ayudas públicas o, directamente, mediante la intervención de los poderes públicos.
De acuerdo con lo anterior, el objetivo es la identificación de aquellas entidades que presenten el suceso descrito, en cuyo caso, serán incluidas en la categoría “si”, correspondiente a entidades con riesgos bancarios. A la inversa, en la categoría “no” se ha incluido a todas aquellas entidades en la que el suceso no se ha presentado, es decir, entidades que ni han quebrado ni están cerca de hacerlo y que, por tanto, no presentan riesgos bancarios.
En la
Fuente: Elaboración propia
Técnica
Clase Si (%)
Clase No (%)
Total (%)
Área ROC
Árbol CHAID exhaustivo
73,5%
94,9%
92,2%
0,899
Árbol CRT
60,3%
96,4%
91,8%
0,935
Red neuronal de base radial
44,2%
97,9%
91,7%
0,915
Regresión nominal
54,4%
96,8%
91,4%
0,958
Regresión logística
52,9%
97,0%
91,4%
0,919
Red neuronal perceptrón
29,1%
97,9%
90,0%
0,898
Árbol QUEST
47,1%
95,9%
89,8%
0,871
Promedio
51,64%
96,68%
91,18%
91,35%
Como se puede apreciar, en la medida que el área bajo la curva ROC se sitúa en torno al 90% en todos los casos, se puede afirmar que no existen diferencias estadísticamente significativas en el área de los distintos modelos considerados. Ahora bien, si nos centráramos en el porcentaje de acierto o precisión obtenido en la categoría “SÍ”, solo sería aceptable la del árbol CHAID, con el que conseguimos catalogar correctamente a tres de cada cuatro entidades con problemas. En la clase “NO”, por su parte, los resultados obtenidos con los distintos modelos son muy similares, con una precisión en torno al 96,7%.
De todos los modelos utilizados en este trabajo, teniendo en cuenta como criterio el área bajo la curva ROC (véase
El diagrama de árbol de decisión CHAID (en su versión exhaustiva) obtenido en este trabajo se muestra en la
Los resultados obtenidos con el árbol CHAID (en su versión exhaustiva) permiten concluir que el saldo de la balanza corriente es el mejor predictor para las entidades que han experimentado problemas. También se observa que cuando el saldo de la balanzapor cuenta corriente tuvo un déficit superior a 4.758 millones de euros, solamente un 1,6% de las entidades tuvo problemas (Nodo 1. Terminal). El exceso de crédito generado en los períodos expansivos pudo hacer que se relajasen los criterios de riesgo, con el peligro de generar inflación, perjudicando a las exportaciones, pero beneficiando a las importaciones de bienes de capital, necesarias para aumentar la producción, que tuvieron que ser financiadas.
Para las categorías del saldo de la balanza comercial con un déficit entre 4.758 y 3.226 millones de euros (Nodo 2) y el saldo de la balanza comercial con un déficit menor a 3.226 millones de euros (Nodo 3), el siguiente mejor predictor es la solvencia. Para valores de solvencia menores a -0,55 el modelo incluye un predictor más, el tamaño. Un 78,3% de las entidades experimentaron problemas para valores de déficit de la balanza comercial superiores a 3.226 millones de euros, con valores de solvencia menores a -0,55 y con un tamaño menor a 0,44 (entidades financieras de mayor tamaño).
Se observa que una de las probabilidades más altas de que las entidades no presenten problemas se produce en el Nodo 1, con el 98,4%, cuando el déficit del saldo de la balanza comercial fue superior a 4.758 millones de euros. Por otra parte, se observa que la probabilidad más alta de que las entidades presentaran problemas se obtiene en el Nodo 8, con una probabilidad del 78,3%. Esto se produce cuando el déficit de la balanza comercial disminuyó por debajo de 3.226 millones de euros, la solvencia de las entidades bajó de -0,55 y el tamaño de 0,44.
En la
Se observa cómo en los nodos 8 y 4 se concentra el 26,5% y el 47,1%, respectivamente, lo que representa el 73,6% de entidades con problemas, frente al nodo 7, por ejemplo, en el que las entidades con problemas representan solo el 16,2% del total de entidades con problemas, o los nodos 5, 1 y 9, que sólo concentran el 10,3%.
Como se puede apreciar, cuando el saldo de la balanza comercial arrojó valores superiores a un déficit de 3.226 millones de euros y la solvencia presentó valores inferiores a -0,55, con un tamaño mayor, se produjo un 26,5% de las quiebras de la muestra. Para un saldo de la balanza comercial peor (de entre - 4758 y - 3226 millones de déficit), con valores de solvencia mejores que los anteriores, pero inferiores a -0,15, se produjo un 47,1% de las quiebras.
Métodos de crecimiento: CHAID exhaustivo. Variable dependiente: Entidad con problemas Fuente: Elaboración propia.
Nodo
Nodo
Ganancia
Respuesta
Índice
N
Porcentaje
N
Porcentaje
8
23
4,3%
18
26,5%
78,3%
618,0%
4
51
9,5%
32
47,1%
62,7%
495,5%
7
121
22,5%
11
16,2%
9,1%
71,8%
5
26
4,8%
2
2,9%
7,7%
60,7%
1
306
57,0%
5
7,4%
1,6%
12,9%
9
10
1,9%
0
0,0%
0,0%
0,0%
En la
Métodos de crecimiento: CHAID exhaustivo. Variable dependiente: Entidad con problemas. Fuente: Elaboración propia.
Riesgo
Clasificación
Estimación
Típ. Error
Observado
Pronosticado
NO
SI
Porcentaje correcto
,078
,012
NO
445
24
94,9%
SI
18
50
73,5%
Porcentaje global
96,1%
32,4%
92,2%
El riesgo es una medida de la capacidad predictiva del modelo. La parte de la tabla titulada “clasificación” muestra el número de casos clasificados correctamente e incorrectamente, para cada categoría de la variable dependiente. La estimación delriesgo, del 0,078, indica que la categoría pronosticada en el modelo de entidades con problemas y sin problemas es errónea para el 7,8% de los casos. En consonancia con el riesgo, el modelo clasifica de forma correcta el 92,2% de los casos. En concreto, las entidades que no experimentan problemas son pronosticadas correctamente en un 94,9% de los casos, mientras que las que sí, se pronostican correctamente en un 73,5%.
Por último, el
A pesar de la evidencia empírica previa obtenida en materia de selección de modelos de predicción de riesgos, en este trabajo se comprueba que el árbol CHAID en su versión exhaustiva es el mejor modelo de identificación de entidades de crédito (bancos y cajas de ahorros), en el sistema financiero español, con problemas de liquidez y solvencia, teniendo en cuenta tanto la situación económico-financiera en que se encontraba cada una ellas, en el período objeto de estudio (años 2005 a 2012), comola propia de la economía española.
El Data Mining puede ser visto, bien como el conjunto de estrategias que exploran las bases de datos, o bien como la forma en que se busca, entre los datos, los patrones o algoritmos que dan sentido a los comportamientos. Para ello, se sirve de herramientas procedentes tanto de la Estadística como del Machine Learning. Es evidente que la combinación de modelos, así como la utilización de diferentes algoritmos de cara modelizar cualquier tipo de suceso suele comportar una mejora significativa en la capacidad predictiva, y todo lo que ello conlleva. El principal inconveniente asociado al Data Mining, dado que suele estar asociado a grandes volúmenes de datos, es que puede requerir una enorme tarea y, por tanto, una mayor inversión en tecnología y un personal de mayor capacitación. Pero no todos los trabajos en que se aplica son de gran envergadura. En este sentido, los algoritmos más sencillos provenientes del Machine Learning han demostrado una gran utilidad en problemas que, por su volumen de datos, son abordados de manera habitual a través de técnicas estadísticas tradicionales, como los modelos logísticos, especialmente en aquellas ocasiones en que no se cumplen las hipótesis establecidas para los datos de cara a su aplicación. En situaciones como la que se presenta en este trabajo aportan, además, una interpretación más sencilla e intuitiva.
Si bien, en principio se podría afirmar que los resultados obtenidos por los distintos modelos testados (árbol CRT, árbol QUEST, perceptrón multicapa, funciones de base radial, regresión logística y regresión nominal) pueden calificarse como equivalentes en términos de capacidad predictiva, de acuerdo con los resultados obtenidos con la curva ROC, según la cual el área bajo dicha curva se sitúa en torno al 90% en todos los modelos, sin embargo, hemos llegado a concluir que el árbol de decisión CHAID es el mejor, por cuanto que el porcentaje de acierto o precisión obtenido para la categoría “SÍ” (entidades con problemas), que es la relevante a efectos de este trabajo, es del73,5%, muy por encima del obtenido por el resto de modelos, que implica una capacidad del modelo para catalogar correctamente a tres de cada cuatro entidades con problemas. En la clase “NO” los resultados obtenidos con los distintos modelos son muy similares, con una precisión en torno al 96,7%. Además de los resultados indicados, se debe recordar que este árbol presenta una mayor simplicidad frente al resto de modelos, al utilizar únicamente tres variables predictoras, dos microeconómicas (solvencia y tamaño) y una macroeconómica (saldo de la balanza de pagos). En consecuencia, el árbol de decisión CHAID podría ser fácilmente utilizado por el regulador español a efectos de identificación de entidades con posibles riesgos.
De las catorce variables microeconómicas definidas y calculadas a partir de la información publicada en los informes financieros de todos los bancos y cajas de ahorro que integran el sistema financiero español, para el período 2005 a 2012 (ambos inclusive), se obtienen finalmente, cuatro factores subyacentes. De ellos, se obtiene que el factor solvencia es el indicador microeconómico más relevante a efectos de identificación de entidades con problemas, entendiendo por tales aquellas que, o bien hubieran participado en procedimientos de recapitalización vía fusiones y adquisiciones o por aumentos de capital, o bien por haberse beneficiado de sistemas institucionales de protección como la concesión de ayudas públicas o, directamente, mediante laintervención de los poderes públicos. De las variables macroeconómicas empleadas, el saldo de la balanza de pagos es el primer predictor identificado por el modelo, indicando que un déficit acentuado de la balanza corriente genera entrada de capitales con la que financiar dicho déficit que, a su vez, provoca una expansión del crédito bancario de las entidades (mayor apalancamiento), con el consiguiente deterioro de su solvencia, al tiempo que genera mayor inflación y una menor competitividad.
De acuerdo con lo indicado, se puede concluir que cuando el saldo de la balanza por cuenta corriente presenta un déficit menor a -3.222,6 millones de euros, y el factor solvencia toma valores menores a -0,55, existe una probabilidad del 54,5% de que unaentidad bancaria española (banco o caja de ahorros) experimente problemas en el sentido identificado en este trabajo. En estas circunstancias, si se incorporan los efectos del factor tamaño, siendo este menor de 0,44 (mayor tamaño), se llega a la conclusión de que la probabilidad de que una entidad presente problemas bancarios sube hasta el 78,3%, lo que podría interpretarse en el sentido de que nos encontramos ante un factor representativo de la conocida expresión “demasiado grande para quebrar”, que sugiere la existencia de un apoyo implícito por parte del Estado español, que pudo llevar a estas entidades a asumir mayores riesgos, a pesar de no disfrutar de una buena solvencia, frente a entidades de tamaño mediano y pequeño, que sobrevivieron con una probabilidad del 100
Por último, los resultados de este trabajo nos llevan a concluir que en etapas de expansión crediticia, con un crecimiento del déficit de la balanza por cuenta corriente y de los riesgos, la probabilidad de que las entidades tengan problemas de solvencia es del 1,4%, si bien, los riesgos acumulados se manifestarán en etapas posteriores de recesión, afectando a la solvencia de las entidades, que no podrán asumir dichos riesgos.
Entendida como la “capacidad de una empresa para hacer frente a la devolución de las obligaciones financieras asumidas” (
Indicador de las posibilidades para generar los recursos líquidos necesarios para atender los compromisos asumidos en el desarrollo de la actividad típica de la empresa (
Capacidad de una empresa para generar ganancias o rendimientos.
FMI (2010)
Creado por Real Decreto-ley 16/2011, de 14 de octubre, con personalidad jurídica propia y plena capacidad para el desarrollo de sus fines en régimen de derecho privado, tiene por objeto garantizar los depósitos en dinero y en valores u otros instrumentos financieros constituidos en las entidades de crédito, con los límites establecidos legalmente. Para el cumplimiento de su función de garantía de depósitos y en defensa de los depositantes cuyos fondos están garantizados y del propio Fondo de Garantía de Depósitos de Entidades de Crédito, el Fondo podrá adoptar medidas de apoyo a la resolución de una entidad de crédito con cargo al compartimento de garantía de depósitos. Excepcionalmente, siempre y cuando no se haya iniciadoun proceso de resolución, el Fondo podrá utilizar sus recursos para impedir la liquidación de una entidad de crédito en los supuestos legalmente previstos (ver:
Año
Ratio
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
,077
,084
,068
,862
,787
,717
1,003
,109
,009
,010
,030
6,982
5,460
,563
,026
,032
,025
,053
,067
,123
,119
,063
,003
,003
,007
,498
,469
,073
46
46
46
46
46
46
46
46
46
46
46
46
46
46
,073
,080
,064
,876
,808
,736
,958
,102
,008
,010
,029
7,031
5,548
,610
,026
,031
,024
,041
,060
,120
,111
,057
,003
,003
,006
,547
,523
,076
47
47
47
47
47
47
47
47
47
47
47
47
47
47
,070
,076
,063
,884
,797
,743
,957
,115
,008
,009
,028
7,094
5,718
,675
,026
,032
,025
,040
,052
,119
,120
,051
,003
,003
,008
,562
,544
,074
46
46
46
46
46
46
46
46
46
46
46
46
46
46
,060
,064
,055
,898
,760
,758
1,057
,115
,005
,004
,025
7,123
5,813
,723
,022
,026
,021
,078
,102
,071
,160
,061
,006
,007
,006
,560
,549
,068
46
46
46
46
46
46
46
46
46
46
46
46
46
46
,060
,064
,057
,898
,743
,725
1,091
,109
,002
,004
,026
7,134
5,713
,639
,025
,029
,024
,081
,106
,076
,181
,053
,007
,006
,005
,559
,534
,080
46
46
46
46
46
46
46
46
46
46
46
46
46
46
,053
,058
,050
,871
,722
,703
1,121
,103
-,001
,000
,016
7,433
5,511
,602
,042
,046
,040
,146
,116
,098
,240
,053
,018
,014
,011
,732
,756
,263
18
18
18
18
18
18
18
18
18
18
18
18
18
18
,057
,061
,054
,874
,714
,685
1,130
,101
-,001
,000
,020
7,565
6,030
,689
,021
,024
,021
,108
,101
,112
,253
,045
,010
,010
,008
,683
,658
,082
25
25
25
25
25
25
25
25
25
25
25
25
25
25
,033
,035
,032
,866
,617
,601
1,329
,115
-,040
-,032
,020
7,595
6,052
,617
,034
,036
,033
,142
,143
,116
,245
,058
,050
,035
,005
,742
,714
,075
20
20
20
20
20
20
20
20
20
20
20
20
20
20
,064
,069
,058
,881
,759
,720
1,051
,109
,002
,004
,026
7,172
5,701
,642
,029
,033
,027
,081
,102
,111
,193
,056
,019
,015
,008
,612
,591
,109
294
294
294
294
294
294
294
294
294
294
294
294
294
294
Año
Ratio
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
,102
,125
,102
,833
,819
,822
,935
,055
,008
,009
,045
6,588
5,062
,633
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
0
0
0
0
0
0
0
0
0
0
0
1
1
0
,105
,130
,104
,850
,834
,821
,908
,056
,012
,014
,048
6,651
5,189
,661
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
0
0
0
0
0
0
0
0
0
0
0
1
1
0
,108
,132
,102
,824
,828
,812
,936
,062
,011
,013
,049
6,714
5,366
,684
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
29,000
0
0
0
0
0
0
0
0
0
0
0
1
1
0
,098
,117
,092
,866
,822
,818
,954
,068
,004
,005
,042
6,710
5,409
,900
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
0
0
0
0
0
0
0
0
0
0
0
1
1
0
,107
,136
,117
,856
,791
,788
,974
,081
,002
,005
,045
6,679
5,171
,885
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
0
0
0
0
0
0
0
0
0
0
0
1
1
0
,108
,136
,118
,853
,763
,757
1,057
,094
,001
,003
,044
6,668
5,047
,871
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
0
0
0
0
0
0
0
0
0
0
0
1
1
0
,103
,126
,106
,856
,725
,721
1,308
,102
-,001
,001
,043
6,636
5,082
1,039
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
30,000
0
0
0
0
0
0
1
0
0
0
0
1
1
0
,097
,114
,096
,837
,688
,685
1,547
,114
-,008
-,003
,042
6,589
5,028
,844
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
31,000
0
0
0
0
0
0
1
0
0
0
0
1
1
0
,103
,127
,105
,847
,784
,778
1,078
,079
,004
,006
,045
6,654
5,168
,814
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
243,000
0
0
0
0
0
0
1
0
0
0
0
1
1
0



