Big Data, qué es y su impacto en las áreas de Riesgo y
Crédito
Augusto Umaña Ruiz
Banco Davivienda
Gerente de Inteligencia de Negocios
[email protected]
Qué es Big Data
Conclusión
Viejo Problema. Nuevas Soluciones
Qué es Big Data
Crecimiento Información Almacenada en el
Mundo
Información Almacenada*
(Bytes comprimidos eficientemente)
Zettabyte
Exabyte
1.E+22
1.E+21
1.E+20
1.E+19
1.E+18
1.E+17
1.E+16
1.E+15
)
a
c
i
m
l
t
í
r
a
g
o
L
a
a
c
s
E
(
s
e
t
y
B
analog
digital
TOTAL
Para 2014 se estima que el mundo llegó a almacenar 4.6 Zettabytes.
1 zettabyte = 100,000 millones de películas en HD = 23.5 millones de años de video
World Bank. 2016. World Development Report 2016: Digital Dividends. Pag. 245
http://www.worldbank.org/wdr2016. Datos: http://bit.do/WDR2016-FigS5_1
Cómo son los Datos?
Estructurados
Sistemas transaccionales
Procesos estandarizados
Captura
Limpieza
Bodegas de Datos
No Estructurados
Video
Audio
Texto
Archivos Excel
Imágenes Documentos
No solo es Volumen
Volumen
Fuentes tradicionales
Nuevas fuentes
Más historia
Mayores interacciones
digitales
Variedad
Transaccionales
Imágenes
Audio
Texto
1
3
2
Velocidad
Leer BD
Transformar variables
Cruzar diferentes
fuentes
Análisis rápidos
Capacidad para analizar grandes
volúmenes de datos de forma rápida
Doug Laney. 3D Data Management: Controlling Data Volume, Velocity, and Variety. Meta Group, research note. Feb 2001
Google, MapReduce y Hadoop
Procesamiento en
Paralelo
En 2004 google publica paper sobre
sistemas distribuidos. Nace
MapReduce.
En 2006 Hadoop: primera
implementación libre de
MapReduce.
Yahoo! 2007: Implementa Hadoop
en 2 DataCentes de 1,000
servidores
Qué es MapReduce
Distribuir datos
En cada máquina
se guarda una
copia de los datos
Reduce
Combina la salida de
MAP y produce el
resultado final
MAP
Cada bloque de datos se transforma de
acuerdo a la función MAP
Dos tecnologías con las cuales trabajar
Todos los bancos las manejan (Oracle, SQL Server, etc)
Lenguaje de consulta conocido
Procesamiento en paralelo, manejo de grandes volumenes
de datos
Gente especializada en su manejo
Muy buenas para datos estructurados
BIG NO: Datos no estructurados
Procesamiento de altísimo rendimiento
Alta redundancia = Menos propenso a fallas
Cuaquier tipo de datos
Actualmente pocos lo manejan
Viejo Problema.
Nuevas Soluciones
Ciclo de Crédito
Información
MIS
Diseño de Producto
Big Data y
Analytics
Diseño de Producto
•
Identificación micro
clusters. Desarrollar
política para estos
• Precio basado en riesgo
• Mayor capacidad para
detectar relaciones no
lineales entre variables
Mejores modelos
Adquisición
Explotar
Datos no
Estructurados
Proceso Otorgamiento
• Desempeño analistas.
• ¿Dónde están los
cuellos de botella?
• Verificación:
•
Imágenes solicitud:
Grafología forense
• Llamada verificación:
Identificación por voz
• Fábricas de fraude:
Identificar direcciones y
teléfonos comunes
Mantenimiento Portafolio
Patrones
Comportamiento
Administración Riesgo
Desempeño portafolio:
identificar impactos en
portafolio ante cambios
Macro, antes que se
materialicen.
Impacto hábito de pago:
• Cliente cambia día de
pago.
• Nuevo producto en la
competencia Qué hacer
para evitar no pago?
Cobranzas
Conversación
Cobranzas
Interacciones Cliente
Mejor día y hora para cobro
con base en respuesta
histórica
Transcripción automática
audio:
No quedarse en tipificación
cobrador
Perfilación cliente con base
en argumentos/razones de no
pago
Conclusiones
Conclusión
La administración de riesgo en el sistema bancario siempre
ha tenido sustento en el análisis de información para diseñar
sus políticas.
Las nuevas tecnologías permiten tener mayor profundidad en
el análisis, no solo por contar con más información sino por
poder trabajar con esta de forma más ágil.
En la época de Big Data, el análisis de datos no
estructurados permitirá encontrar nuevas relaciones y formas
diferentes de acercarse al mercado para tener negocios más
rentables.
Comentarios de: Big Data, qué es y su impacto en las áreas de Riesgo y Crédito (0)
No hay comentarios