PDF de programación - Big Data, qué es y su impacto en las áreas de Riesgo y Crédito

Volver

<<>>

Big Data, qué es y su impacto en las áreas de Riesgo y Crédito

Publicado el 22 de Marzo del 2018

900 visualizaciones desde el 22 de Marzo del 2018

1,6 MB

17 paginas

Creado hace 9a (16/05/2016)

Big Data, qué es y su impacto en las áreas de Riesgo y

Crédito

Augusto Umaña Ruiz

Banco Davivienda

Gerente de Inteligencia de Negocios

[email protected]

Qué es Big Data

Conclusión

Viejo Problema. Nuevas Soluciones

Qué es Big Data

Crecimiento Información Almacenada en el
Mundo

Información Almacenada*

(Bytes comprimidos eficientemente)

Zettabyte

Exabyte

1.E+22
1.E+21
1.E+20
1.E+19
1.E+18
1.E+17
1.E+16
1.E+15

)
a
c
i
m

l

t
í
r
a
g
o
L

a
a
c
s
E
(

s
e
t
y
B

analog

digital

TOTAL

Para 2014 se estima que el mundo llegó a almacenar 4.6 Zettabytes.
1 zettabyte = 100,000 millones de películas en HD = 23.5 millones de años de video

World Bank. 2016. World Development Report 2016: Digital Dividends. Pag. 245
http://www.worldbank.org/wdr2016. Datos: http://bit.do/WDR2016-FigS5_1

Cómo son los Datos?

Estructurados

Sistemas transaccionales
Procesos estandarizados

Captura
Limpieza

Bodegas de Datos

No Estructurados

Video
Audio
Texto

Archivos Excel

Imágenes Documentos

No solo es Volumen

Volumen

Fuentes tradicionales
Nuevas fuentes
Más historia
Mayores interacciones
digitales

Variedad

Transaccionales
Imágenes
Audio
Texto

1

3

2

Velocidad

Leer BD
Transformar variables
Cruzar diferentes
fuentes
Análisis rápidos

Capacidad para analizar grandes
volúmenes de datos de forma rápida

Doug Laney. 3D Data Management: Controlling Data Volume, Velocity, and Variety. Meta Group, research note. Feb 2001

Google, MapReduce y Hadoop

Procesamiento en
Paralelo

En 2004 google publica paper sobre

sistemas distribuidos. Nace

MapReduce.

En 2006 Hadoop: primera

implementación libre de

MapReduce.

Yahoo! 2007: Implementa Hadoop

en 2 DataCentes de 1,000

servidores

Qué es MapReduce

Distribuir datos

En cada máquina
se guarda una
copia de los datos

Reduce

Combina la salida de
MAP y produce el
resultado final

MAP

Cada bloque de datos se transforma de
acuerdo a la función MAP

Dos tecnologías con las cuales trabajar

Todos los bancos las manejan (Oracle, SQL Server, etc)

Lenguaje de consulta conocido

Procesamiento en paralelo, manejo de grandes volumenes
de datos

Gente especializada en su manejo

Muy buenas para datos estructurados

BIG NO: Datos no estructurados

Procesamiento de altísimo rendimiento

Alta redundancia = Menos propenso a fallas

Cuaquier tipo de datos

Actualmente pocos lo manejan

Viejo Problema.
Nuevas Soluciones

Ciclo de Crédito

Información

MIS

Diseño de Producto

Big Data y
Analytics

Diseño de Producto

•

Identificación micro
clusters. Desarrollar
política para estos

• Precio basado en riesgo
• Mayor capacidad para
detectar relaciones no
lineales entre variables 
Mejores modelos

Adquisición

Explotar
Datos no

Estructurados

Proceso Otorgamiento

• Desempeño analistas.
• ¿Dónde están los
cuellos de botella?

• Verificación:

•

Imágenes solicitud:
Grafología forense

• Llamada verificación:
Identificación por voz

• Fábricas de fraude:

Identificar direcciones y
teléfonos comunes

Mantenimiento Portafolio

Patrones

Comportamiento

Administración Riesgo

Desempeño portafolio:
identificar impactos en
portafolio ante cambios
Macro, antes que se
materialicen.
Impacto hábito de pago:
• Cliente cambia día de

pago.

• Nuevo producto en la

competencia  Qué hacer
para evitar no pago?

Cobranzas

Conversación

Cobranzas

Interacciones Cliente

Mejor día y hora para cobro
con base en respuesta
histórica
Transcripción automática
audio:
No quedarse en tipificación
cobrador
Perfilación cliente con base
en argumentos/razones de no
pago

Conclusiones

Conclusión

La administración de riesgo en el sistema bancario siempre
ha tenido sustento en el análisis de información para diseñar
sus políticas.

Las nuevas tecnologías permiten tener mayor profundidad en
el análisis, no solo por contar con más información sino por
poder trabajar con esta de forma más ágil.

En la época de Big Data, el análisis de datos no
estructurados permitirá encontrar nuevas relaciones y formas
diferentes de acercarse al mercado para tener negocios más
rentables.