PDF de programación - Machine Learning & Data Science

Imágen de pdf Machine Learning & Data Science

Machine Learning & Data Sciencegráfica de visualizaciones

Publicado el 1 de Noviembre del 2018
550 visualizaciones desde el 1 de Noviembre del 2018
1,0 MB
28 paginas
Creado hace 2a (09/03/2017)
Tabla de contenido

Portada
Motivación
Introducción
Redes Neuronales
Machine Learning

Clasificación de animales
Generar caras humanas
Predecir acciones
Reconocimiento de imágenes
Visualización de sentimientos por comuna

Instancia Amazon AWS
Tensorflow
Django
Heroku

1.1
1.2
1.3
1.4
1.5
1.5.1
1.5.2
1.5.3
1.5.4
1.5.5
1.6
1.7
1.8
1.9

1

Portada

2

Motivación

Motivación

Este es el resultado de tres meses de trabajo durante una pasantía en el departamento de
Ingeniería Eléctrica y Computación en la Universidad de Texas en Austin. Esta colaboración
fue posible gracias a la beca de Investigación entregada por la facultad de Ingeniería y el
Programa de Investigación en Pregrado de la Pontifica Universidad Católica de Chile,
entidades a las cuales agradezco muchísimo por la oportunidad.

Mi enfoque durante esta estadía fue el Aprendizaje de Máquinas, las Redes Neuronales
Artificiales y el reconocimiento de patrones en grandes cantidades de datos. En este
periodo trabajé con el profesor Alexandros Dimakis, quien fue mi mentor y me ayudó a
abarcar y aplicar estas temáticas. Además, agradezco a la organización SocVis UC, la cual
no sólo me ayudó a conseguir esta beca, si no que me ha llevado a interesarme por esta
área y es a quien debo el camino que decidí seguir con mi carrera.

Esta guía no busca ser ley ni reemplazar material de estudio. El objetivo es ser un punto de
partida para quienes se vean interesados en estos temas por medio de explicaciones
simples y aplicaciones directas a nuestro mundo. No pretendo explayar teoremas o dar
definiciones muy extensas, ya que para ese tipo de explicaciones sobran libros y papers, a
los cuales daré referencia directa en caso de que haya gente que quiera abarcar más
profundamente algún concepto.

"A Neural Network Dream", imágenes creadas en su totalidad por un computador entrenado
en obras de arte.

Estamos viviendo un proceso realmente único, el cual para muchos es el cambio histórico
más importante desde la Revolución Industrial. Espero con este informe contagiar mi interés
por estas temáticas y motivar a más de alguno a seguir indagando sobre su desarrollo y

3

Motivación

utilidad.

Diego Iruretagoyena Oliveri

Estudiante de Ingeniería Civil en Computación UC

4

Introducción

Introducción

Vivimos en una época en donde prácticamente cada artefacto que usamos y transacción
que hacemos genera datos. Estos son fáciles de almacenar y manejar gracias al gran
desarrollo tecnológico de esta área. De hecho, hemos llegado al punto en donde es posible
almacenar toda la música del mundo con 600 dólares (como se explica en estos dos
reportes).

En estas cifras recide una historia y un comportamiento que podemos aprovechar,
interpretando su implicancia para sacar conclusiones, optimizar recursos y buscar
soluciones. El problema nace cuando estos datos se vuelven demasiado masivos y difíciles
de interpretar (y ahí es cuando nace el término Big Data).

Para poder realizar un análisis util de esta información, no sólo es necesario tener bases de
datos que sean fácilmente accesibles, si no también gente que sepa hacerlo. Esto se vuelve
problemático debido a la gama de habilidades que debe tener una persona para poder
aprovechar este recurso en su 100%. De hecho, según este reporte del McKinsey Global
Institute, existirá un gran deficit de talento analítico y administrativo necesario para tomar
real ventaja del gran potencial de la Big Data. Esto representa un desafío, ya que se estima
que se tendrán entre cuatro o cinco millones de trabajos para el 2018 en donde estas
habilidades serán cruciales, solamente en Estados Unidos.

Entonces, qué es Data Science ?

Data Science, o Ciencia de Datos, es básicamente un área de estudio en donde se extrae
conocimiento a partir de información previamente recolectados, mediante una serie de
técnicas en las que se incluye filtrar, analizar, visualizar, interpretar y, por supuesto,
programar.

Y qué tiene que ver Machine Learning ?

El área del Aprendizaje de Máquinas ha visto un desarrollo inesperado en los últimos 20
años, llegando a conseguir resultados con igual o mejor rendimiento que los humanos en
muchos ámbitos. Básicamente consiste en el uso de algoritmos que buscan relaciones en
nuestros datos y son capaces de "aprender" su comportamiento. La base de estos
algoritmos son las Redes Neuronales, operaciones matemáticas que imitan la capacidad del
cerebro para resolver problemas.

Hoy en dia, las redes neuronales son vistas como la forma de enseñarle a un computador a
aprender y a hacer cosas por su cuenta. Por ejemplo, las siguientes imágenes fueron
creadas por un computador en donde se entrenó un modelo en base a obras de arte.

5

Introducción

Hemos llegado al punto de poder enseñarle muchos ejemplos de obras y que el computador
invente variaciones nuevas y únicas.

"Inceptionism: Going Deeper into Neural Networks"

En resumen, Machine Learning, o Aprendizaje de Maquinas, es el uso de técnicas y
algoritmos para predecir y crear resultados a partir de datos recolectados. Con Machine
Learning buscamos generar un patrón o guía que nos sirva como base frente a una decisión
a tomar en algún caso parecido a algo que hayamos visto antes. Hasta hace algunos años,
estos algoritmos funcionaban de manera poco consistente, obteniendo buenos resultados
para algunas aplicaciones y malos para otras, hasta que hace poco empezaron a tener una
precisión exponencial. En esta guía pasaremos por la historia de cada uno de estos
conceptos y como ha sido la evolución de su rendimiento a través del tiempo.

6

Redes Neuronales

Redes Neuronales Artificiales

Como explica Fabian Westerheide en esta TEDxTalk, las redes neuronales son un intento
de imitar la realidad. Son la unidad básica de la Inteligencia Artificial y han tenido un
desarrollo exponencial en los últimos 20 años. Estas "neuronas" son las responsables de
que Tesla pueda crear autos autónomos, que Netflix pueda recomendarte películas y series,
que IBM pueda crear software que convierta audio en texto y que Amazon sepa que
productos debería sugerirte para aumentar sus ventas (sección 3.1).

Las redes neuronales son una clase de técnicas que podemos utilizar para predecir, estimar
y clasificar problemas. Usualmente, damos al computador una serie de instrucciones para
que repita multiples veces. Por el contrario, el cerebro humano esta optimizado para
aprender al generalizar desde la experiencia. Estas redes sirven para eliminar esa limitación
de los computadores y hacer que "el computador aprenda" sea posible.

Por qué se llaman "neuronas"?

Su nombre se basa en las neuronas dentro del cerebro humano. Los resultados obtenidos
en la aplicación de estas neuronas han logrado hacer que profesionales de todo el mundo
admitan que entrenar estas redes es básicamente tener la habilidad de ensenarle a un
computador

Cual es el beneficio que nos traen las redes neuronales ? Nos permiten ahorrar tiempo.
Sintetizan información y nos permiten tomar decisiones inteligentes.

https://www.youtube.com/watch?v=HPWa-8DgrHo

En su inicio, las redes neuronales artificiales nacieron gracias a un intento por los
investigadores de replicar el funcionamiento y las conexiones de las redes neuronales
cerebrales en un computador

7

Machine Learning

Machine Learning

En esta sección explicaré algunos conceptos básicos de Machine Learning, repasaré su
historia y evolución a través del tiempo y desarrollaré ejercicios a modo de ejemplo.

Listado de ejercicios

Clasificación de animales según el tamaño de su cerebro
Generación de caras humanas por medio de redes neuronales DCGAN
Predicción de acciones usando datos de La Bolsa de Comercio
Análisis y Visualización de sentimientos en redes sociales por comuna

Clasificacion: continua

Regresion: discreta

Aprendizaje supervisado

Le damos al modelo un datasets con etiquetas o tags para que aprenda a mapear la
relación entre la información y las etiquetas. Luego, nuestro modelo podrá resolver
problemas.

Clasificar modelo de auto.

conocemos características y tenemos ejemplos correctos donde podemos comparar

Aprendizaje no supervisado

Le damos al modelo información que no tiene etiquetas, sin feedback acerca de que esta
bien y que esta mal. Aprende solo cual es la estructura de la información es. La mayoría de
la información es asi.

No conocemos clasificaciones, busca estructuras o patrones sin saber que son

Reinforcement

Trial and error

This is where a model isn't given a feedback right off the bat, it only gets it if it achieves its
goal. So if we are trying to create a reinforcement learning bot that can learn to beat humans
at chess, it would only receive feedback if it won the game. Its linked to the idea of an
environment through trial and error

Supervised recibiría información en cada jugada, un supervised nunca.

Esta forma

8

Machine Learning

Le damos

Representación de un problema a través de un modelo

Nuestro objetivo es poder representar la situación que estamos analizando a través de
alguna función matematica que nos sirva como buen indicador y predictor

Si los números que buscamos son continuos: regresión

Si buscamos clasificar todo en ciertos valores, clasificación

2.

Function costo

Esta busca minimizar la diferencia entre la predicción y el resultado real.

Figuras Contour

Contiene muchas lineas Countour

una linea contour es la que tiene un valor constante

Metodo del gradiente

Learning step

Uso del metodo del gradiente para regresion lineal

Pequeño apéndice de algebra lineal

Matriz: Array of numbers

DimensionL roxXcolumnas

Vector: matriz de una columna

Operaciones:

Suma,

Escalar,

MatrizXvector

Propiedades de las matrices.

Classification multiple

Metodo del gradiente para multiples variables

Feature Scaling

9

Machine Learning

Idea: si ocupamos feautes que esten en una escala similar, el metodo del gradiente sera
mucho mas efectivo

Normalizacion

Feautes and polynomial regression

According to each excersise, we should look for
  • Links de descarga
http://lwp-l.com/pdf14096

Comentarios de: Machine Learning & Data Science (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad