Código de Python - Mini Batch

Mini Batch

Python

Publicado el 26 de Septiembre del 2023 por Hilario (145 códigos)

755 visualizaciones desde el 26 de Septiembre del 2023

Cuaderno-Aula-B78-26-Sep-Rv-0.py

El Descenso de Gradiente Mini Batch (Mini Batch Gradient Descent en inglés) es una variante del algoritmo de Descenso de Gradiente que se utiliza comúnmente para entrenar modelos de aprendizaje automático, especialmente en problemas de optimización de grandes conjuntos de datos. El Descenso de Gradiente Mini Batch combina las ideas del Descenso de Gradiente Estocástico (SGD) y el Descenso de Gradiente por Lotes (Batch Gradient Descent).

Aquí están los conceptos clave del Descenso de Gradiente Mini Batch:

Descenso de Gradiente por Lotes (Batch Gradient Descent): En este enfoque, se calcula el gradiente de la función de pérdida utilizando todo el conjunto de datos de entrenamiento en cada iteración del algoritmo. Esto significa que se actualizan los parámetros del modelo una vez por ciclo completo a través del conjunto de datos. El enfoque Batch GD puede ser costoso en términos de memoria y tiempo de cómputo, especialmente para conjuntos de datos grandes.

Descenso de Gradiente Estocástico (SGD): En este enfoque, se calcula y actualiza el gradiente utilizando un solo ejemplo de entrenamiento en cada iteración. Esto conduce a actualizaciones de parámetros más frecuentes, pero a menudo más ruidosas y menos precisas. Aunque es más rápido y consume menos memoria que el enfoque por lotes, puede ser menos estable en la convergencia y requerir más iteraciones.

Descenso de Gradiente Mini Batch: En lugar de utilizar todo el conjunto de datos o un solo ejemplo de entrenamiento, el Descenso de Gradiente Mini Batch se encuentra en algún punto intermedio. Divide el conjunto de datos de entrenamiento en pequeños subconjuntos llamados mini lotes o mini-batches. Luego, en cada iteración, calcula y aplica las actualizaciones de gradiente utilizando uno de estos mini lotes en lugar del conjunto de datos completo o un solo ejemplo.

Las ventajas del Descenso de Gradiente Mini Batch incluyen:

Eficiencia computacional: Al utilizar mini lotes, se pueden aprovechar las ventajas del procesamiento paralelo y reducir la carga en la memoria, lo que lo hace más eficiente que el Descenso de Gradiente por Lotes en términos de tiempo y recursos.

Mayor estabilidad y convergencia: Comparado con SGD, el Descenso de Gradiente Mini Batch tiende a proporcionar actualizaciones de parámetros más estables y una convergencia más suave hacia el mínimo global de la función de pérdida.

Mejor generalización: En muchos casos, el Descenso de Gradiente Mini Batch puede conducir a modelos que generalizan mejor en comparación con SGD, ya que los mini lotes proporcionan un término medio entre el ruido de SGD y la lentitud de Batch GD.

El tamaño del mini lote es un hiperparámetro que debe ajustarse durante el entrenamiento del modelo. Suele ser un valor entre 16 y 256, pero puede variar según el problema y el conjunto de datos. El Descenso de Gradiente Mini Batch es una técnica muy comúnmente utilizada en el entrenamiento de redes neuronales y otros modelos de aprendizaje automático debido a su eficiencia y capacidad para encontrar mínimos globales de manera efectiva.

Requerimientos

Cuaderno-Aula-B78-26-Sep-Rv-0.py
********************************
Ejecucion bajo consola linux:
python3 Cuaderno-Aula-B78-26-Sep-Rv-0.py
***************************************
Realizado en Plataforma linux.
Ubuntu 20.04.6 LTS.
Editado con Sublime Text,

V-0.

Publicado el 26 de Septiembre del 2023

gráfica de visualizaciones de la versión: V-0.

756 visualizaciones desde el 26 de Septiembre del 2023

"""

 Cuaderno-Aula-B78-26-Sep-Rv-0.py

 ********************************

 Ejecucion bajo consola linux:

 python3 Cuaderno-Aula-B78-26-Sep-Rv-0.py

 ***************************************

 Realizado en Plataforma linux.

 Ubuntu 20.04.6 LTS.

 Editado con Sublime Text,

"""

import numpy as np

import matplotlib.pyplot as plt

# Función de costo de ejemplo (cuadrática)

def cost_function(theta):

    return theta**2

# Gradiente de la función de costo (derivada)

def gradient(theta):

    return 2 * theta

# Descenso de gradiente mini batch

def mini_batch_gradient_descent(X, y, learning_rate=0.01, batch_size=2, num_epochs=4):

    theta = np.random.rand()  # Inicialización aleatoria de theta

    cost_history = []

    for epoch in range(num_epochs):

        for _ in range(0, len(X), batch_size):

            batch_X = X[_:_+batch_size]

            batch_y = y[_:_+batch_size]

            gradients = gradient(batch_X)

            theta -= learning_rate * np.mean(gradients)

            cost = np.mean(cost_function(batch_X))

            cost_history.append(cost)

    return theta, cost_history

# Datos de ejemplo

X = np.linspace(-5, 5, 10)

y = cost_function(X)

# Aplicar el descenso de gradiente mini batch

final_theta, cost_history = mini_batch_gradient_descent(X, y)

print("Historia:\n")

for historia in cost_history:

  print(historia)

print("*****************")

print(f'Theta final:\n {final_theta}')

print("*****************")

# Graficar la función de costo a lo largo de las iteraciones

plt.plot(cost_history,color='black',marker='o',markerfacecolor='red')

plt.xlabel('Iteración')

plt.ylabel('Costo')

plt.title('Descenso de Gradiente Mini Batch')

plt.show()

"""

SALIDA POR CONSOLA:

***************************

Historia costos:

20.061728395061728

5.246913580246913

0.30864197530864174

5.2469135802469165

20.061728395061728

20.061728395061728

5.246913580246913

0.30864197530864174

5.2469135802469165

20.061728395061728

20.061728395061728

5.246913580246913

0.30864197530864174

5.2469135802469165

20.061728395061728

20.061728395061728

5.246913580246913

0.30864197530864174

5.2469135802469165

20.061728395061728

*****************

Theta final:

--------------

 0.7717043133232641

*****************

"""

Comentarios sobre la versión: V-0. (0)

No hay comentarios

Comentar la versión: V-0.


Nombre

Correo (no se visualiza en la web)

Valoración

Comentarios...

CerrarCerrar

Es necesario revisar y aceptar las políticas de privacidad

Acepto las políticas de privacidad

http://lwp-l.com/s7442

Tags:
python

Vectores-Descenso de gradiente.

MiniBatch-Datos-Aleatorios

Código de Python - Mini Batch

Requerimientos

V-0.

Comentarios sobre la versión: V-0. (0)

Comentar la versión: V-0.

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.