PDF de programación - Sistema de archivos de Google

<<>>
Imágen de pdf Sistema de archivos de Google

Sistema de archivos de Googlegráfica de visualizaciones

Actualizado el 21 de Marzo del 2018 (Publicado el 8 de Enero del 2018)
402 visualizaciones desde el 8 de Enero del 2018
1,1 MB
24 paginas
Sistema de archivos de Google

Mario Alonso Carmona Dinarte

A71437

Agenda
- Introducción

- Definición GFS

- Supuestos

- Diseño & Caracteristícas

- Ejemplo funcionamiento (paso a paso)

- Caracteristicas del Hadrware

- Conclusiones

Introducción



Definición



Supuestos

● El sistema esta construido de muchos componentes básicos

baratos que siempre fallan. Este debe constantemente
monitorearse y detectar, tolerar y recuperase prontamente de fallas
de componenes como parte de su rutina.

● El sistema almacena un modesto número de archivos grandes. Se
esperan unos cuantos millones de archivos, cada uno tipicamente
de 100 MB o más grandes. Archivos Multi-GB son el caso común
and deben ser manejados eficientemente. Archivos pequeños
deben ser soportados, pero no hay necesidad en su optimización.





● Las cargas de trabajo consisten en dos tipos de lecturas:

- Largas lecturas de tranmisión
- Pequeñas lecturas aleatorias

Supuestos





● Las cargas de trabajo también tiene muchas escrituras grandes y

secuenciales que anexan datos a los archivos.

● El sistema debe eficientemente implementar una semántica bien
definida para muchos clientes que anexan concurrentemente al
mismo archivo. Atomicidad con carga adicional de los recursos
(overhead) minima por sincornización es esencial.

● Ancho de banda alto y prolognado es más importante que baja

latencia. La mayoría de las aplicaciones ponen primero el
procesamiento de datos volumen a una alta velocidad, que un
rápida respuesta.

Diseño & Caracteristícas



Arquitectura

- Linux

-
64MB chun
ks

- 3 Replicas

- 64 bit
chunkhandl
er

- HeartBeat
Messages

- No cache
file data

Operaciones

- Create
- Open
- Read
- Write

- Append:
- Los clientes especifican solo los datos
- GFS elige el offset

- Snapshot
- Crear copias de grandes conjuntos de datos
- Crear checkpoints
- Mismo disco (+ rápido, - ancho de banda)

Funcionalidades
- Bitácora de operaciones (Operation log)

- "Leases" y orden de las mutaciones

- Flujo de datos (pipeline)
- B/T + RL: 1MB/100Mbps + 2*1ms= 80ms

Funcionalidades

- Recolección de Basura (cuando un archivo es eliminado)

- Detección de replicas obsoletas

- Creation, Re-replicación, Rebalanceo

- Integridad de los datos
- Shadow Master
- Chunks: Bloques de 64KB - 32bit checksum
- Verificación en periodos de inactividad

- Fast Recovery(Segundos - Terminación)

Ejemplo funcionamiento

Explicación paso a paso escritura

El cliente envía una solicitud al
Master para encontrar la
localización del servidor de trozos
que actua como la replica primaria.

El Master envía al cliente la
localización de las replicas de
servidores de trozos e identifica la
replica primaria.

El cliente envía los datos a
escribir a todos los servidores
de trozos, iniciando con el más
cercano y aplicando "pipeline"
de datos en el flujo.

Una vez que las replicas
reciben los datos, el cliente le
dice a la replica primaria que
inicie con con función de
escritura.

La replica primaria escribe los
datos en el trozo adecuado,
luego le dice a las otras replica
que hagan lo mismo.

Las replicas secundarias
completan la función de
escritura y se lo reportan a la
replica primaria.

La replica primaria envía la
confirmación a el cliente.

Fin del proceso

Caracteristicas de Hardware

- Dual 1.4 gigahertz Pentium III

- 2GB Ram memory

- 80GB disco duro

- Maquinas, Conexion Ethernet Full Duplex de 100 Mbps

- Switches HP 2524, conectados con una conexion de 1Gbps

Conclusiones









● No se necesita un hardware de última generación para tener un

sistema eficiente

● Se necesita un monitoreo constante en este tipo de sistemas

● La replicación es un precio justo a pagar por disponibilidad

● Transmisión directa de datos mejora la eficiencia y evita cuellos

de botella

● Manejo centralizado de meta-datos da grandes ventajas al sistema

en diversos aspectos

Bibliografía

[1] Ghemawat S, Gobioff H, Lueng S. (2003). “The Google File
System”. 19th ACM Symposium on Operating Systems Principles,
Lake George, NY, October, 2003

[2] Strickland J. “How Google File System Works”.Obtenido el
14 de Enero de 2012 de : http://computer.howstuffworks.
com/internet/basics/google-file-system5.htm

[3] Sin Autor. (2012). “How Google File System Works”.
Obtenido el 14 de Enero de 2012 de : http://en.wikipedia.
org/wiki/Google_File_System

Preguntas - Comentarios

Muchas Gracias!
  • Links de descarga
http://lwp-l.com/pdf8237

Comentarios de: Sistema de archivos de Google (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad