Utilizaci´on de Matlab en clusters y grids
Marco Bonilla, Gabriela Gangotena e Iv´an Bernal
Departamento de Electr´onica Telecomunicaciones y Redes de la Informaci´on (DETRI)
[email protected]
Resumen
Con el fin de disponer de capacidad computacional, equivalente incluso al encontrado en poderosas y costo-
sas supercomputadoras, se pueden utilizar clusters y grids. En el DETRI se han estructurado clusters y se desea
ahora conocer si es posible estructurar un grid operacional en nuestro medio. El mini-grid implementado se estruc-
tura en base al middleware Globus Toolkit. La interoperabilidad entre sistemas operativos brindada por el middleware
empleado, permite la integraci´on de un cluster al mini-grid mediante el despliegue de un servicio web. El cluster
es desarrollado en base a las herramientas de paralelizaci´on y computaci´on distribuida de Matlab, corriendo bajo
Windows; el consumo del servicio web puede realizarse desde clientes del mini-grid, desarrollados en Windows o
Linux. Adicionalmente, se emplea la infraestructura del mini-grid con una aplicaci´on en el campo del electromag-
netismo, adaptada para su ejecuci´on en el cluster. Al final, se dispone de una infraestructura que integra recursos
heterog´eneos, computadoras de granularidad variable: desde una computadora personal a un cluster, y corriendo
diversos sistemas operativos; estos componentes, aunque en n ´umero reducido, permiten estructurar un grid total-
mente operacional y adecuado para servir como un testbed para diferentes prop´ositos.
Palabras claves: Cluster, Grid, Globus Toolkit, Sistema Operativo.
1
Introducci´on
La falta de poder computacional a gran escala, al ser-
vicio de instituciones acad´emicas y de investigaci´on en
el Ecuador, es un factor fundamental que ha limitado
el desarrollo de varias ´areas de importancia; altos re-
querimientos computacionales son t´ıpicos en aplicacio-
nes cient´ıficas y de ingenier´ıa [1]. Esto sugiere la ne-
cesidad de incursionar en soluciones que permitan cu-
brir estos requerimientos con inversiones menores a las
asociadas en adquirir infraestructuras basadas en super-
computadoras tradicionales como las Cray/SGI T3E.
do la imagen de una ´unica computadora o instrumento
virtual [5][6].
Lo que se desea entonces es conocer c´omo estructurar
un grid, en nuestro caso, con recursos de bajo costo ad-
quiridos localmente, para lo cual se realizan pruebas con
diversas configuraciones con los equipos disponibles, y
alternativas de middleware y aplicaciones.
Es clara, entonces, la importancia de adquirir, adap-
tar, aplicar, difundir y propiciar el empleo de la tecno-
log´ıa de grids en diversas ´areas, sean ´estas acad´emicas,
cient´ıficas o comerciales. Se podr´a entonces obtener una
mejor relaci´on costo/beneficio de las inversiones en in-
fraestructura y acceder a campos que resultaban prohibi-
tivos por los elevados montos de inversi´on involucrados
anteriormente.
Alta capacidad computacional puede obtenerse tam-
bi´en empleando clusters y grids. Los clusters son conglo-
merados de computadoras personales independientes,
de bajo costo, de caracter´ısticas similares, interconecta-
das con tecnolog´ıas de red de alta velocidad y, general-
mente, con software de libre distribuci´on, ubicadas en
un mismo entorno f´ısico [2][3], bajo una misma adminis-
traci´on y pol´ıticas, y trabajan de forma coordinada para
dar la ilusi´on de un ´unico sistema [3][4]. Los grids se con-
forman agrupando recursos heterog´eneos (supercompu-
tadoras, clusters, instrumentos, etc., y empleando diver-
sos sistemas operativos), geogr´aficamente distribuidos,
pertenecientes a diversas instituciones y cada una con
su propia pol´ıtica de administraci´on; todos estos recur-
sos pueden ser utilizados como recursos unificados dan-
El uso de soluciones a bajo costo en el ´ambito de la
computaci´on distribuida en el DETRI, ha permitido la
implementaci´on de clusters en base a herramientas de
software libre [8]. En lo que se refiere al desarrollo de
aplicaciones, se ha empleado MPI (Message Passing In-
terface). Con los resultados obtenidos se plantean en este
proyecto sobre grids los siguientes objetivos:
• Implantar el testbed1 para un grid de c´omputo de ta-
ma ˜no limitado (mini-grid), pero con los suficientes re-
cursos para llevar a cabo experimentaciones bajo esce-
1Testbed es un ambiente de desarrollo que se usa para pruebas de concepto en un ambiente controlado y puede incluir: hardware, software
y componentes de red.
106
Utilizaci´on de Matlab en clusters y grids
narios reales reducidos.
• Evaluar diversas alternativas de middleware para grids
para configurar la parte relativa a software del grid con
la mejor alternativa que se ajuste a las aplicaciones a
ejecutarse en el mini-grid.
• Explotar las capacidades del mini-grid a trav´es de por-
tales grid que faciliten la interacci´on del usuario final
con las aplicaciones del grid.
Se eval ´ua el middleware gLite (empleado en los pro-
yectos europeos EGEE y EELA-2) y el middleware Globus
Toolkit (GT4). El mini-grid implementado se estructura en
base a GT4 (open source), que se consider´o la alternativa
adecuada.
La infraestructura del mini-grid de c´omputo integra
computadoras personales (f´ısicas y virtuales), un cluster
y dispone del software necesario para que sea operacio-
nal, adem´as se emplean ruteadores para simular un am-
biente WAN con la conexi´on de dos centros remotos.
La gran aceptaci´on de Matlab en la comunidad
acad´emica y cient´ıfica [7] ha demandado mejor soporte
para el desarrollo de aplicaciones que requieren de gran
capacidad de procesamiento, lo que se ha reflejado en
la disponibilidad, dentro de Matlab, de herramientas de
paralelizaci´on y computaci´on distribuida para el desa-
rrollo de infraestructuras de clusters.
En uno de los centros remotos se implementa un clus-
ter computacional mediante el uso de las herramientas
de Matlab, en computadoras con el sistema operativo
Windows y se adapta una aplicaci´on de elementos fini-
tos para su ejecuci´on en el cluster.
2 Material
A continuaci´on, se detalla las caracter´ısticas de hardwa-
re y software de los equipos que conformaci´on el mini -
grid:
Tabla 1. Router Cisco R1 y R2
2.1 Recursos de Red
Para la conformaci´on del ambiente WAN en el labora-
torio se utiliz´o dos ruteadores de iguales caracter´ısticas
(Tabla 1), denominados R1 y R2.
2.2 Recursos Computacionales
detalle
El
reales y virtuales se presenta a continuaci´on:
computacionales
recursos
de
los
Tabla 3. hosta
Hostname: hosta
Componente de Hardware
Procesador
Memoria
Disco duro
Tarjeta de red
Intel Pentium IV de 3.0 GHz
4 GB
100 GB Samsung SP1223N (ide)
100 GB ATA Samsung SP1213c (sata)
RLT/8169 Gigabit Ethernet
Sistema Operativo
Software
Linux - CentOS 5.2
Globus Toolkit 4.0.7
Tabla 4. hostc
Hostname: hostc
Componente de Hardware
Procesador
Memoria
Disco duro
Tarjeta de red
Intel Pentium IV de 3.0 GHz
4 GB
100 GB Samsung SP1223N (ide)
100 GB ATA Samsung SP1213c (sata)
RLT/8169 Gigabit Ethernet
Sistema Operativo
Software
Linux - CentOS 5.2
Globus Toolkit 4.0.7
Hostname: R1-R2
Router Cisco 1841
IOS
Procesador
Interfaces
C1841-IPBASE-M
FTX132580WA
2 FastEthernet
2 Seriales
Portales grid. Un portal es una interfaz com ´un, una en-
trada a un conjunto de servicios distribuidos que pueden
ser accedidos desde un navegador. Se configur´o un nodo
para ejecutar un portal grid con OGCE (Open Grid Com-
puting Environments Collaboratory) y basado en portlets2
disponibles y compatibles con JSR 168 y servicios web.
Tabla 2. Switch
Switch Cnet
Modelo CGS-800
8 puertos Gigabit Ethernet
10/100/1000 Mbps
3 M´etodos
3.1
Implementaci´on del Mini-Grid de
C´omputo
La infraestructura de red del mini-grid est´a basada en la
serie de protocolos de TCP/IP y el middleware Globus
Toolkit 4.
2Portlets: son componentes modulares de las interfaces de usuario gestionadas y visualizadas en un portal web.
Revista Polit´ecnica, 2010, Vol. 29(1): 106–112
107
Marco Bonilla, Gabriela Gangotena e Iv´an Bernal
Tabla 5. M´aquina Real n1 y de M´aquinas Virtuales n3 y hostd
Hostname: n1
Procesador
Memoria
Disco duro
Tarjeta de red
Componente de Hardware
Intel(R) Core (TM) 2 Quad de 2.66
GHz
8 GB
500 GB Samsung HD502IJ (sata)
500 GB Samsung HD502IJ (sata)
Intel PROset V12.0 Gigabit Ethernet
Software
Sistema Operativo Windows XP 64 bits
VMware Workstation
Matlab 7.0.6.324 (R2008a)
Hostname: n3 (M´aquina Virtual)
Componente de Hardware
Memoria
Disco duro
4 GB
16 GB
Software
Sistema Operativo Windows XP 32 bits
Globus Toolkit 4.0.7
Matlab 7.0.6.324 (R2008a)
Hostname: hostd (M´aquina Virtual)
Componente de Hardware
Memoria
Disco duro
4 GB
100 GB
Software
Sistema Operativo
Linux - CentOS 5.2
Globus Toolkit 4.0.7
Esquema de Direccionamiento y Enrutamiento. El es-
quema de direccionamiento se lo realiza utilizando di-
recciones IP est´aticas para identificar a los recursos debi-
do a que varios de los servicios son en base a la direcci´on
IP y todos los recursos deben estar siempre identificados.
Para compartir informaci´on y recursos, en un am-
biente geogr´aficamente distribuido, se requiere conec-
tividad entre m ´ultiples redes. Se utiliza enrutamiento
est´atico para conectar las redes remotas.
Diagrama de Red. El diagrama de red de la Figura 1
muestra el diagrama de red del mini-grid, y se observa la
posibilidad de comunicarse entre los centros remotos a
trav´es del Internet con el uso de direcciones IP p ´ublicas
y empleando TCP/IP y Globus Toolkit para el desarrollo
de un sistema distribuido en un ´area geogr´afica global.
La Figura 1 tambi´en refleja las m´aquinas virtuales que se
crearon en las m´aquinas reales n1 y n2.
Tabla 6. M´aquina Real n2 y de la M´aquina Virtual n4
Hostname: n2
Procesador
Memoria
Disco duro
Tarjeta de red
Componente de Hardware
Intel(R) Core (TM) 2 Quad de 2.66
GHz
8 GB
500 GB Samsung HD502IJ (sata)
500 GB Samsung HD502IJ (sata)
Intel PROset V12.0 Gigabit Ethernet
Software
Sis
Comentarios de: Utilizacion de Matlab en clusters y grids (0)
No hay comentarios