Publicado el 15 de Diciembre del 2019
438 visualizaciones desde el 15 de Diciembre del 2019
1,1 MB
24 paginas
Creado hace 7a (09/10/2016)
Unidad 1)
Lenguajes de marcas
LMSGI, módulo del ciclo de FP de Grado Superior,
Administración de Sistemas Informáticos en Red
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
1.1) ordenador e información
LMSGI, módulo del ciclo de FP de Grado Superior,
Administración de Sistemas Informáticos en Red
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
¿Qué significa que el ordenador es una
máquina digital?
• Representa los datos con unos y ceros
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
¿Siempre ha sido digital?
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
¿Qué información es representable por una
computadora?
• Imágenes
• Texto
• Música
• Vídeos
• Mapas
• ….. cualquier cosa si la convertimos en unos y ceros
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
Formas de representar información en el
ordenador
• El ordenador es una máquina binaria
• TODA la información que almacena debe ser almacenada de forma
binaria
• Nº 9701100001
• Letra A01000001
• Color Malva 211 174 25211010011 10101110 111111000
• Una imagen Pasar todos los píxeles a binario
• Vídeo, sonido Muestras de cada sonido e imagen
• Codificación=Transformación de información a una forma binaria
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
Datos binarios y datos de texto
• En realidad todo es binario
• Datos binarios = (Comúnmente) Todo lo que no es texto
• Los humanos alfabetizados estamos muy textualizados
• Ejemplo. Intentar ver lo siguiente sin entender lo que pone,
como si fuera una mancha de color blanco:
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
Datos binarios y datos de texto
• Los humanos no podemos abstraernos así
• Para el ordenador la imagen inferior sólo es una secuencia
binaria más
• Para el ser humano, alfabetizado en caracteres latinos, es
claramente un texto
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto
•Un ordenador solo maneja datos binarios
•Consecuencia: El texto debe de convertirse en
binario
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto
•Problema:
• ñ (en sistema Windows clásico) = 241 = 11101101
• ñ (en la consola clásica de Windows) = 164=
10100100
•Cada sistema codificaba de una manera
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
1.2) codificación de texto
a binario
LMSGI, módulo del ciclo de FP de Grado Superior,
Administración de Sistemas Informáticos en Red
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto.
código ASCII
•ANSI creó una tabla llamada ASCII que
estandarizó la forma de codificar texto
•La tabla consta de 128 caracteres
•Usa 7 bits para codificar
•Problema: Sólo incluyó caracteres del inglés
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto.
código ASCII
•Para los símbolos no ingleses, se añadió un bit
más al ASCII = 256 caracteres
•ASCII extendido=8 bits
•Problema: Hay muchos ASCII extendidos
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto.
código Unicode
• Intenta arreglar el lío de los sistemas ASCII extendidos
• Cada símbolo de cada lengua tiene un valor
• Usa hasta 32 bits (caben billones de caracteres)
• Problema: El tamaño de los archivos de texto se
multiplica
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto.
código Unicode. implementaciones
• UTF-8:
• Tamaño variable para cada carácter (8,16,24 o 32 bits)
• 8 bits Caracteres del código ASCII original
• 16 bits Lenguas latinas, cirílicas, griegas, árabes, hebreas
y otras de Europa, Asia Menor y Egipto
• 24 bits Resto de símbolos alfabéticos (lenguas de Asia)
• 32 bits Símbolos, lenguas muertas,…
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
el problema de codificar texto.
código Unicode. implementaciones
• UTF-16
• Ocupan 16 (si son del tipo 1 y 2 anterior) y 32 bits
• UTF-32
• Cada carácter ocupa 32 bits
LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet
Códigos. Unicode. Implementaciones
• Ejemplo, texto 取得cigüeña
Comentarios de: Unidad 1) Lenguajes de marcas (0)
No hay comentarios