PDF de programación - Introducción a los Lenguajes de marcas

Imágen de pdf Introducción a los Lenguajes de marcas

Introducción a los Lenguajes de marcasgráfica de visualizaciones

Publicado el 16 de Diciembre del 2019
370 visualizaciones desde el 16 de Diciembre del 2019
1,8 MB
36 paginas
Creado hace 7a (18/07/2016)
Introducción a los

Lenguajes de marcas

LMSGI, módulo del ciclo de FP de Grado Superior,
Administración de Sistemas Informáticos en Red

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

[1] ordenador e información

LMSGI, módulo del ciclo de FP de Grado Superior,
Administración de Sistemas Informáticos en Red

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

Formas de representar información en el
ordenador

• El ordenador es una máquina binaria
• TODA la información que almacena debe ser almacenada de forma
binaria
• Nº 9701100001
• Letra A01000001
• Color Malva 211 174 25211010011 10101110 111111000
• Una imagen  Pasar todos los píxeles a binario
• Vídeo, sonido Muestras de cada sonido e imagen
• Codificación=Transformación de información a una forma binaria

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

Datos binarios y datos de texto

• En realidad todo es binario
• Datos binarios = (Comúnmente) Todo lo que no es texto
• Los humanos alfabetizados estamos muy textualizados
• Ejemplo. Intentar ver lo siguiente sin entender lo que pone,
como si fuera una mancha de color blanco:

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

Datos binarios y datos de texto

• Los humanos no podemos abstraernos así
• Para el ordenador la imagen inferior sólo es una secuencia
binaria más
• Para el ser humano, alfabetizado en caracteres latinos, es
claramente un texto

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto

•Un ordenador solo maneja datos binarios
•Consecuencia: El texto debe de convertirse en
binario

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto

•Problema:

• ñ (en sistema Windows clásico) = 241 = 11101101
• ñ (en la consola clásica de Windows) = 164=
10100100

•Cada sistema codificaba de una manera

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

[2] codificación de texto a

binario

LMSGI, módulo del ciclo de FP de Grado Superior,
Administración de Sistemas Informáticos en Red

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto.
código ASCII

•ANSI creó una tabla llamada ASCII que
estandarizó la forma de codificar texto
•La tabla consta de 128 caracteres
•Usa 7 bits para codificar
•Problema: Sólo incluyó caracteres del inglés

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto.
código ASCII

•Para los símbolos no ingleses, se añadió un bit
más al ASCII = 256 caracteres
•ASCII extendido=8 bits
•Problema: Hay muchos ASCII extendidos

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto.
código Unicode
• Intenta arreglar el lío de los sistemas ASCII extendidos
• Cada símbolo de cada lengua tiene un valor
• Usa hasta 32 bits (caben billones de caracteres)
• Problema: El tamaño de los archivos de texto se
multiplica

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto.
código Unicode. implementaciones
• UTF-8:

• Tamaño variable para cada carácter (8,16,24 o 32 bits)
• 8 bits  Caracteres del código ASCII original
• 16 bits  Lenguas latinas, cirílicas, griegas, árabes, hebreas
y otras de Europa, Asia Menor y Egipto
• 24 bits  Resto de símbolos alfabéticos (lenguas de Asia)
• 32 bits  Símbolos, lenguas muertas,…

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

el problema de codificar texto.
código Unicode. implementaciones
• UTF-16

• Ocupan 16 (si son del tipo 1 y 2 anterior) y 32 bits

• UTF-32

• Cada carácter ocupa 32 bits

LMSGI-Unidad 1-Lenguajes de marcas
Jorge Sánchez, www.jorgesanchez.net
@jorgesancheznet

Códigos. Unicode. Implementaciones
• Ejemplo, texto 取得cigüeña
  • Links de descarga
http://lwp-l.com/pdf17044

Comentarios de: Introducción a los Lenguajes de marcas (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad