PDF de programación - Manual para preparación de archivos HTML

Imágen de pdf Manual para preparación de archivos HTML

Manual para preparación de archivos HTMLgráfica de visualizaciones

Publicado el 30 de Julio del 2017
354 visualizaciones desde el 30 de Julio del 2017
2,5 MB
38 paginas
Creado hace 7a (08/03/2012)
Manual para preparación de archivos HTML

Julio /2011

UNAM. DGB. SciELO-México



INDICE

Introducción

Estructura de carpetas

Conversión de archivos a formato HTML

Estructura del documento

Código HTML

Imágenes y enlaces

Anexo A. Habilitar vínculos en imágenes

1

2

5

10

20

25

33

UNAM. DGB. SciELO-México

Introducción

La edición electrónica de revistas en las colecciones SciELO requiere cumplir con una serie de
requisitos para la realización del proceso de marcación de etiquetas, así como para la instalación de los
documentos en el sitio SciELO. Dichos requisitos tienen que ver con aspectos relacionados con el
código de los archivos HTML y la estructura y presentación de cada documento.

En virtud de que el sistema proporciona al usuario el texto completo de cada documento en formato
PDF y HTML, es necesario obtener cada documento en ambos formatos. El formato PDF forma parte de
los productos finales de la edición, pero la versión HTML tiene que obtenerse a partir de los archivos de
edición de la versión impresa en herramientas como InDesign, PageMaker o Word, o a partir del
archivo PDF. La versión del texto en HTML es requerida principalmente para la marcación de
metadatos y necesita de una adaptación especial para ello. Esta adaptación tiene como objetivo
cumplir tres aspectos: ajustar el documento del medio impreso al medio electrónico, uniformizar la
estructura de los documentos para facilitar su producción y, sobre todo, presentar los elementos del
documento en el orden conveniente para su marcación.

El siguiente esquema muestra las etapas que sigue una revista para su incorporación a SciELO:

Archivos electrónicos
recibidos

HTML



Conversión texto

HTML SciELO

Archivos HTML de

acuerdo con la

definición de
código SciELO

HTML

HTML

HTML

HTML

..…

InDesign
Word
PageMaker
Ventura
Quark
Latex



Carga en la

base de datos

Marcación y

Parser



Operación en Internet

Este manual comprende solamente los aspectos necesarios para crear la versión HTML de los
documentos, las demás etapas del proceso son tratadas en otro manual.

08/03/2012

1

UNAM. DGB. SciELO-México

Estructura de carpetas

Cuando una revista ingresa a SciELO se le asignan unas siglas que la identificarán en forma única en

todo el sistema, por ejemplo:

aneuroc

Archivo de Neurociencias

agritm

Agricultura Técnica de México

atm

Atmósfera

geoint

Geofísica Internacional

vetmex

Veterinaria México

Al asignar las siglas es necesario asegurarse que no hayan sido utilizadas en la colección SciELO, si

fuera el caso, habría que adicionarle otras letras para crear una nueva. A partir de este acrónimo se

crea una estructura de carpetas que contendrán la información de todos los fascículos de la revista.

El nombre de la carpeta de un fascículo específico deberá nombrarse con el volumen y número al que

corresponde, por ejemplo:



v102n3

Volumen 102 número 3

v8n24

n28

Volumen 8 número 24

Número 28

Los suplementos y números especiales se nombran de la siguiente manera:

v28nspe

Volumen 28 número especial

V53s1

Volumen 53 suplemento 1 (Suplemento de volumen)

v31n1s1

Volumen 31 suplemento del número 1 (Suplemento de número)

A su vez, para cada fascículo se crearán las carpetas <body>, <img>, <pdf> y <source>. Cada una

de las cuales contiene:

<body>

La versión HTML de cada artículo del fascículo.



contenido.

El nombre de cada archivo debe contener el volumen y número de la publicación, así

como el número correspondiente al orden en que aparece el documento en la tabla de



La extensión de los archivos con el código HTML debe ser .htm.

08/03/2012

2

UNAM. DGB. SciELO-México

Volumen(v) + número(n) + archivo(a)



<img>

Los archivos de las imágenes que contiene el fascículo.

Para que los nombres no sean muy largos sólo se toma en cuenta el artículo al cual

pertenece y el nombre del archivo de la imagen. Se sugiere que el nombre que se le

asigne a la imagen indique el tipo de imagen de que se trata, como se muestra en la

siguiente tabla:

a
e
f
g
m
t
… etc.

anexo
ecuación, esquema
foto, figura,
gráfica
mapa
tabla

Ejemplos:

La gráfica 3 del primer artículo:
La tabla 2 del quinto artículo:
La foto 10 del octavo artículo

La ecuación 15 del segundo artículo

a1g3.jpg
a5t2.jpg
a8f10.jpg
a2e15.jpg



<pdf>

La versión PDF de cada artículo de la revista.

Es indispensable contar con la versión PDF de cada uno de los documentos que

conforman un fascículo, esta versión generalmente se obtiene al finalizar la edición

impresa del fascículo y es proporcionada por el editor. Si se tiene un solo archivo PDF de

todo el fascículo, habrá que segmentarlo para obtener un archivo PDF por artículo.

08/03/2012

3

UNAM. DGB. SciELO-México



El nombre que se asigna a cada uno de los archivos PDF debe ser el mismo del archivo

HTML que le corresponde.

<source> Los archivos originales que el editor envió para su inclusión en SciELO.



Esta carpeta se creará sólo cuando el formato de los archivos originales no sea PDF.



Tanto los nombres de las carpetas como de los archivos que éstos
contengan deben escribirse en minúsculas, sin espacios o caracteres especiales.
Se sugiere que la longitud de estos nombres no sea de más de 8 caracteres.

08/03/2012

4

UNAM. DGB. SciELO-México

Conversión de archivos a formato HTML

La versión HTML puede obtenerse a partir de la versión original que entregó el editor en el formato del

software de edición de la versión impresa, es decir en InDesign, Corel, Word, PageMaker, Ventura, etc.

Para llevar a cabo este proceso es necesario identificar, en el software, la opción para exportar

información al formato HTML; cada programa, según su versión, puede ofrecer una variedad de

opciones de conversión, se elegirá la que ofrezca un código más sencillo y sin estilos. Es importante

señalar que cada software genera un código con ciertas particularidades que habrá que revisar.

Código HTML

SciELO requiere características específicas de código HTML, en general las etiquetas que se emplean

son básicas y no permiten el uso de estilos. Si estas características no se cumplen probablemente

resulte afectado el procesamiento del fascículo para su incorporación en el sitio SciELO. Dichas

características se especifican en la sección Código HTML.

Texto

Al obtener la versión HTML del fascículo es de suma importancia cuidar que el texto HTML sea fiel al

original, esto es, que no se altere o se pierda información. Para ello es conveniente cotejar la versión

HTML con la versión impresa o el PDF de la revista. Además debe asegurarse que los estilos del texto

(negritas, cursivas, etc.) del archivo original también se encuentren en el HTML, de no ser así habrá

que recuperarlo manualmente. En general, el texto debe seguir las indicaciones de formato de la

sección Estructura del documento.

Imágenes

Las imágenes pueden ser fotos, mapas, figuras, tablas, gráficas, esquemas, ecuaciones, etc., con su

respectivo encabezado o pie de imagen. No existe un tamaño patrón, lo más importante es que sean

legibles. En general, una conversión a HTML no deja las imágenes como se requieren, por lo que

frecuentemente es necesario recortarlas y extraerlas de la versión PDF del documento.

MAL

08/03/2012

5

UNAM. DGB. SciELO-México

Los textos frecuentemente contienen expresiones como fórmulas, ecuaciones o símbolos que no

pueden ser representados con código HTML. Éstos también serán tratados como imágenes:

BIEN

Cuando las expresiones sean complejas será recomendable también recortarlas como imágenes e

insertarlas en el texto HTML.



08/03/2012

6

UNAM. DGB. SciELO-México

Ejemplo de Conversión de Formato PDF a HTML

Por lo regular se cuenta con una versión PDF de la revista para iniciar su incorporación a SciELO.

A partir de la versión PDF de cada documento o artículo se obtendrá una versión HTML. Este proceso

puede realizarse con el software ABBY Transformer.

Ejecutar el programa

Cargar el archivo PDF

08/03/2012



7

UNAM. DGB. SciELO-México

Indicar que el archivo PDF

original se guardará como

HTML

El software informa el

nombre del archivo de salida

y el lugar donde lo dejará. Si

desea modificaciones use el

botón Cambiar

Ahora puede seleccionar el

botón de Finalizar para

hacer la conversión o

modificar las Opciones para

llevar a cabo una

recuperación más exacta

08/03/2012



8

UNAM. DGB. SciELO-México

En Opciones es posible

seleccionar el idioma del

texto del artículo. Si el

artículo contiene texto en dos

idiomas, puede seleccionar

un idioma secundario

Seleccione las opciones que

permitan optimizar la versión

HTML

La resolución debe seguir el

patrón para Internet de 72

dpi.



El resultado de la conversión es un archivo HTML y un conjunto de archivos con las imágenes que

contiene el artículo. El código HTML debe cumplir lo indicado en la sección Código HTML, el código

que no cumpla será eliminado. En general, las imágenes obtenidas con este procedimiento no

contienen el texto del pie de la imagen y tampoco cumplen con las dimensiones que SciELO especifica,

por este motivo deben eliminarse.

Las características y manejo de las imágenes dentro de un HTML se detallan en la sección Imágenes

y enlaces.

Para obtener las imágenes a partir del archivo PD
  • Links de descarga
http://lwp-l.com/pdf5860

Comentarios de: Manual para preparación de archivos HTML (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad