PDF de programación - Aplicaciones documentales de la recuperación de información

Imágen de pdf Aplicaciones documentales de la recuperación de información

Aplicaciones documentales de la recuperación de informacióngráfica de visualizaciones

Publicado el 4 de Octubre del 2019
141 visualizaciones desde el 4 de Octubre del 2019
1,1 MB
71 paginas
Creado hace 7a (15/11/2012)
Aplicaciones documentales de la

recuperación de información
aplicaciones prácticas para su mejor explotación documental



Manuel Blázquez Ochando

Monografías electrónicas

mblazquez.es



Aplicaciones documentales de la recuperación de información


BLÁZQUEZ OCHANDO, Manuel

Aplicaciones documentales de la recuperación de información:
aplicaciones para su mejor explotación documental / Manuel Blázquez
Ochando.– Madrid: mblazquez.es, 2012.

71p. ; 21cm.– (Libros y manuales de la Documentación; 1)
ISBN 978-84-695-6372-4



1. Biblioteconomía y Documentación 2. Recuperación de

Información 3. Tecnologías de la Documentación I. Título II. Series



025.4.036:02

BLA
apl



UNIVERSIDAD COMPLUTENSE DE MADRID
Facultad de Ciencias de la Documentación



1ªed. noviembre 2012, Madrid
© Copyright 2012. Manuel Blázquez Ochando
Publicado por mblazquez.es
ISBN 978-84-695-6372-4



1

Aplicaciones documentales de la recuperación de información

Índice

1.

Introducción .............................................................................................................. 3

2. Recuperación de información en bases de datos ....................................................... 4

3. Principios de SQL y sintaxis básica .......................................................................... 8

4. Operaciones de consulta SQL esenciales ................................................................ 12

5. Recuperación avanzada con SQL ............................................................................ 16

6. Sistemas de clustering ............................................................................................. 22

7. Sindicación de contenidos y recuperación de información ..................................... 30

8. Demostrador de procesos de sindicación de contenidos OrangeUp ....................... 43

9. Sistemas de recuperación masiva basados en técnicas de sindicación.................... 45

10.

Ejercicios prácticos .............................................................................................. 46

Práctica1. Recuperación en MySQL ........................................................................... 46

Práctica2. Consultas Fulltext ...................................................................................... 49

Práctica3. Asentando conocimientos de MySQL ....................................................... 54

Práctica4. Recuperación con Carrot2 .......................................................................... 59

Práctica5. Generación de canales de sindicación ........................................................ 62

Práctica6. Lectura y recuperación de canales ............................................................. 63

11.

12.

Índice de tablas .................................................................................................... 66

Índice de figuras .................................................................................................. 67

13. Bibliografía y referencias .................................................................................... 68



2

Aplicaciones documentales de la recuperación de información

Introducción

1.

La continua proliferación y crecimiento de la información publicada en la red, hace
necesario un conocimiento más profundo de las técnicas, herramientas y aplicaciones en
recuperación de información. En este sentido los sistemas de gestión de contenidos
también denominados CMS (Como Joomla o Drupal) han contribuido a facilitar la
organización de la información y al mismo tiempo multiplicar el número de vías y
medios de acceso a la misma. En este marco de trabajo también se circunscriben los
sistemas de redifusión o sindicación de contenidos, así como las herramientas y
modelos de recuperación.

Se consideran aplicaciones documentales en su sentido más amplio, todas aquellas
herramientas cognitivas de tipo clasificatorio, librario o informático que facilitan y
ayudan al documentalista en su actividad profesional. En el contexto en el que se
abordará la asignatura, en el de la recuperación de información, se consideran
aplicaciones documentales a los sistemas de redifusión y recuperación de información
bibliográfica sindicada (OrangeUp), sistemas de recuperación basados en técnicas de
agrupación o clustering (Carrot2), la metodología de consulta en bases de datos SQL,
sistemas de recuperación con expansión de consulta, los sistemas de indexación y
análisis de contenidos a gran escala (OmniFind), así como a los motores de
recuperación de alto rendimiento como (Apache Lucene).



3

Aplicaciones documentales de la recuperación de información

2. Recuperación de información en bases de datos

Qué es una base de conocimiento
Es cualquier colección o fondo documental que constituye el corpus de un sistema de
recuperación de información. Habitualmente esta base de conocimiento se organiza y
estructura en bases de datos para su mejor gestión, tratamiento y recuperación. Esto
significa que base de conocimiento puede ser desde un compendio de datos, cifras y
cadenas de texto inconexas, hasta documentos, referencias bibliográficas y compendios
informativos y semánticos con plena significación.

Qué es una base de datos
La base de datos es el sistema que posibilita la organización y estructuración de los
contenidos o bases de conocimiento en tablas y éstas a su vez en campos, de tal forma
que cada campo represente una característica o rasgo descriptivo de la información o
contenido registrado en la base de datos y cada tabla represente el dominio general que
se está almacenando. Por ejemplo una tabla de usuarios contendrá campos lógicos que
definan, describan e identifiquen a cada usuario. Por ejemplo el nombre, apellidos, DNI,
dirección, correo, sitio web, teléfono, código postal, etc. Dentro de las distintas tablas de
una base de datos es posible encontrar relaciones evidentes, ampliando la magnitud de
la información. Es el caso de las bases de datos relacionales. Por ejemplo la tabla
usuarios puede estar relacionada con la tabla préstamos en la que se relacionan los
documentos y materiales librarios que se les presta. Esta operación en todo caso
requiere de un campo clave de relación, que puede ser el identificador del usuario, sobre
el que se registra los datos del préstamo y el identificador del libro que se le está
prestando. Este mecanismo tan sencillo hace posible que distintas tablas queden
vinculadas y puedan ser contrastadas y filtradas. Pero una base de datos comporta
muchos más aspectos, el tipo de campos, sus características especiales para almacenar
determinados contenidos, por ejemplo datos binarios, imágenes, textos de gran
extensión, numeración en coma flotante, etc. Todos estos componentes hacen que
cualquier base de conocimiento pueda ser recogida sea cual sea su naturaleza y
características.



4

Aplicaciones documentales de la recuperación de información

Qué es un gestor de bases de datos
El manejo de las bases de datos habitualmente se lleva a cabo mediante comandos bien
definidos en terminales especializados, shell (Linux), cmd (Windows). Estos comandos
en la mayoría de los casos responden al lenguaje de consulta normalizado SQL
(Structured Query Language) con el que la base de datos entiende qué debe hacer.
Mediante este lenguaje es posible dar órdenes al sistema para que inserte un registro, lo
borre, lo edite y por supuesto recupere un determinado dato, información o documento.
Dado que este método de comunicación requiere un tecleado continuo para interactuar
con el sistema, se han desarrollado programas informáticos que llevan a cabo dicha
función de manera automática, facilitando al administrador un interfaz gráfico para la
edición, tratamiento y recuperación de la información. Estos programas que permiten
trabajar con las bases de datos, las tablas, los campos y los datos almacenados en ellas
se denominan gestores de bases de datos. Uno de los más conocidos y utilizados en todo
el mundo es PhpMyAdmin. Diseñado para trabajar principalmente con bases de datos
que emplean el lenguaje SQL.

Qué es MySQL
MySQL es la principal base de datos que alambica la web. Utiliza el lenguaje de
consulta SQL y es utilizada conjuntamente con el lenguaje de programación PHP para
crear las principales aplicaciones de la red. Normalmente actúa como un componente
más que se instala en el paradigma de desarrollo web WAMP (SO. Windows, Servidor
http Apache, BD MySQL, intérprete PHP), LAMP (SO. Linux, Servidor http Apache,
BD MySQL, intérprete PHP) o MAMP (SO. Mac, Servidor http Apache, BD MySQL,
intérprete PHP). Dicho de otra forma es la base de datos que sirve para almacenar la
mayoría de los datos y transacciones comunicativas que se producen en internet. Es
muy notable su utilización en Sitios Web, CMS (Content Management System) o
gestores de contenidos, Sistemas de Gestión Integral de Bibliotecas, Archivos, Museos
y un largo etcétera de herramientas y aplicaciones de software libre. Entre sus
características más importantes destaca su capacidad para ejecutar múltiples consultas
en distintos hilos de ejecución por segundo, gran capacidad de almacenamiento y motor
de almacenamiento que efectúa un proceso de indexación automático de los contenidos
y en
  • Links de descarga
http://lwp-l.com/pdf16652

Comentarios de: Aplicaciones documentales de la recuperación de información (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios
Es necesario revisar y aceptar las políticas de privacidad