PDF de programación - Tendencias actuales de Investigación en Bases de Datos

Imágen de pdf Tendencias actuales de Investigación en Bases de Datos

Tendencias actuales de Investigación en Bases de Datosgráfica de visualizaciones

Actualizado el 21 de Marzo del 2018 (Publicado el 12 de Enero del 2018)
1.493 visualizaciones desde el 12 de Enero del 2018
679,2 KB
58 paginas
Creado hace 16a (12/10/2007)
Tendencias actuales deInvestigación en Bases de DatosClaudia Deco - Cristina BenderMails: [email protected]@fceia.unr.edu.ar Objetivo :!presentar un panorama de las tendencias deinvestigación en bases de datos y búsquedade información.!presentar los proyectos de investigación enlos que estamos trabajando En la actualidad, se trabaja en ...DatawarehouseBases de datos espaciales, temporales ….Sistemas de recuperación de informaciónDatos en la Web DatawarehouseLas aplicaciones de BD se pueden clasificar en:!procesamiento de transacciones!sistemas de ayuda a la decisión!Almacenes de datos (Datawarehouse)."Análisis de datos (OLAP)."Minado de datos (Datamining). es un depósito de información integrada a partir devarias fuentes guardada según un esquemaunificado en un único lugar.Fuente de datos 1Fuente de datos 2Fuente de datos nExtractionTransfor- mationLoadDBMSDWherramientas de análisis yde consulta: OLAP, DM, ...Datawarehouse (DW) Problemas!Esquema que debe utilizarseEl DW debe:"integrar los esquemas (diseño) de las distintas fuentes de datos y"convertir los datos al esquema integrado antes de guardarlos.!Momento y manera de recoger los datos"arquitectura orientada a orígenes de datos (las fuentes de datostransmite la información nueva)"arquitectura orientada a destinos de datos (el almacén de datossolicita los datos a las fuentes). Problemas!Propagación de las actualizacionesSi se modifican los esquemas (diseño) de los orígenes de datos, estodeberá propagarse al DW.!Datos que se deben resumir"Los datos generados por sistemas transaccionales son grandes paraalmacenarlos."Muchas consultas para la toma de decisión se pueden resolver a partir dedatos resumidos obtenidos por agregación. OLAP: Análisis de datosPara resumir los datos se utilizan:!funciones de agregación"en SQL son limitadas => se extiende SQL!histogramas"existen extensiones de SQLSELECT percentil, avg(saldo) FROM cuentaGROUPBY N_tile(saldo, 10) AS percentil!agregación sobre varios atributos"tablas de referencias cruzadasSELECT color talla, sum(numero) FROM ventasGROUPBY color, talla WITH CUBE.Modelo n-dimensional (n atributos), generará un n-cubo de 2n vérticesSe definen operadores de refinamiento de consultas sobre n-cubos Data MiningEs la búsqueda de información de importancia ó“descubrimiento del conocimiento”en grandes volúmenes de datos.!La información obtenida puede representarse mediante unconjunto de reglas.Ejemplo:“las mujeres jóvenes con ingresos mensuales superiores a$5000 son las personas con mayores probabilidades decomprar coches deportivos de tamaño pequeño”. Tipos de reglasClasificación:Encontrar reglas que dividan los datos en grupos disjuntos.Intenta descubrir reglas que clasifiquen datos nuevos enbase a datos históricosEjemplo: clasificar a un nuevo cliente para conceder ó no un crédito.Asociación:Encontrar reglas que asocien datos de las transacciones.Ejemplo: ! transacción T, compra (T,pan) # compra (T, leche)donde: T es una variable, rango(T) = {todas las transacciones}. Bases de Datos TemporalesEjemplo:¿Quién ha trabajado en ventas más tiempo de loque Juan trabajó con un sueldo de $20000?Aplicaciones:!Bancarias,!Controles de personal,!Registros médicos,!Inventario,!Programación de reservas (avión, tren, hoteles...),!Aplicaciones científicas (ej. monitoreo del tiempo). !En una base de datos temporal cada hechoregistrado tiene una marca de tiempo.!Tiempo válido: conj. de intervalos de t durante losque el hecho es verdadero.!Tiempo de transacción: intervalo de t durante elcual ese hecho es cierto en el sistema de BD.!Relación temporal:"cada tupla tiene un t asociado cuando es verdadera."Se define Algebra Temporal, SQL Temporal Registran información en puntos, líneas y regiones.El espacio de interés puede ser:"Una abstracción bidimensional de la superficie de la tierra."Un modelo del cerebro humano."Una representación 3D de la disposición de una cadena demoléculas de proteína."etc.Bases de Datos Espaciales Qué necesita ser representado? Algunas operaciones !Predicados espaciales que devuelvan valores booleanos.$Relaciones topológicas: igual, disjunto, adyacente, intersección,cubre, contiene, fuera, etc.$Orden espacial: detrás, en_frente, debajo, por_sobre, etc.$Relaciones direccionales: norte, sur, este, noreste, etc.!Operaciones espaciales que devuelvan valores numéricos.$Área, perímetro, diámetro, distancia, maxdist, mindist, etc.!Operaciones espaciales que devuelva nuevos objetos espaciales.$Operaciones de construcción: unión, intersección, diferencia,centro, borde, etc.$Operaciones de transformación: extender, rotar, trasladar, etc.!Operaciones en colecciones de objetos espacialmente relacionados.$Operaciones generales: voronoi, mascercano, componer,descomponer, etc.$Operaciones para particiones: fusión, superimposición, cubrir, etc.$Operaciones para redes: camino_mas_corto, etc.Operaciones Espaciales EjemplosEncontrar los nombres de todos los países que son vecinos de USA.SELECT C1.Name AS “Vecinos de USA”FROM Country C1, Country C2WHERETouch(C1.Shape, C2.Shape) = 1 AND C2.Name = ´USA´Encontrar los países que atraviesan todos los ríos listados en la tabla River.SELECT R.Name, C.NameFROM River R, Country CWHERECross(R.Shape, C.Shape) = 1 Bases de Datos Espacio - TemporalesEs un sistema de base de datos cuyos objetos tienen unageometría que cambia a lo largo del tiempo-> sistemas que tienen la capacidad de gestionar geometrías en cambiocontinuoPor ejemplo:!Sistema de control del tráfico!Sistema de gestión catastral (parcelas cambian su formacon el tiempo) Ejemplo en STSQLSe agregan nuevos tipos de datos:“moving point” y “moving region” :Flights (id:string, from:string, to:string, route: mpoint)Encontrar una ruta entre dos instantes de tiempo:SELECT trajectory (Route(7:00..9:00))FROM flightsWHERE id=”UA207” Tecnologías de las dos culturasLa Web nos provee de:!Una infraestructura global y un conjunto de estándares quesoportan el intercambio de documentos.!Un formato de presentación para hipertextos. (HTML)!Interfaces bien diseñadas para recuperación de documentos.(Técnicas de recuperación de información)!Es la base de datos más grande.Bases de Datos y Web Tecnologías de las dos culturasLas bases de datos, nos ofrecen:!Técnicas de almacenamiento y lenguajes de consulta, queproveen acceso eficiente a grandes cuerpos de datos muyestructurados.!Modelos de datos, y métodos para estructurar datos.!Mecanismos para mantener la integridad y consistencia delos datos. Surge la necesidad de un Puente parapoder consultar a la Web como a una base de datosSolución:• Un formato nuevo, XML, para intercambiar datos con estructura.• Un nuevo modelo de datos semiestructurados, que relaja la sintaxis de sistemas de base datos muy estructurados. !Son datos sin esquema o auto-descriptibles!La información sobre la estructura está junto con losdatos.!Representación mediante una lista de etiquetas-valor.Ejemplo:{ name: {first: "Pablo", last: “Pérez"}, age: 44, email: [email protected]}Datos Semiestructurados Componentes básicos: - elemento (texto)- etiquetas (definidas por el usuario)Ejemplo:<people> <person> <name> Alan </name> <age> 42 </age> <email> [email protected] </email> </person> <person> <name> Patsy </name> <age> 36 </age> <email> [email protected] </email> </person></people>XML !Describen los elementos disponibles en un documento XML.!Esto introduce el concepto de:"Documento-bien-formado (los tags se abren y se cierran)"Documento-válido (tiene un DTD asociado).Ejemplo<!DOCTYPE db [ <!ELEMENT db (person*)> <!ELEMENT person (name,age,email)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)> <!ELEMENT email (#PCDATA)>] >DTD Lenguajes de marcado!XML (eXtensible Markup Language), con sus respectivos DTD(Document Type Definition): para intercambio de datos!RDF (Resource Description Framework): recomendado comoestándar para los metadatos.!OWL (Ontology Web Language): estándar para realizaranotaciones de ontologías en la web"es un lenguaje para publicar y compartir ontologías en la web"desarrollado por el W3C . RDF!Permite la descripción y el procesamiento de metadatos de cualquier dominio!Usa XML como lenguaje de baseEjemplo “La página web http://www.infovis.net fue creada por Juan”Sujeto: http://www.infovis.net (recurso)Predicado: creada (propiedad, tiene un creador)Objeto: Juan (el valor de la propiedad)<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:s="http://description.org/schema/"> <rdf:Description about="http://www.infovis.net"> <s:Creador>Juan</s:Creador> </rdf:Description></rdf:RDF> Ontologías"Permiten representar el conocimiento en la web."Definen conceptos y relaciones de algún dominio."Consisten de términos, sus definiciones y axiomas.-Los axiomas permiten inferir conocimiento que no esté indicadoexplícitamente en la taxonomía de conceptos. OWL!Usa XML como lenguaje de baseEjemplo<owl: Class rdf:ID=“Female”><rdfs:subClassOF rdf:resource:”#Animal”/><owl:disjointWith rdf:resource:”#Male”/><owl: Class> Recupera datos con la mejorcoincidencia con el patrón dado.IR versus Data RetrievalDados:!Un corpus de documentos textuales enlenguaje natural.!Una consulta de usuario en la forma de unstring de texto.Encontrar:!Un conjunto rankeado de documentos queson relevantes para la consultaInformation Retrieval Realizada una búsqueda: el conj. de docs recuperados no coincide totalmente con el conj. de docsrelevantes sobre el tema de interés.Una búsqueda será óptima cuando estos dos conjuntos coincidan% todos los docs recuperados sean relevantes y todos los docs relevantes sean recuperados.Docs. Recu-peradosDocs. Rele-vantes Problemas con los datos"Datos distribuidos."Datos volátiles. (dinámica de Internet)"Gran volumen. (crecimiento exponencial de la Web)."Datos no est
  • Links de descarga
http://lwp-l.com/pdf8295

Comentarios de: Tendencias actuales de Investigación en Bases de Datos (0)


No hay comentarios
 

Comentar...

Nombre
Correo (no se visualiza en la web)
Valoración
Comentarios...
CerrarCerrar
CerrarCerrar
Cerrar

Tienes que ser un usuario registrado para poder insertar imágenes, archivos y/o videos.

Puedes registrarte o validarte desde aquí.

Codigo
Negrita
Subrayado
Tachado
Cursiva
Insertar enlace
Imagen externa
Emoticon
Tabular
Centrar
Titulo
Linea
Disminuir
Aumentar
Vista preliminar
sonreir
dientes
lengua
guiño
enfadado
confundido
llorar
avergonzado
sorprendido
triste
sol
estrella
jarra
camara
taza de cafe
email
beso
bombilla
amor
mal
bien
Es necesario revisar y aceptar las políticas de privacidad