Bases de Datos - Duplicados en BD

 
Vista:

Duplicados en BD

Publicado por Eusebio Perez (1 intervención) el 24/01/2001 02:49:00
Tengo una BD en la que se han introducido registros de clientes (Nombre, calle, poblacion...) algunos registros se han introducido varias veces pero no de la misma forma...
ej:
NAME STREET CITY
============= ==================== =========
JUAN ROMERO PSO. MARAGALL 336 MADRID
ROMERO, JUAN PASEO MARGALL, 336 MADRID

alguien me puede decir la forma de detectar estos registros que a simple vista se ven que son el mismo? Gracias.
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder

RE:Duplicados en BD

Publicado por Oscar Duarte (8 intervenciones) el 24/01/2001 04:56:24
Eusebio:
Este es un problema serio y complejo.
En primer lugar la tabla donde se registran los clientes debe tener una columna que permita identificarlos en forma individual, independiente del nombre, por ejemplo: Cédula de Identidad, Rol Unico Nacional, Rol Unico Tributario, Número del servicio social, etc. Un dato que identifica en forma única a la persona.

Luego si el volumen de tus datos no es muy alto, te sugiero que hagas el proceso de detección de duplicidades a ojo, es decir, emites un listado donde determinas cuales son los registros a eliminar.

En el caso de que el numero de registros sea muy alto tendrás que hacer un proceso que tendrá que emitir un informe de los registros con un cierto grado de coincidencia, por ejemplo: los que tengan 100% de igualdad en el nombre, o 100% de igualdad en la dirección.

Analizando el informe debes decidir cuáles registros eliminar.

Luego repetir el proceso pero por ejemplo buscando coincidencias entre una o más palabras del nombre, o de la dirección, etc.

El proceso necesariamente es repetitivo, permitiendo depurar los datos, pero no se puede asegurar un éxito del 100%.

Hay algoritmos que permiten efectuar búsquedas fonéticas en los que te puedes apoyar ( CE = SE = ZE; KA = CA; etc.)

Espero que te ayude en algo este comentario. Si no podemos seguir conversando.

Saludos,
Oscar.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar

RE:Duplicados en BD

Publicado por Oscar Duarte (8 intervenciones) el 24/01/2001 05:05:01
PD: Había olvidado decir que la columna de identificación debe constituírse en una "Clave" que no permita duplicados.

Oscar Duarte.
Valora esta respuesta
Me gusta: Está respuesta es útil y esta claraNo me gusta: Está respuesta no esta clara o no es útil
0
Comentar