Comparar dos archivos binarios
Publicado por Santi (5 intervenciones) el 05/10/2018 12:43:49
Saludos,
Es bien sabido los comandos para comparar archivos binarios a través de consola calculando hash de infinidad de maneras y comandos.
El problema viene cuando he de comparar varios millones de archivos (Sí. Han oído bien, 7 MILLONES DE ARHIVOS BINARIOS)
Cualquier cosa que pruebo me supone semanas de proceso en el servidor.
el sistema más rápido que he encontrado ha sido comparar su tamaño obtenido con ls:
TamArch1=$( TamanoArchivo "Archivo1" )
TamArch2=$( TamanoArchivo "Archivo2" )
.
.
.
function TamanoArchivo(){
TamanoArchivo=$( ls -l "$1" | awk '{print $5}' )
echo "$TamanoArchivo"
}
Pero me parece una solución poco elegante con el inconveniente de que puede darse la casualidad de que sean diferentes archivos pero con el mismo tamaño.
Alguien propone otra solución (más rápida)
Gracias
Es bien sabido los comandos para comparar archivos binarios a través de consola calculando hash de infinidad de maneras y comandos.
El problema viene cuando he de comparar varios millones de archivos (Sí. Han oído bien, 7 MILLONES DE ARHIVOS BINARIOS)
Cualquier cosa que pruebo me supone semanas de proceso en el servidor.
el sistema más rápido que he encontrado ha sido comparar su tamaño obtenido con ls:
TamArch1=$( TamanoArchivo "Archivo1" )
TamArch2=$( TamanoArchivo "Archivo2" )
.
.
.
function TamanoArchivo(){
TamanoArchivo=$( ls -l "$1" | awk '{print $5}' )
echo "$TamanoArchivo"
}
Pero me parece una solución poco elegante con el inconveniente de que puede darse la casualidad de que sean diferentes archivos pero con el mismo tamaño.
Alguien propone otra solución (más rápida)
Gracias
Valora esta pregunta
0