Estadísticas del código: Distancia con N-Gramas - Perl

Imágen de perfil

Distancia con N-Gramas


Perl

Publicado el 11 de Octubre del 2020 por Administrador (718 códigos)
831 visualizaciones desde el 11 de Octubre del 2020
En este algortimo la medida de similaridad se puede establecer mediante la siguiente fórmula:
Esta fórmula se conoce como el coeficiente de Dice, donde:
N = Número de gramas utilizados.
C = Número de gramas únicos que comparten las hileras.
Ai = Número de gramas únicos de una hilera.

Los valores de d(i,j) se encuentran en el intervalo [0,1] y entre más cercano a cero sea el valor de "d", más diferentes son las hileras comparadas.

41 visualizaciones durante los últimos 90 días


6
0