¿Por qué el 50% del contenido de cualquier texto está formado siempre por las mismas 100 palabras?

Una muestra más de que las matemáticas están en todas partes.

Ley de Zipf

La ley de Zipf es una distribución estadística sobre ciertos conjuntos de datos como por ejemplo el de las palabras de los idiomas, que viene a decir que la segunda palabra más utilizada se emplea la mitad de las veces que la primera, la tercera palabra más utilizada se emplea un tercio de las veces que la primera, la cuarta un cuarto y así sucesivamente.

Es decir, aproximadamente, la cantidad de veces que una palabra es usada en un idioma es 1/ranking que la primera palabra que más se usa.

Veámoslo con un ejemplo, en castellano, la palabra más usada es «de»

 

Ranking Palabra Frecuencia
1 de
2 la 1/2
3 que 1/3
4 el 1/4
5 en 1/5
6 y 1/6
7 a 1/7
8 los 1/8
9 se 1/9
10 del 1/10
11 las 1/11
12 un 1/12
13 por 1/13
14 con 1/14
15 no 1/15
16 una 1/16
17 su 1/17
18 1/18

 

Esto mismo ocurre con otros idiomas, incluso en idiomas ancestrales que en la actualidad no comprendemos, además es una herramienta que se puede utilizar para saber si un idioma es real o inventado.

Es curioso que toda lengua, siendo esta materia tan alejada de las matemáticas, siga esta ley – aunque no sabemos el motivo.

Realmente esta ley tiene mucho que ver con el Principio de Pareto en el sentido de que el 20% de las palabras provoca el 80% del texto de un libro o una conversación, veámoslo:

Principio de Pareto

El Principio de Pareto, también llamado regla del 80/20, es un fenómeno estadístico que dice que normalmente en cualquier población que da lugar a un efecto o resultado, esta se puede repartir en dos grupos en una proporción 80/20 aproximadamente, de modo que el grupo minoritario (20%) provoca el 80% de ese efecto.

Todo surgió porque Vilfredo Pareto se dio cuenta de que el 80% del suelo en Italia lo poseía sólo el 20% de la población.

Así planteo cosas como que el 20% de la población se reparte el 80% de la riqueza mientras que el 80% solo se reparte el 20.

Hay que hacer notar que esa proporción es aproximada, no en todos los casos es así, pero la esencia de la idea del principio sí. Esto lo vemos en la vida cotidiana continuamente:

El 20% del trabajo da lugar al 80% de lo que queremos hacer, es decir, el 20% del esfuerzo da como resultado el 80% del producto final, el resto ya es quizás necesario (o no) pero menos importante.

El 20% de los clientes de una empresa proporcionan el 80% de los beneficios.

El 80% de los errores informáticos son causados por el 20% de las incidencias en el código.

El 80% de las quejas que recibe una empresa son producidas por el 20% de los clientes.

El 20% de las personas utilizan el 80% de los recursos sanitarios.

Solo un 20% de las cosas que hacemos son las que nos proporcionan el 80% de nuestra felicidad.

Podríamos seguir así viendo muchos ejemplos, el 80% de la información que consulto en libros está en el 20% de los libros de mi biblioteca, etc. Una moraleja podría ser que debemos focalizar nuestro esfuerzo en ese 20% del trabajo que nos va a dar como consecuencia el 80% del resultado.

The following two tabs change content below.

Juanjo Bravo

Matemático. Entusiasta de las Matemáticas y de las TIC. Trabajo en el departamento de informática de un banco.