Percentil q (pq)

Una medida de posición muy útil para describir una población, es la denominada 'percentil'. En forma intuitiva podemos decir que es un valor tal que supera un determinado porcentaje de los miembros de la población.

Por ejemplo, considere un curso de cuarenta alumnos que se forma en línea por orden de estatura, primero los grandes y al final los chicos. Suponga, además, que se considera ‘chico’ a un alumno de la cuarta parte final de esta línea.

Éste es un concepto relativo a este curso, con toda seguridad variará al referirse a otro. Es fácil aceptar que los ‘chicos’ de octavo básico tienen menor estatura que los ‘chicos’ de cuarto medio.

Como la cuarta parte corresponde al 25% de la población, en el ejemplo que se menciona, los chicos de un curso, son aquellos cuya estatura no supera el ‘percentil veinticinco’ de la población formada por los alumnos del curso.

Si una variable pudiese asumir muchos valores, la representación de la proporción del total, menor o igual que un valor, tendría una forma creciente parecida a la siguiente:

       

Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple

 

Como puede verse, el valor de la variable bajo el cual se encuentra un 20% de los valores, es algo mayor que 2.

En forma aproximada se podría conocer los percentiles usando este tipo de gráfico.

La descripción intuitiva de ‘percentil’ en una población continua, como la anterior, no es difícil de entender. Sin embargo, la definición en una muestra de tamaño finito puede resultar más difícil porque, en este caso, los valores que representan las proporciones acumuladas tienen una representación gráfica en forma de escalera.

 

Ejemplo.

Considere los siguientes datos de una muestra de tamaño 10.

4   8   11  12   13   16   18   19   21   22

En una muestra de tamaño n, cada dato representa 1 enésimo del total. En este caso, en que hay diez datos, esta proporción es un décimo. En el gráfico, puede observarse que la gráfica muestra un salto de un décimo (10%) en cada dato muestral. El primer salto se observa en el número 4,el menor de los datos. Antes del valor 4, la curva asume el valor cero y a partir de él, un décimo. El segundo salto se produce en 8, a partir del cual la gráfica comienza a valer dos décimos. Así se producen los saltos hasta alcanzar el valor uno (100%) a partir del último dato muestral 22.

Si en este ejemplo se decide calcular el percentil 25, se observa que la recta horizontal trazada a la altura del 25%, cruza la gráfica de escalera justo al llegar al tercer dato ordenado (11), por lo tanto, éste es el valor buscado. (Nótese que percentiles cercanos, mayores que 20 y menores que 30, tienen el mismo valor 11).

 

Sin embargo, si se desea calcular un percentil que coincida con una proporción asociada a un dato de la muestra, se produce una indefinición. Tómese el caso del percentil 20. En este caso la línea horizontal que busca cortar la gráfica de escalera, coincide justamente con un tramo horizontal de ésta; el que corre a la altura del 20% entre los datos muestrales 8 y 11. Cualquier valor entre 8 y 11 podría ser considerado como el percentil 20.

Más adelante se usará una convención para encontrar salidas a esta indefinición.

La presentación gráfica hecha anteriormente corresponde a la siguiente definición de percentil:

 

Definición.

Sea q un número real tal que 0<=q<=100. El percentil q ( pq ). es un valor del recorrido de las observaciones tal que:

1º. A lo menos q% de las observaciones son menores o iguales que pq.

2º. A lo menos (100-q)% de las observaciones son mayores o iguales que pq.

Para calcular un percentil, no es práctico usar esta definición. 

Resulta más conveniente usar la siguiente regla que se deduce de la misma.

 

Para obtener el percentil q (0<q<100), se ordenan los datos de menor a mayor y se calcula el número

Si no es entero, el percentil está dado por:

Esto es, el dato cuyo orden es el entero inmediatamente superior a .

 

Si es entero, el percentil cumple la siguiente condición:

Es decir, pq se encuentra entre dos datos de orden consecutivo. El menor es el de orden dado por y el mayor es el dato siguiente en la muestra ordenada.

 

En el caso del ejemplo anterior, el percentil 25 se obtuvo calculando en primer lugar el 25% de 10, dado que éste es el tamaño n de la muestra. Entonces, está dado por . Por lo tanto, el entero inmediatamente superior es 3. En consecuencia, el percentil 25 es el tercer dato en el orden creciente; es decir 11. Tal como ya se determinó gráficamente.

Al calcular el percentil 20, tenemos que , valor entero. Por lo tanto, el percentil 20 es cualquier número entre el segundo y tercer dato ordenado. Es decir, cualquier número entre 8 y 11.

NOTA.

El cálculo de un percentil de una muestra presenta algunas dificultades por tratarse de un conjunto de datos en que se producen incrementos de la proporción acumulada en forma de saltos, y no suavemente como en el caso de una variable continua. Estos saltos representados por un gráfico de escalera son los que producen situaciones indefinidas en los casos que se indicó anteriormente.

Sin embargo, el uso inicial del gráfico de escalera y alguna ejercitación con la fórmula de cálculo, ayudan a entender un procedimiento que en un comienzo aparece mucho más difícil.

CÓMO DECIDIR EN EL CASO DE MÚLTIPLES SOLUCIONES PARA UN PERCENTIL.

Como se viO anteriormente, existen situaciones en el cálculo de un percentil muestral en las que todo un intervalo de números reales cumple con las condiciones de ser el percentil buscado. Esta respuesta no es útil porque habitualmente se necesita un único valor como resultado.

Para obtener este único resultado hay diversas soluciones. Aquí se usará aquella que calcula un punto de intervalo entregado por el cálculo anterior usando el mismo porcentaje que define al percentil.

El procedimiento es el siguiente:

1. Se calcula la longitud del intervalo

mediante la diferencia de sus extremos.

2. La longitud calculada anteriormente se multiplica por el porcentaje que define el percentil.

3. El valor obtenido en 2. se suma al límite inferior del intervalo calculado. Este resultado es el percentil buscado.

 

Ejemplo.

Como se vio en los cálculos precedentes, el percentil 20 del conjunto de datos usado se encuentra entre 8 y 11. Aplicando el procedimiento recién descrito, calculamos la longitud del intervalo.

Ésta resulta ser 11 - 8 = 3.

A continuación calculamos el 20% de 3 y obtenemos 0.6.

En consecuencia, el percentil 20 para este caso es 8 + 0.6 = 8.6.

 

Comentario.

 

No hay sólo un criterio para calcular percentiles muestrales. De hecho, importantes programas de computación estadística entregan resultados diferentes debido a que usan criterios similares, pero no iguales. No debe causar sorpresa, entonces, encontrar estas diferencias originadas por la falta de un procedimiento universalmente aceptado.

 

Algunos ejemplos de percentiles.

Mediana.

La mediana  es el percentil 50.

Cuartiles.

El primer cuartil , es el percentil 25.

El tercer cuartil , es el percentil 75.

Deciles.

El k-ésimo decil, k entero entre 0 y 10, es el percentil 10*k.

Ejemplo.

En la tabla siguiente se presentan treinta datos simulados y ordenados, que permitirán practicar el cálculo de percentiles muestrales.

8

135

592

678

806

945

58

190

651

717

880

960

65

217

674

730

888

970

119

260

675

738

903

980

129

491

677

741

944

983