Psicología Online PIR Estadística Índices de variabilidad

Psicología Experimental: Índices de tendencia central, de variabilidad y asimetría

Índices de variabilidad

Muchas veces, necesitamos disponer de información sobre en qué medida las puntuaciones en una determinada variable están próximas o alejadas del índice de tendencia central que representa a la distribución.

Amplitud total

La amplitud total, AT, de un conjunto de puntuaciones es la distancia que hay en la escala numérica entre los valores que representan la puntuación máxima y la puntuación mínima. Es decir:

AT = Xmax - Xmin

Hay que distinguir entre dos tipos de amplitud total:

  • 1. La amplitud total excluyente, que toma los valores informados
  • 2. La amplitud total incluyente, que toma los valores reales.

Este índice tiene el inconveniente de tomar en consideración sólo dos puntuaciones: la mas alta y la mas baja, por lo que, siempre que estas permanezcan constantes, es insensible a las variaciones del resto de puntuaciones. La amplitud total también suele ser denominada rango o recorrido.

Amplitud semi-intercuartil

La amplitud semi-intercuartil, Q, o rango semi-intercuartil es la distancia media entre el tercer y el primer cuartil.

La amplitud semi-intercuartil es un índice muy útil cuando las distribuciones presentan valores extremos, con los consiguientes efectos de asimetrización.

En el ámbito de la psicología, este índice se utiliza con frecuencia, sobre todo cuando se quiere evaluar la variabilidad de características en las que el índice de centralidad mas adecuado es la mediana en lugar de la media.

Es el caso, por ejemplo, de la evaluación y selección de ítems en las escalas de actitudes. A este índice de variabilidad se le conoce también como índice de ambigüedad.

Desviación media

Es la media de las diferencias en valor absoluto de n puntuaciones respecto de su media aritmética.

El hecho de que en este índice se tomen las diferencias en valor absoluto de cada puntuación respecto de la media aritmética se deriva de la primera propiedad de este índice de tendencia central.

Este no es un índice de variabilidad muy empleado, porque los valores absolutos son poco manejables matemáticamente, y apenas hay técnicas de análisis estadístico que estén basadas en él.

Varianza y desviación típica

Otra solución a la descripción de la variabilidad de una distribución consiste en establecer un promedio de las diferencias de cada puntuación respecto a su media, pero elevadas al cuadrado, ya que la suma de las diferencias de cada puntuación respecto a su media es cero (primera propiedad de la media).

Al índice así definido se le denomina varianza, y se representa por S2. habitualmente, y sobre todo cuando se consideran varias variables, suele acompañarse como subíndice el nombre de la variable considerada.

Cálculo

Cuando los datos están agrupados en intervalos, la varianza es la media, ponderada por la frecuencia, de las diferencias cuadráticas del punto medio de cada intervalo respecto a la media aritmética del conjunto de puntuaciones.

Cuando un estudiante se acerca por primera vez al concepto de varianza, el resultado le puede sugerir una total falta de relación entre el valor que se obtiene y los datos de la distribución sobre la que se calcula.

La razón de esta aparente falta de relación es que la distancia de los puntos medios de cada intervalo a la media está elevada al cuadrado , para evitar el inconveniente de la primera propiedad de la media aritmética.

Esto significa que la varianza está expresada en términos del cuadrado de las unidades en que está medida la variable (si la variable está medida, por ejemplo, en gramos, la varianza estará expresada en gramos al cuadrado).

Para retornar a las unidades originales se extrae la raíz cuadrada de la varianza, obteniendo así un índice que sí está expresado en las unidades originales en que fuera medida la variable.

Este índice se conoce como desviación típica o desviación estándar (Sx).

La varianza, por ser un índice definido en función de las distancias cuadráticas de cada puntuación respecto de la media, solo puede tomar valores positivos.

El valor mínimo de la varianza es cero, y este valor se obtendrá solo cuando todas las puntuaciones sean iguales.

Para la desviación típica, al ser la raíz cuadrada de la varianza, se toma siempre su valor positivo, pues de lo que informa este índice es de distancias, y no tiene sentido hablar de distancias negativas.

En el tema anterior se mencionó que la media muestral es el mejor estimador de la tendencia central de la población de la que se ha extraído la muestra. En cambio, para el caso de la varianza poblacional, su mejor estimador es la cuasivarianza.

Para el calculo de la cuasivarianza, tomaremos el sumatorio de las diferencias de cada puntuación con respecto a su media elevadas al cuadrado, pero dividido por n -1.

Para las mismas muestras, la cuasivarianza será siempre mayor que la varianza. No obstante, a medida que el tamaño de las muestras aumenta, los valores de ambos índices son muy similares (par muestras, por ejemplo, de tamaño 100 la cuasivarianza es 1'010101 veces mayor que la varianza).

Propiedades de la varianza y la desviación típica:

  • 1. si a un conjunto de puntuaciones medidas en la variable X se le suma una constante a, la varianza y la desviación típica de las nuevas puntuaciones es idéntica a la varianza y la desviación típica de las puntuaciones originales.
  • 2. si a un conjunto de puntuaciones medidas en la variable X se le multiplica por una constante b, la varianza de las nuevas puntuaciones es igual a la varianza de las puntuaciones originales multiplicada por el cuadrado de b. Es decir, si

Yi = b · Xi

Entonces,

Sy2 = b2 · Sx2

Por consiguiente la desviación típica será:

Sy = ½b½· Sx

La razón de tomar el valor absoluto es que, en el caso de que b<0, la desviación típica de las puntuaciones transformadas tendría un valor negativo, y como ya se ha señalado, no tiene sentido hablar de desviaciones típicas negativas.

Estas dos propiedades se pueden resumir en una sola: si X es una variable, con varianza Sx2, la varianza de una nueva variable Y que es una transformación lineal de X, es decir,

Y = bXi +a

será:

Sy2 = b2Sx2

  • 3. La varianza y la desviación típica, por depender de la media, son sensibles a la variación de cada una de las puntuaciones. Cuando las puntuaciones están agrupadas en intervalos, la varianza y desviación típica están en función de los intervalos elegidos (de su amplitud y de sus limites).
  • 4. La varianza total de r grupos de puntuaciones, de los que se conoce el tamaño nj, la media y la varianza es igual a la media ponderada de las varianzas mas la varianza ponderada de las medias.
Coeficiente de variación

La desviación típica viene expresada en la unidad en que se haya medido una característica concreta.

Si se comparan la variabilidad de dos muestras mas o menos homogéneas en cuento a la composición de sus miembros, el empleo de la varianza o de la desviación típica no plantea ningún inconveniente.

El problema surge cuando se trata de comparar características muestrales de distinta naturaleza.

No se puede, por ejemplo, comparar la variabilidad de la altura, expresada en centímetros, con la variabilidad del peso, expresada en gramos. Una desviación típica de 3 cm no es mayor, igual ni menor que otra de 3 gramos.

Incluso cuando se mide la misma característica en dos muestras de diferente naturaleza, tampoco tiene sentido comparar la variabilidad mediante la varianza o la desviación típica. Imaginemos una muestra de 100 mariposas y otra de 100 osos.

Una misma desviación típica de, por ejemplo, 5 gramos en los dos grupos, implicaría que los osos tienen prácticamente el mismo peso sin que apenas exista variabilidad y para las mariposas, por su parte, la variabilidad seria tan alta que alguna de ellas podría parecer un oso.

Por tanto, la comparación de las desviaciones típicas de la misma variable en grupos de distinta naturaleza resulta siempre equivoca.

Una forma de comparar variabilidades de características de diferente naturaleza, o de la misma naturaleza en diferentes grupos, es tomar como medida de variabilidad el cociente entre la desviación típica y la media.

El resultado de este cociente es un numero abstracto que indica el numero de veces que el numerador (la desviación típica) contiene al denominador (la media), con independencia de la unidad en que haya sido medida la variable. A este índice así obtenido, multiplicado por cien, se le denomina coeficiente de variación.

> Siguiente: Índices de sesgo o asimetría