Teoría Clásica de test
Un test es un instrumento científico en la medida en que mide lo que pretende, es decir, es válido, y mide bien, o sea, es preciso o fiable. Si nos encontramos con un instrumento del que no podemos fiarnos de las medidas que proporcionan, ya que varían de una vez a otra cuando medimos el mismo objeto entonces diremos que no es fiable. Un instrumento, para medir correctamente algo, ha de ser preciso, porque de no ser así, mida lo que mida, lo medirá mal. Por lo tanto, ser preciso es una condición necesaria pero no suficiente. Además, ha de ser válido, es decir, que lo que mide con precisión sera lo que se pretende medir, y no otra cosa.
Fiabilidad :
Fiabilidad absoluta y relativa : Podemos abordar el problema de la fiabilidad de un test de dos formas distintas, aunque en el fondo coincidentes.
La fiabilidad como la inexactitud de sus medidas: Cuando un sujeto responde a un test obtiene una puntuación empírica, que está afectada por un error. Si no hubiera error alguno, el sujeto obtendría su puntuación verdadera. El test es impreciso porque la puntuación empírica no coincide con la auténtica puntuación verdadera. Esta diferencia entre ambas puntuaciones es el error muestral, el error de medida. El error típico de medida será la desviación típica de los errores de medida. El error típico de medida indica la precisión absoluta del test, ya que permite estimar la diferencia entre la medida obtenida y la que se obtendría si no hubiera error.
La fiabilidad como la estabilidad de las medidas: Un test será más fiable cuanto más constantes o estables se mantengan los resultados que proporciona cuando se repite. Cuanto más estables sean los resultados en dos ocasiones, mayor será la correlación entre ellos. A esta correlación se le denomina coeficiente de fiabilidad. Éste nos expresa, no la cuantía del error, sino la coherencia del test consigo mismo y la constancia de la información que ofrece. El coeficiente de fiabilidad expresa la fiabilidad relativa del test.
El coeficiente de fiabilidad y el índice de fiabilidad : - El coeficiente de fiabilidad de un test es la correlación del test consigo mismo, obtenida por ejemplo, en dos formas paralelas: rxx. - El índice de precisión es la correlación entre las puntuaciones empíricas de un test y sus puntuaciones verdaderas : rxv El índice de precisión siempre será mayor que el coeficiente de fiabilidad Para averiguar el coeficiente de fiabilidad son de destacar estos tres métodos clásicos:
- Hallar la correlación entre el test y su repetición : El método de la repetición o método del test-retest : Consiste en aplicar el mismo test al mismo grupo en dos ocasiones y se calcula la correlación entre las dos series de puntuaciones. Dicha correlación es el coeficiente de fiabilidad. Este método suele dar un coeficiente de fiabilidad más alto que los obtenidos por otros procedimientos, y puede estar contaminado por los factores perturbadores.
- Hallar la correlación entre dos formas paralelas del test : El método de las formas paralelas : Se preparan dos formas paralelas del mismo test, es decir, dos formas equivalentes que den la misma información, y se aplican al mismo grupo de sujetos. La correlación entre las dos formas es el coeficiente de fiabilidad. Con este método, al no repetirse el mismo test, se evitan las fuentes perturbadoras de la fiabilidad del re-test.
- Hallar la correlación entre dos mitades paralelas del test : El método de las dos mitades : Se divide el test en dos mitades equivalentes y se halla la correlación entre éstas. Es el método preferible, ya que es sencillo y soslaya las limitaciones de los procedimientos anteriores. Se pueden elegir los elementos impares del test, para constituir una mitad, y los elementos pares para constituir la otra.
El coeficiente de fiabilidad y la correlación entre tests paralelos
El coeficiente de fiabilidad de un test indica la proporción que la varianza verdadera es de la varianza empírica : gráfico33 El coeficiente de fiabilidad de un test varía entre 0 y 1 . Por ejemplo: si la correlación entre dos tests paralelos es rxx´ = 0'80, significa que el 80% de la varianza del test se debe a la auténtica medida, y el resto, es decir, el 20% de la varianza del test se debe al error. El índice de fiabilidad de un test es la correlación entre sus puntuaciones empíricas y sus puntuaciones verdaderas índice fiabilidad = El índice de fiabilidad es igual a la raíz cuadrada del coeficiente de fiabilidad
Una vez elaboradas dos formas paralelas de un test, se aplica el procedimiento del análisis de varianza para comprobar la homogeneidad de las varianzas y la diferencia entre las medidas. Si las varianzas son homogéneas, la diferencia entre las medias no es significativa y las dos formas están construidas con el mismo número de elementos del mismo tipo y contenido psicológico, puede afirmarse que son paralelas. Si no es asi, hay que reformarlas hasta que lo sean. La ausencia de fiabilidad se identifica con el valor rxx´= 0 4.- El error típico de medida : La diferencia entre la puntuación empírica y la verdadera es el error aleatorio, llamado error de medida. La desviación típica de los errores de medida recibe el nombre de error típico de medida. El error típico de medida permite hacer estimaciones acerca de la fiabilidad absoluta del test, o sea, estimar cuánto error de medida afecta a una puntuación.
Fiabilidad y longitud : La longitud del test se refiere al número de sus elementos. De esta longitud depende su fiabilidad. Si un test consta de tres elementos, un sujeto puede obtener en una ocasión una puntuación de 1 y en otra, o en una forma paralela, una puntuación de
De una ocasión a otra, la puntuación han variado un punto; un punto sobre tres es una variación del 33%, una variación elevada. Si los sujetos obtienen variaciones casuales de este tipo, la correlación del test consigo mismo o la de las dos formas paralelas del test, será rebajada enormemente y no podrá ser alta. Si el test es mucho más largo, si tiene, por ejemplo, 100 elementos, un sujeto puede obtener 70 puntos en una ocasión y 67 en una forma paralela. De una a otra vez ha variado 3 puntos; es una varianza relativamente pequeña en relación con el test total, concretamente el 3%. Estas pequeñas alteraciones casuales de esta magnitud, que se producen en las puntuaciones de los sujetos, al pasar de una forma a la paralela, son relativamente poco importantes y no disminuirán tanto como antes la correlación entre ambas.
El coeficiente de fiabilidad será mucho mayor que en el caso anterior. La ecuación de Spearman-Brown expresa la relación entre la fiabilidad y la longitud. La precisión de un test es nula cuando la longitud es 0, y va aumentando a medida que aumenta la longitud. Aunque el aumento es relativamente menor a medida que la longitud de que se parte es mayor. Esto significa que la precisión crece mucho al principio y relativamente menos después. Cuando la longitud tiende a infinito, el coeficiente de fiabilidad tiende a
Al aumentar la longitud de un test, se incrementa su precisión porque aumenta la varianza verdadera a un ritmo más alto que la varianza error. Esto supone que la precisión del test aumenta porque disminuye la proporción de varianza que se debe al error. La fórmula de Rulon, así como la fórmula de Flanagan y Guttman, son especialmente aplicables cuando se calcula el coeficiente de fiabilidad por el método de las dos mitades. Se trata de fórmulas que se utilizan para el cálculo del coeficiente de fiabilidad.
Fiabilidad y consistencia: El coeficiente de fiabilidad se puede hallar también de otra forma, es el denominado coeficiente alfa o coeficiente de generalizabilidad o de representatividad (Cronbach). Este coeficiente alfa indica la precisión con que algunos items miden un aspecto de la personalidad o la conducta. Puede interpretarse como : Una estimación de la correlación media de todos los items posibles en cierto aspecto. Una medida de la precisión del test en función de su coherencia o consistencia interna (interrelación entre sus elementos; hasta qué punto los elementos del test están midiendo todos lo mismo) y de su longitud. Indicando la representatividad del test, es decir, la cuantía en que la muestra de items que lo compone es representativa de la población de items posibles del mismo tipo y contenido psicológico. El coeficiente alfa refleja principalmente, dos conceptos básicos en la precisión de un test : 1. La interrelación existente entre sus elementos: la medida en que todos miden bien una misma cosa.
La longitud del test : al aumentar el número de casos de una muestra, y si se eliminan los errores sistemáticos, la muestra representa mejor a la población de que se extrae y es más improbable que intervenga el error casual. Si los items del test son dicotómicos, (si o no, 1 o 0, acuerdo o desacuerdo, etc), la ecuación del coeficiente alfa se simplifica, dando lugar a las ecuaciones de Kuder-Richardson (KR20 y KR21). Dado un cierto número de items, un test será tanto más fiable, cuando más homogéneo sea. El coeficiente alfa nos indica la fiabilidad en cuanto ésta representa homogeneidad y coherencia o consistencia interna de los elementos de un test.
Normas y criterios de fiabilidad
Según el modelo del espacio muestral de items, el objetivo del test es estimar la medida que se obtendría si se usaran todos los items del espacio muestral. Esta medida sería la puntuación verdadera, a la cual se aproximan más o menos las medidas reales. Según el grado en que una muestra de items correlacione con las puntuaciones verdaderas, el test es más o menos fiable. En este modelo es central la matriz de correlaciones entre todos los items del espacio muestral.Este modelo muestral insiste más directamente en la consistencia interna, y en la medida en que la logra, garantiza indirectamente la estabilidad.
El modelo lineal de los tests paralelos insiste más en la estabilidad de las puntuaciones, y en la medida en que consigue la estabilidad, favorece indirectamente la consistencia interna. Si aplicamos un test para establecer diagnósticos y pronósticos individuales, el coeficiente de fiabilidad debe ser de 0'90 para arriba. En pronósticos y clasificaciones colectivas, no es tanta la exigencia, aunque no es conveniente alejarse mucho de 0'90 a 0'80.
A veces, en cierta clase de tests, como los de personalidad, resulta difícil lograr coeficientes de más de 0'70. Si se aplica las formas paralelas, o mitades paralelas, después de un intervalo más o menos grande, los errores casuales pueden ser más numerosos que los que afectan al coeficiente alfa. Esto es así porque lo que rebaja la correlación no son sólo los errores aleatorios intrínsecos al test y en una única ocasión, que son los que tiene en cuenta el coeficiente alfa, sino que además influyen todos los errores que pueden proceder de las dos situaciones distintas, que pueden diferir en numerosos detalles. Por ello, el coeficiente alfa suele ser mayor que los demás coeficientes.
A excepción del coeficiente hallado mediante la repetición del mismo test, ya que hay más probabilidad de que los errores aleatorios de la primera aplicación se repitan en la segunda, y en vez de disminuir la correlación entre ambas, la aumenten. Se ha de procurar que la segunda aplicación sea por completo independiente de la primera. Si logramos esto, éste será el método más fácil y económico y aconsejable al intentar apreciar la estabilidad de las puntuaciones, sobre todo durante largos peridos de tiempo y con tests complejos. > Siguiente: Validez de los test
Este artículo es meramente informativo, en Psicología-Online no tenemos facultad para hacer un diagnóstico ni recomendar un tratamiento. Te invitamos a acudir a un psicólogo para que trate tu caso en particular.
Si deseas leer más artículos parecidos a Teoría Clásica de test, te recomendamos que entres en nuestra categoría de Psicología experimental.