La medición es una parte importante del proceso científico. Los aspectos clave relacionados con la calidad de las medidas científicas son la fiabilidad y la validez.
Fiabilidad es una medida de la consistencia interna y la estabilidad de un dispositivo de medición.
Validez nos da una indicación de si el dispositivo de medición mide lo que dice.
Consistencia interna es el grado en que los ítems o preguntas de la medida evalúan consistentemente el mismo constructo. Cada pregunta debe estar dirigida a medir lo mismo. La consistencia interna a menudo se mide usando Alfa de Cronbach — una supercorrelación de todos los ítems de la escala. Si la puntuación es 0,70 o superior, la medida es aceptable. Sin embargo, es preferible .80 o superior. También es importante tener en cuenta el contexto al considerar la puntuación que refleja la consistencia interna.
Estabilidad a menudo se mide mediante la confiabilidad de prueba / repetición de prueba. La misma persona toma la misma prueba dos veces y se comparan los puntajes de cada prueba. Una alta correlación entre los puntajes de las dos pruebas implica que la prueba es confiable. En la mayoría de las circunstancias, se considera aceptable una correlación de al menos 0,70. Sin embargo, esta es una guía general y no una prueba estadística.
Fiabilidad entre es otro coeficiente de confiabilidad que a veces se usa para evaluar la confiabilidad. Con la confiabilidad entre evaluadores, diferentes jueces o calificadores (dos o más) hacen observaciones, registran sus hallazgos y luego comparan sus observaciones. Si los evaluadores son confiables, el porcentaje de acuerdo debería ser alto.
Cuando preguntamos si una medida es válida, estamos preguntando si mide lo que se supone que mide. La validez es un juicio basado en datos recopilados, no una prueba estadística. Hay dos formas principales de determinar la validez: las medidas existentes y las diferencias de grupo conocidas.
La prueba de medidas existentes determina si la nueva medida se correlaciona con las medidas válidas relevantes existentes. La nueva medida debe ser similar a las medidas que se han registrado con dispositivos de medición válidos ya establecidos.
Las diferencias de grupo conocidas determinan si la nueva medida distingue entre las diferencias de grupo conocidas. Una ilustración de las diferencias de grupo conocidas se ve cuando a diferentes grupos se les da la misma medida y se espera que obtengan puntajes diferentes. Por ejemplo, si hiciera una prueba a demócratas y republicanos para evaluar la fuerza de ciertas opiniones políticas, esperaría que obtuvieran puntajes diferentes. Sus puntos de vista son sustancialmente diferentes en muchos temas. Si estos dos grupos obtuvieron puntajes diferentes, como se esperaba, podríamos decir que la medida indica validez: la medida de lo que pretende medir.
Al diseñar nuevos dispositivos de medición, es imperativo considerar su confiabilidad y validez. Una medida puede ser fiable y no válida. Pero una medida válida es siempre una medida fiable.