La Validez Interna y el Efecto de Maduración en la Investigación Científica

¿Qué es la Validez Interna?

La validez interna es un elemento importante en la mayoría de las disciplinas científicas, especialmente en las ciencias sociales. La forma más fácil de describir la validez interna es la confianza que podemos poner en la relación de causa y efecto de un estudio.

La pregunta clave que debes hacer en todo experimento es la siguiente: "¿Podría existir una causa o causas alternativas que expliquen mis observaciones y resultados?" Si analizamos algunos ejemplos extremos, un experimento de física sobre el efecto del calor en la conductividad de un metal tiene una validez interna elevada. El investigador puede eliminar casi todas las variables de confusión posibles y establecer controles fuertes para aislar otros factores. En el otro extremo de la escala, un estudio sobre la correlación entre el nivel de ingresos y la probabilidad de fumar tiene una validez interna mucho menor. Un investigador puede descubrir que existe un vínculo entre los grupos de bajos ingresos y el tabaquismo, pero no puede estar seguro de que uno cause el otro. El estatus social, la profesión, la etnia, la educación, el tabaquismo de los padres y la exposición a la publicidad dirigida son todas variables que pueden tener un efecto. Son difíciles de eliminar y la investigación social puede ser un campo minado estadístico para los confiados.

Esquema de las variables que influyen en la validez interna de un estudio

Validez Interna frente a Validez de Constructo

Para los físicos, la validez de constructo rara vez es necesaria, pero para las ciencias sociales y la psicología constituye el fundamento de la investigación. Aún más importante es comprender la diferencia entre la validez de constructo y la validez interna, que puede ser muy sutil. Las diferencias sutiles entre ellas no siempre están claras, pero es importante ser capaz de distinguir a las dos, especialmente si deseas participar de las ciencias sociales, la psicología y la medicina.

La validez interna solo muestra que tienes pruebas de que un programa o estudio tuvo algún efecto sobre las observaciones y los resultados. La validez de constructo determina si el programa midió la característica deseada. La validez interna no aclara si los resultados fueron los esperados o si es posible la generalización.

Por ejemplo, imagina que algunos investigadores querían comparar los efectos de un programa informático con los métodos tradicionales de clases para la enseñanza del griego. Los resultados mostraron que los niños que utilizaron el programa informático aprendieron mucho más rápido y mejoraron sus calificaciones significativamente. Sin embargo, una investigación posterior mostró que los resultados no se debieron al programa, sino al efecto Hawthorne. Los niños que utilizaron el programa informático sintieron que habían sido elegidos para recibir una atención especial. Como resultado, se esforzaron un poco más, en lugar de mirar por la ventana. Este experimento siguió mostrando una validez interna alta debido a que la manipulación de la investigación tuvo un efecto. Sin embargo, el estudio tiene escasa validez de constructo, ya que la causa no fue etiquetada correctamente. En última instancia, el experimento midió los efectos de una mayor atención, en lugar de los méritos del programa informático.

Fuentes Comunes de Invalidez Interna

Existen varias circunstancias que pueden afectar a la validez interna de una investigación, como son los efectos de la historia, la maduración, el aprendizaje, la instrumentación, la selección de elementos, la mortalidad experimental o la regresión a la media.

Efecto de Historia

El efecto historia se refiere a los sucesos imprevistos que pueden ocurrir durante la manipulación experimental o durante la recogida de datos, y que pueden influirlos. Por ejemplo, la aparición de un molesto ruido de obras durante la aplicación de un test de inteligencia o un corte de luz cuando se están haciendo cuidadosas medidas de laboratorio. Cuanto más tiempo se extienda la experimentación y mayor variedad de localizaciones requiera, más probabilidades habrá de que sucedan imprevistos. Puede ayudar a reducirlos una planificación detallada de la investigación, o realizar todos los procedimientos experimentales en las mismas circunstancias.

Efecto de Maduración

Otro posible efecto es el de maduración, que puede ocurrir cuando en una investigación se mide una variable dependiente antes y después de que actúe una variable independiente por aplicación de un tratamiento. El objetivo sería determinar la influencia de la independiente en la dependiente comparando el valor final de esta con el estado de partida, pero si transcurre demasiado tiempo entre las dos medidas, quizá la variación se deba al simple paso del tiempo, y no directamente a la acción de la variable independiente.

Un ejemplo clásico es el de un método didáctico aplicado a un grupo de estudiantes, en los que se miden los resultados académicos antes y después de la aplicación del método. Si el estudio se extiende por varios meses, la mejora en el rendimiento podría atribuirse a que los estudiantes han madurado, han adquirido conocimientos de forma natural o han desarrollado habilidades cognitivas con el tiempo, independientemente del método didáctico aplicado.

Gráfico mostrando el progreso natural del aprendizaje frente al efecto de una intervención

Efecto Memoria o Aprendizaje

Cuando la variable dependiente se mide dos veces en los mismos elementos, puede actuar también el efecto memoria o aprendizaje, que consiste en que la primera medida afecta a los resultados de la segunda. En el ejemplo sobre el método didáctico, se medía el rendimiento académico antes y después de su aplicación. Por un lado, es conveniente emplear el mismo examen en las dos ocasiones para facilitar su comparación, pero, por otro lado, es posible que los estudiantes aprendan del primer examen y que los resultados del segundo sean mejores, sin que por ello pueda concluirse que el método didáctico aplicado entre ambos sea eficaz. Este problema puede darse siempre que exista el riesgo de aprender en la primera medida, aunque la herramienta no sea idéntica a la de la segunda, y su efecto puede reducirse si se deja transcurrir mucho tiempo entre ambas medidas.

Efecto de Instrumentación

Siempre que se toman datos en distintos grupos dentro de una muestra, o en un mismo grupo pero en distintos momentos, debe hacerse de la manera más homogénea posible, para evitar el efecto de la instrumentación. Este efecto consiste en obtener distintas medidas de la variable dependiente debido a las diferentes condiciones en la toma de datos, entre las que se encuentran los instrumentos o herramientas de recogida de datos, la persona que los usa o aplica, las condiciones del entorno, etc.

Efecto de Selección de Elementos

En algunos tipos de investigación se divide la muestra en distintos grupos, cada uno de ellos con un valor distinto de la variable independiente para evidenciar si la variable dependiente difiere de un grupo a otro. Para que esa dependencia se vea claramente, los grupos tienen que ser homogéneos en todas aquellas variables perturbadoras que puedan interferir en la relación. En el ejemplo de dos grupos en los que se aplican dos métodos didácticos distintos (nuevo y tradicional), si uno de los grupos es de primero de la E.S.O. y el otro de Bachillerato, los resultados serán muy distintos debido a la diferente madurez intelectual de los estudiantes y no necesariamente a la influencia del método. Este problema se conoce como efecto de selección.

Efecto de Mortalidad Experimental

Con el paso del tiempo algunos de los elementos de una muestra pueden dejar de estar accesibles para la investigación, o sus propiedades pueden cambiar. El efecto de mortalidad experimental implica que una muestra que comienza siendo suficientemente representativa de una población puede dejar de serlo porque se reduce mucho su tamaño o porque queda desequilibrada si cambian o desaparecen muchos elementos con alguna característica en común.

Efecto de Regresión a la Media

Los valores extremos (los más altos y los más bajos) de la variable dependiente en una muestra se deben en general a la combinación de dos contribuciones. Por ejemplo, en una prueba de conocimientos cabe esperar que los mejores resultados correspondan a los estudiantes que han seguido un mejor método didáctico, a los más inteligentes, a los más motivados, etc.; todas ellas son posibles variables independientes o perturbadoras. Las puntuaciones extremas por arriba corresponderán a estudiantes que, además de lo anterior, estuvieron especialmente lúcidos durante el examen o habían estudiado particularmente bien las preguntas que cayeron. En otras palabras, tuvieron 'buena suerte'. Un razonamiento análogo se puede aplicar a los peores resultados de la prueba, en los que podrá haber influido un peor método didáctico, menor inteligencia de los sujetos, menor motivación, etc., pero también se habrán visto afectadas por una cierta dosis de 'mala suerte'.

Si los sujetos vuelven a realizar la prueba en otro momento, el efecto de las variables perturbadoras será previsiblemente el mismo de antes, pero el azar, por su naturaleza, puede actuar en un sentido distinto. Es de esperar, por tanto, que el subconjunto de estudiantes con notas extremas superiores empeore sus resultados en la siguiente prueba, mientras que el subconjunto con notas extremas inferiores, las mejore. Es decir, ambos grupos de puntuaciones extremadamente alejadas de la media de la muestra se desplazan (regresan) hacia ella en la segunda medida, lo que se denomina efecto de regresión a la media.

Todo lo anterior influye en la validez cuando se selecciona una muestra con valores extremos de la variable dependiente o en alguna otra muy relacionada con ella. Por ejemplo, en una investigación sobre un nuevo tratamiento médico se seleccionan las personas más enfermas, pensando que serán las que mejor reflejen el posible beneficio. Una vez aplicado el tratamiento, se vuelve a estudiar la muestra, comprobándose que los enfermos presentan una mejoría. Una manera de eliminar esta fuente de invalidez en muestras extremas es llevar a cabo la investigación con dos grupos, uno de los cuales recibe el nuevo tratamiento y el otro (grupo de control), no.

Diagrama de dispersión mostrando la regresión a la media en una población

Estrategias para Aumentar la Confianza en la Validez Interna

Es imposible mantener el 100% de confianza en cualquier diseño experimental y siempre existe la posibilidad de error. Sin embargo, existen varias herramientas para ayudar a un investigador a supervisar la validez interna y establecer la causalidad.

  • Precedencia Temporal: Es la herramienta más importante para determinar la fuerza de una relación de causa y efecto. Se trata del proceso de establecer que la causa, efectivamente, ocurrió antes que el efecto, brindando una solución al problema de la gallina y el huevo. Para establecer la validez interna a través de la precedencia temporal, un investigador debe establecer qué variable sucedió primero. Un ejemplo podría ser un estudio de ecología que intente establecer si un aumento en la población de leminos tiene como consecuencia un aumento en el número de depredadores. La relación depredador/presa es mucho más compleja de lo que parece, lo que resalta la dificultad de demostrar que la causa sucede antes que el efecto en ciertos campos.
  • Covariación de Causa y Efecto: Es el proceso de establecer que existe una causa y efecto respecto de la relación entre las variables. Establece que el experimento o programa tuvo algún efecto medible, sea cual sea. Por ejemplo, en el estudio del aprendizaje del griego, los resultados mostraron que el grupo con el programa informático se desempeñó mejor que los demás. La covariación de causa y efecto no puede explicar qué causa el efecto ni establecer si se debe a la variable manipulada esperada o a una variable de confusión, pero refuerza la validez interna del estudio.
  • Establecimiento de Causalidad por Eliminación: Es la forma más fácil de probar que un experimento tiene una validez interna alta. Implica eliminar las variables de confusión (a menudo referidas como la "variable que falta") para asegurar que no puedan tener ninguna influencia. La aleatorización, los grupos de control y los experimentos repetidos son la mejor manera de eliminar estas variables y mantener una validez elevada.

La Naturaleza Intrínseca de la Validez Interna

Para darte un ejemplo de lo difícil que puede ser medir la validez interna: En el experimento donde los investigadores compararon un programa informático con los métodos tradicionales de enseñanza del griego, existe una serie de amenazas contra la validez interna:

  • El grupo con computadoras se siente especial, por lo que se esfuerza más: efecto Hawthorne.
  • El grupo sin computadoras se pone celoso y se esfuerza más para demostrar que deberían haber tenido la oportunidad de utilizar la nueva tecnología.
  • Alternativamente, el grupo sin computadoras está desmoralizado y su rendimiento se resiente.
  • Los padres de los niños en el grupo sin computadoras sienten que sus hijos están perdiendo y se quejan de que todos deberían tener la misma oportunidad.
  • Los niños hablan fuera de la escuela y comparan notas, empeorando todo.
  • Los profesores sienten lástima por los niños sin el programa y tratan de compensarlos, ayudándolos más de lo normal.

No estamos tratando de deprimirte con estas complicaciones, solo ilustrar lo compleja que puede ser la validez interna. De hecho, la validez interna perfecta es un ideal inalcanzable, pero todo diseño de investigación debe buscar alcanzar la perfección. Diseñar experimentos con buena validez interna es una cuestión de experiencia y se hace mucho más fácil con el tiempo.

tags: #ejemplo #de #fuente #de #invalidez #interna