Cuando Vanessa y su esposo tuvieron a su primer hijo, decidieron inscribirlo, desde ese momento, en un colegio internacional al cual es muy difícil ingresar. A pesar de inscribirlos el año que nacían, los niños iniciaban en kindergarten a los 5 años. Vanessa recuerda que ese primer año escolar salió de excursión con familias amigas que tenían a sus hijos en el mismo colegio. Eran cinco familias que iban a un parque temático en Guatemala. Tres de las cinco familias conducían la misma marca y tipo de carro. Todas las madres del grupo tenían una profesión universitaria. En su mayoría los padres tenían un empleo estable y bien pagado y dos eran dueños de su propia empresa. Cuatro de las cinco familias tenían dos hijos y solo la de Vanessa tres.
Aquel día Vanessa supo que ella y su esposo se parecían mucho más de lo que ella creía con los otros padres del grado de su hijo. Con los años, lo confirmó aún más. Cuando su tercer hijo entró al mismo colegio, tuvo la sensación de que ya no era tan parecida a los otros padres del grado del pequeño como había sido de los del grado de su hijo mayor. Vanessa era al menos cinco años mayor que el resto de los padres. En este grupo, la mayoría tenía un hijo o estaba por tener al segundo. Las profesiones eran muy diferentes a las de ella y su esposo.
Aunque lo pasemos desapercibido, los datos y la estadística tienen sentido por ejemplos como los anteriores. Los seres humanos somos seres sociales y, por tanto, seremos influenciados unos a otros. En las escuelas, el desempeño de los niños estará muy influenciado por el carro que manejen sus padres, la profesión de las madres, el número de hijos, entre otros factores. Este es un ejemplo que ilustra el sentido del uso de la estadística y los datos en las ciencias sociales y humanísticas. Entre otras cosas, los datos y la estadística fundamentan la ciencia de la implementación y las intervenciones en distintas áreas.
Es innegable que las mejoras educativas o las intervenciones no son cuestión de azar o de buena voluntad. Estas son actos fundamentados en ciencia donde, sobre todo, conocer e invertir en las variables correctas hará toda la diferencia, y no en el mero acceso de los datos. Esta idea es fundamental de este artículo. Los avances de la tecnología y la inteligencia artificial han puesto a disposición inimaginables cantidades de datos de cualquier tema para cualquier uso, bueno o malo, que cualquier persona quiera. Así, ahora se pueden recolectar datos a través del internet, incluso sin que el sujeto lo sepa. También es posible correlacionar variables provenientes de diferentes fuentes y concluir y sugerir productos, políticas, soluciones, entre otros usos. Además, se pueden generar datos ficticios, en el mejor de los casos para comprobar funciones y estadísticos, como se hace en los estudios tipo Monte Carlo. Pero también se pueden crear datos ficticios que mal informan a los usuarios, como el fake data.
Así, nos encontramos en la era de acceso fácil y sin filtro de datos e información. En mi experiencia generando datos para diseñar e implementar programas para mejorar la educación de Guatemala basados en evidencia en los últimos quince años, no deja de preocuparme que la cantidad abrumadora de datos desmerite la investigación y los estándares de calidad con los que se produce para informar lo que debemos hacer, particularmente cuando se trata de una intervención médica, psicológica, educativa, etc.
Las investigaciones rigurosas tienen estándares de calidad de los datos que recolectan. De ese modo, la instrumentación que produce el dato de una investigación es tratada con escrutinio, sobre todo en las ciencias sociales y humanísticas, donde se espera que el dato se interprete de forma transparente con base en un constructo (validez) y que se garantice consistencia con que el instrumento visibilizaría dicho constructo de una persona (confiabilidad). Esto, con el objetivo de que las varianzas que se identifiquen entre personas sean reales y, por consiguiente, también las conclusiones sobre ellas y el fenómeno que se estudia.
Quizá hayan intuido que las investigaciones dependen mucho de la varianza existente y de la varianza que se diseña a través de las intervenciones. Por tanto, la importancia de los datos no radica en tenerlos o que estén disponibles, sino en identificar e intervenir en las fuentes de varianza correctas para provocar una mejora (Cummings, 2013). Porque después de todo, la ciencia está al servicio de la humanidad para que los humanos seamos mejores.
En este sentido,
- No es suficiente recolectar data o accederla sin limitaciones.
- No es suficiente identificar o monitorear atributos de los humanos (investigación exploratoria).
- No es suficiente correlacionar variables, aunque se tenga big data–
Lo más importante es identificar las fuentes de varianza para mejorar las intervenciones y las decisiones que tomamos como humanidad y como país, por lo que:
- Hay que recolectar e identificar los datos adecuados (descartar fake data).
- Hay que identificar por qué no logramos resultados que esperábamos (investigación experimental).
- Hay que encontrar los estudios que nos permitan determinar con cuál intervención tenemos mayor probabilidad de mejorar algo (metaanálisis y revisiones sistemáticas de literatura).
- Hay que invertir recursos en aquellas variables donde tendremos mayor oportunidad de mejorar algo (replicar investigaciones).
Tal como el ejemplo de los grupos de padres de familia del colegio de los hijos de Vanessa, los humanos, cada uno con sus atributos, nos influenciamos unos a otros de diferentes maneras, lo que provoca que variemos (que nos parezcamos o difiramos) a diferentes niveles entre nosotros. Como dice el refrán: “dime con quien andas y te diré quién eres”. Cabe hacer notar que las nuevas tecnologías y redes sociales y los llamados “influencers” están cumpliendo esta función con las nuevas generaciones.
A gran escala, conocer estas variaciones a través de datos precisos y adecuados ayuda a los tomadores de decisión a adjudicar los recursos en las variables correctas para obtener resultados esperados y así lograr mejorar. Ojalá esta época de datos ilimitados no se quede solo en acceso. Ojalá también haya quien los lea, los interprete y logre proponer intervenciones para que la humanidad sea mejor.
Crédito de la imagen: Julián Véliz