Reflexiones al vuelo sobre datos de la investigación en abierto

Y mientras me preparo a colaborar con la Universitat de Barcelona en un seminario sobre investigación educativa y datos abiertos…

…Algo en mi cabeza anda dando vueltas respecto a todo el entusiasmo con el que siempre he vivido los datos abiertos. Uno no puede no preguntarse esa pregunta que te hace tu colega, al que estás tratando de convencer para que se una al grupo de activistas de los datos y la ciencia en abierto: ¿No tienes miedo de que si compartes en abierto datos de tus investigaciones puedan tener un uso inadecuado por alguien?

No sólo he tratado de publicar mis datos en abierto sino que he hecho estudios sobre cómo se publican y cómo se usan los datos abiertos. Los resultados no son particularmente alentadores, queda mucho que hacer por mejorar la calidad en mi campo (pues además trabajamos con un enfoque de “small data” de pequeños datos que nada tiene que ver con las bases de datos enormes sobre las que trabajan colaborativamente por fuerza físicos o estudiosos del genoma humano o de las neurociencias). Nosotros (siguiendo la discusión abierta por Christine Borgman en el 2015 en su libro “Big Data, Little Data, No Data“) los investigadores en educación trabajamos con datos recogidos en una clase, o entrevistas, o grupos focales, y estos datos son muy muy caóticos en su estado actual. Ahí te encuentras con el gran problema de las ciencias de la educación, que son interdisciplinarias y por naturaleza hay un cruce e hibridación de métodos tremendo…que acaba en el caos de los datos.

En el estado actual de las cosas, diría que mucho de lo que se recoge no puede ser reciclado ni reutilizado, por su baja calidad. Sin embargo confí o en que podemos hacerlo…y ser más eficaces y “ecológicos” en el recoger y analizar datos (*).

Por supuesto, una preocupación actual para mí se relaciona con el tipo de usos que se hace de los datos abiertos, y es una cuestión que estoy explorando, observando cómo se van moviendo otros sectores científicos. En particular, porque ha habido una gran preocupación sobre el uso de repositorios abiertos (por ejemplo de imágenes) en redes sociales para su uso en el entrenamiento de algoritmos usados en productos (que pueden llevar a una monetización y ganancia) de inteligencia artificial.

¿Podrían ser mis datos usados más que por otros investigadores, por una compañía para producir un algoritmo que genere recomendaciones éticamente cuestionables?

Actualmente, no tengo respuestas. Me preocupa que exista tal posibilidad. También se ha de considerar que las ciencias de la educación no producimos material inmediatamente redituable, como podría ser el caso de otros ámbitos, aunque el uso de datos del estudiantado para producir analíticas de aprendizaje está rápidamente cambiando ese escenario.Sin embargo, en todos estos años de trabajo desde un paradigma de ciencia abierta, también he aprendido (junto a otros investigadores) a anonimizar mis datos, recortarlos por niveles de granularidad, trabajar con un acceso abierto con identificación de los usuarios y motivos de uso, etc.

Creo que la casuística y las problemáticas surgidas (como siempre se trata de escenarios ex-post al problema ético o social) nos orientarán en el tipo de instrumentos a usar para ejercer más control sobre los datos abiertos. Abiertos sí, pero para quien los use de una manera que se alinea con nuestro enfoque ético y deontológico, generando resultados que pueden determinar innovaciones en el espacio público o privado, siempre en pos del bien común y no del provecho centralizado o del poder.

*(Nota de edición post-publicación, trabajo esta idea de modo más conceptual en el futuro, ver este post)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.