La ciencia al desnudo

El tema de la cantidad de publicaciones científicas, así como la calidad de la investigación, ha sido ampliamente abordado.

Según una investigación de la Universidad de Ottawa, en 2009 se superaron los 50 millones en términos de la cantidad total de artículos científicos publicados desde 1665. Cada año se publican aproximadamente 2,5 millones de artículos científicos nuevos. Algunos, en revistas depredadoras o falsas, pero se supone que más de 2800 son genuinas.

De lo anterior, se puede deducir que un número determinado de científicos podría no haber leído la mayor parte de la literatura en su campo; aunque probablemente lean hallazgos inmediatamente relevantes o innovadores.

Ha surgido la pregunta de si, en algunos casos, los científicos incluso han leído artículos en los que figuran como autores. Un informe en Nature (2018) reveló que “miles de científicos publican un artículo cada cinco días” o 72 artículos al año: “A ese ritmo prodigioso, es poco probable que haya contribuido directamente al trabajo interno, escribiendo algunas palabras o brindando una idea clave. No digamos solo haciendo alguna ciencia significativa en su construcción”.

Es improbable que cualquier artículo cuyos autores no lo hayan leído contenga información innovadora. Los jugadores del campo del conocimiento científico utilizan las herramientas de poder:

  • Científicos prominentes pueden aparecer como autores para llamar la atención sobre el trabajo de sus estudiantes.
  • Técnicos cuya principal preocupación son los instrumentos de investigación, generaron datos significativos.

Tal vez la única persona que realmente leyó un artículo publicado fue el corrector de pruebas, que busca errores puntuales, más no abarca el panorama general. La existencia de artículos cuyos autores ni siquiera los han leído, es señal de que el aumento exponencial en la producción científica no muestra signos de desaceleración. Las estimaciones aproximadas afirman que entre uno y dos millones de artículos científicos se publican cada año. Eso es 5470 todos los días.

La sumatoria de todos los artículos publicados, produce un resultado demasiado grande para que lo vea cualquier persona. Pasa al campo del big data o “grandes datos”.

¿Para quién son esos artículos cada 5 días, si incluso sus propios autores no los han leído?

Los artículos científicos existen como unidad productiva de la ciencia. El conteo es lo significativo; no el contenido, no las ideas, solo la mera existencia.

La versión menos nihilista de “nadie los lee” es que los artículos no necesitan tener una audiencia. Hay dos tipos de trabajos científicos:

  • Hay quienes le dan un empujón al conocimiento: demuestran que algo está bien, prueban que algo está mal; o hablan de un nuevo método que puede ser utilizado. El tipo de artículos que hacen de las noticias mainstream (corriente principal). Estos son los artículos que deben leerse en este momento. Pero son pocos en número en comparación con el flujo total de documentos.
  • La mayoría de los documentos son conocimientos de archivo. Los científicos descubren algo, lo graban y lo publican en un artículo. Luego, los futuros científicos pueden desarrollarlo, usarlo, cuando haya una razón para hacerlo. La idea del conocimiento archivístico puede ser menos nihilista, pero empuja el problema hacia el futuro. Sí, nos gustaría saber lo que ya sabemos; nos gustaría no repetir las mismas ideas y experimentos. Pero hay demasiado conocimiento archivístico para embeber.

“Estamos en 2019 y las publicaciones académicas todavía están ligadas a la tradición pre-digital. Se continúa pensando que a los documentos que ya existen se les debe asignar un “número” mensual de la revista en la que aparecerán formalmente. A pesar de que la revista no ha publicado sobre la pulpa de árbol muerto durante una década, o nunca”.

¿Puede la IA ayudar a los científicos a producir mejores investigaciones?

Ninguna persona puede vincular la red existente de literatura sobre un solo tema. Lo que significa que no hay una sola persona que sepa “la respuesta” a un problema complejo dado. Así que “la respuesta” puede venir en una de dos formas:

  • Un modelo computacional del problema. El modelo en sí mismo se convierte en la culminación de una gran empresa de investigación. La construcción nos dice lo que no sabemos, de dónde necesitamos llenar los vacíos para hacer que los modelos sean mejores, más ágiles, más inteligentes. La ejecución nos da respuestas a problemas complejos. Por ejemplo: Los enormes modelos informáticos del clima de la Tierra sintetizan una cantidad extraordinaria de datos y reúnen una vasta gama de conocimientos individuales. Pueden responder a cómo la temperatura depende del dióxido de carbono o dónde los cambios de temperatura afectarán más fuerte y primero.
  • Una Inteligencia Artificial. Usar el aprendizaje automático para dar sentido a los conjuntos de datos que son demasiado grandes para que una sola persona pueda analizarlos. ¿Qué mayor conjunto de datos hay que el conocimiento científico colectivo de la humanidad?

La mayoría de los documentos son “conocimientos de archivo”, que no deben analizarse en detalle a menos que sea necesario. En su propia área, la neurociencia, los investigadores ya han usado el aprendizaje automático para construir diagramas de árboles para ayudar a los neurocientíficos a concentrarse en la “necesidad de leer” en lugar de “bueno para leer”.

Dos investigadores, recopilaron 3.5 millones de resúmenes de PubMed y vinculándolos con palabras clave para regiones cerebrales, trastornos y funciones cognitivas, construyeron un modelo de conocimiento neurocientífico. Este modelo naturalmente tiene una jerarquía: “córtex”, “tálamo” y “estriado” son todos hijos de “cerebro”, por ejemplo. Lo que abrió un generador de hipótesis simple pero efectivo: encuentre dos conceptos que compartan un padre, pero que no se hayan vinculado en la literatura existente. Ese par de conceptos son entonces candidatos para vincularse.

El programa de aprendizaje automático no generará una idea innovadora ni realizará una investigación, pero puede clasificar los árboles mucho más rápidamente de lo que lo haría un investigador. Los patrones que emergen pueden generar ideas comprobables. La carga de información puede ser manejable a pesar de su tamaño, incluso si ninguna persona conoce el panorama completo y en rápido crecimiento.


Comentarios

mood_bad
  • No hay comentarios todavía.
  • Agrega un comentario