Los desarrolladores quieren liberar su tiempo a los científicos para que se centren en el descubrimiento y la innovación ayudándoles a establecer conexiones a partir de una enorme cantidad de literatura.
Esta nueva generación de motores de búsqueda, impulsados por el aprendizaje automático y grandes modelos de lenguaje, está yendo más allá de las búsquedas de palabras clave para extraer conexiones de la enredada red de la literatura científica. Algunos programas, como Consensus, brindan respuestas respaldadas por investigaciones a preguntas de respuesta afirmativa o negativa; otros, como Semantic Scholar, Elicit e Iris, actúan como asistentes digitales: ordenan bibliografías, sugieren nuevos artículos y generan resúmenes de investigaciones. En conjunto, las plataformas facilitan muchos de los primeros pasos del proceso de investigación y revisión de la literatura sobre un tópico en particular. Los críticos señalan, sin embargo, que los programas aún no han sido probados y corren el riesgo de perpetuar los sesgos existentes en el proceso de publicación académica.
Los equipos detrás de estas herramientas dicen que las crearon para combatir la «sobrecarga de información» y liberar a los científicos para que sean más creativos. Según Daniel Weld del Instituto Allen de Inteligencia Artificial en Seattle, Washington, y científico jefe de Semantic Scholar, el conocimiento científico está creciendo tan rápidamente que es casi imposible estar al tanto de las últimas investigaciones. «La mayoría de los motores de búsqueda te ayudan a encontrar los artículos, pero luego te quedas solo intentando asimilarlos», dice. Al desglosar los documentos en sus puntos clave, las herramientas de inteligencia artificial ayudan a que esa información sea accesible.
=> Recibir por Whatsapp las noticias destacadas
Todos éramos seguidores leales de Google Scholar, lo que todavía encuentro útil, pero la idea era que podríamos hacerlo mejor y se hizo.
La próxima gran idea
La clave para hacerlo mejor reside en un tipo diferente de búsqueda. Google Scholar, PubMed y otras herramientas de búsqueda estándar utilizan palabras clave para localizar artículos similares. Los algoritmos de IA, por el contrario, utilizan comparaciones vectoriales. Los artículos se traducen de palabras a un conjunto de números, llamados vectores, cuya proximidad en el «espacio vectorial» corresponde a su similitud. Podemos analizar más de lo que quiere decir, el espíritu de su consulta de búsqueda, porque en ese vector hay más información sobre el contexto que la que está incrustada en el texto mismo.
Algunos ya disfrutan especialmente usando Iris, un motor de búsqueda que crea visualizaciones similares a mapas que conectan artículos en torno a temas. Al introducir un «artículo semilla» en Iris se genera un mapa anidado de publicaciones relacionadas, que se asemeja a un mapa del mundo. Hacer clic más profundamente en el mapa es como acercarse desde una vista de todo el país hasta, por ejemplo, estados (subtemas) y ciudades (documentos individuales).
Otras herramientas, como Research Rabbit y LitMaps, unen documentos a través de un mapa de red de nodos.
Un motor de búsqueda dirigido a profesionales médicos, llamado System Pro, crea una visualización similar, pero vincula los temas según su relación estadística.
Aunque estas búsquedas se basan en «algoritmos extractivos» para extraer fragmentos útiles, varias plataformas están implementando funciones generativas que utilizan IA para crear texto original. El Semantic Reader del Instituto Allen, por ejemplo, “incorpora la IA a la experiencia de lectura” de manuscritos en formato PDF. Si los usuarios encuentran un símbolo en una ecuación o una cita en el texto, aparece una tarjeta con la definición del símbolo o un resumen del artículo citado generado por IA.
Elicit está probando una función de lluvia de ideas para ayudar a generar mejores consultas, así como una forma de proporcionar un resumen en varios artículos de los cuatro principales resultados de búsqueda. Utiliza ChatGPT de Open AI, pero está entrenado sólo en artículos científicos, por lo que es menos propenso a «alucinaciones» (errores en el texto generado que parecen correctos, pero en realidad son inexactos) que las búsquedas basadas en todo Internet.
Primeros días
Las plataformas de IA también son propensas a sufrir algunos de los mismos prejuicios que sus creadores humanos. Las investigaciones han documentado repetidamente cómo las publicaciones académicas y los motores de búsqueda perjudican a algunos grupos, incluidas las mujeres y las personas de color, y estas mismas tendencias surgen con las herramientas basadas en IA.
Los científicos que tienen nombres que contienen caracteres acentuados han descrito dificultades para lograr que Semantic Scholar cree un perfil de autor unificado, por ejemplo. Y debido a que varios motores, incluidos Semantic Scholar y Consensus, utilizan métricas como el recuento de citas y los factores de impacto para determinar la clasificación, el trabajo que se publica en revistas prestigiosas o que es sensacionalista inevitablemente queda en la cima de la investigación que podría ser más relevante, creando lo que Weld llama un “efecto de ricos que se hacen más ricos”. El cofundador y director ejecutivo de Consensus, Eric Olson, que reside en Boston, Massachusetts, dice que la relevancia de un artículo para la consulta siempre será la principal métrica para determinar su clasificación.
Ninguno de estos motores marca explícitamente los preprints como dignos de un mayor escrutinio y los muestran junto con artículos publicados que han sido sometidos a una revisión formal por pares. Y ante preguntas controvertidas, como si las vacunas infantiles causan autismo o si los humanos contribuyen al calentamiento global, el consenso a veces arroja respuestas que perpetúan la información errónea o las afirmaciones no verificadas. Para estas preguntas cargadas, Olson dice que el equipo a veces revisa los resultados manualmente y marca los artículos en disputa.
Sin embargo, en última instancia, es responsabilidad del usuario verificar cualquier afirmación. Las plataformas generalmente marcan cuándo una característica está en prueba beta y algunas tienen banderas que indican la calidad de un artículo. Además de una etiqueta «disputada», Consensus está desarrollando actualmente formas de anotar el tipo de estudio, el número de participantes y la fuente de financiación, algo que también hace Elicit.
Los grupos también se han vuelto más reservados acerca de sus modelos, lo que dificulta abordar las faltas éticas. Mientras que los primeros en llegar, como Semantic Scholar, comparten su software subyacente para que otros puedan desarrollarlo (Consensus, Elicit, Perplexity, Connected Papers e Iris utilizan el corpus de Semantic Scholar), hoy en día, las empresas no proporcionan ninguna información, por lo que se ha vuelto menos una cuestión de ciencia y más de un producto.
Esto crea un imperativo adicional para garantizar que Semantic Scholar sea transparente. Creo que la IA avanza tremendamente rápido, y el incentivo de ‘vamos a adelantarnos a los demás’ puede empujarnos en direcciones peligrosas. Pero también creo que la tecnología de inteligencia artificial puede aportar muchos beneficios. Algunos de los principales desafíos que enfrenta el mundo se enfrentan mejor con programas de investigación realmente vibrantes, y eso es lo debe estimular a los desarrolladores de aplicaciones AI a ayudar a mejorar la productividad de los científicos.
Ronald Palacios Castrillo, M.D.,PhD.