Este algoritmo supera a los humanos en la detección de noticias falsas

Los investigadores han demostrado una solución automatizada basada en algoritmos que es comparable y, a veces, mejor que los humanos para identificar correctamente las noticias falsas. El sistema que identifica pistas lingüísticas reveladoras en noticias falsas podría proporcionar a los agregadores de noticias y a los sitios de redes sociales como Google News una nueva arma en la lucha contra la desinformación..

Una solución automatizada podría ser una herramienta importante para los sitios que están luchando para lidiar con una avalancha de noticias falsas, a menudo creadas para generar clics o manipular la opinión pública, dijo Rada Mihalcea, profesora de la Universidad de Michigan detrás del proyecto, en un comunicado..

El nuevo sistema encontró con éxito falsificaciones hasta el 76 por ciento de las veces, en comparación con una tasa de éxito humano del 70 por ciento, según el estudio que se presentará el 24 de agosto en la Conferencia Internacional de Lingüística Computacional en Santa Fe, Nuevo México..

Los investigadores creen que su enfoque de análisis lingüístico también podría usarse para identificar artículos de noticias falsos que son demasiado nuevos para ser desacreditados al comparar sus hechos con otras historias. El enfoque de análisis lingüístico analiza atributos cuantificables como la estructura gramatical, la elección de palabras, la puntuación y la complejidad..

Para el estudio, el equipo de Mihalcea creó sus propios datos, mediante la colaboración colectiva de un equipo en línea que transformó las noticias genuinas verificadas mediante ingeniería inversa en falsificaciones. Así es como la mayoría de las noticias falsas se crean, dijo Mihalcea, por personas que las escriben rápidamente a cambio de una recompensa monetaria..

A los participantes del estudio se les pagó para convertir noticias breves y reales en noticias similares pero falsas, imitando el estilo periodístico de los artículos. Al final del proceso, el equipo de investigación tenía un conjunto de datos de 500 noticias reales y falsas. Luego alimentaron estos pares de historias etiquetadas a un algoritmo que realizó un análisis lingüístico, enseñándose a distinguir entre noticias reales y falsas..

Finalmente, el equipo convirtió los algoritmos en un conjunto de datos de noticias reales y falsas extraídas directamente de la web, obteniendo una tasa de éxito del 76%. Los detalles del nuevo sistema y el conjunto de datos que el equipo usó para construirlo podrían ser utilizados por sitios de noticias u otras entidades para construir sus propios sistemas de detección de noticias falsas, dijo Mihalcea.