Como todos los jueves, Spain AI, la red nacional sin ánimo de lucro que une a todos los interesados en Inteligencia Artificial, ha llevado a cabo otro de sus webinars gratuitos. Esta vez, la charla organizada por Valencia AI, ha sido sobre el papel de la Inteligencia Artificial en la identificación de contenido malicioso en la red. Para ello, han contado con el experto, Alberto Barrón-Cedeño, Doctor en Informática por la Universitat Politècnica de València y actualmente profesor asociado en la Università di Bologna (Italia).

A día de hoy, la cantidad de desinformación puede llegar a ser infinita, y por otro lado, se estima que en un futuro cercano va a ser muy difícil saber qué información será falsa y cuál no. Por lo tanto, el reto tecnológico en un futuro será identificar quién ha escrito esa noticia y en quién deberemos confiar. Otro de los temas que tratará Alberto en el webinar, es el delito de odio, algo que también está presente en las redes sociales y que está aumentando cada día.

A continuación, analizamos algunos de los temas que Alberto ha destacado en el webinar:

Tabla de contenidos

La propaganda

Actualmente, hay muchos problemas con la veracidad de las noticias, las fake news cada vez son más comunes y es difícil identificar qué noticias son reales, o cuáles no lo son. Además, es cierto que muchos medios tienden a exagerar las noticias con el fin de generar más sensacionalismo y más views en las noticias. Es por eso que aquí entra la necesidad de crear algoritmos que puedan distinguir cuáles son fake news y cuáles no.

En el otro lado de los medios, están las redes sociales. Twitter se ha convertido en una fuente de información para muchos usuarios e incluso para muchos periodistas. Lo que está haciendo que la información consultada no pase por ningún filtro, y no se sepa si es correcta o no.

Para poder solventar esto, desde el punto de vista del procesamiento del lenguaje natural están desarrollando técnicas para ayudar a los lectores a darse cuenta de que algo tiene propaganda. Estas técnicas están basadas en la propaganda, y en la no propaganda. Los modelos de este tipo logran alcanzar en la actualidad una precisión alrededor del 80%.

Técnicas de identificación de propaganda

La idea es conocer que hay una intención de propaganda en un artículo. Para ello, han estudiado las técnicas que se utilizan para atraer a las personas o persuadirlas. En total estudiaron más de 80 técnicas e identificaron alrededor de otras 18 técnicas que son de común uso en artículos de noticias

También han llevado a cabo un análisis en el que se han conocido las técnicas más recurrentes que utiliza cada uno de los medios, para una identificación más sencilla de éstos.

El proceso

Para llevar a cabo el análisis de los textos, es necesario tener un texto de referencia, como inicio del proceso. Una de las primeras tareas cuando ya se tiene el texto es la identificación del fragmento, es decir, establecer dentro de ese texto qué fragmentos contienen propaganda. La segunda tarea es aclarar qué tipo de propaganda tienen esos fragmentos. Y finalmente, la salida del proceso o el punto final, es la extracción definitiva de los fragmentos.

El lenguaje de odio

La primera parte es entender qué es el lenguaje de odio y saber diferenciar cuándo se está utilizando ese lenguaje, sobre todo en las redes sociales, donde entra la connotación negativa.

Otro de los aspectos importantes es el idioma. El objetivo principal es crear algoritmos que permitan poder diferenciar el lenguaje de odio y el contenido malicioso en todos los idiomas. Para ello, están llevando a cabo un análisis completo en artículos y textos en diferentes idiomas para poder detectar el lenguaje de odio en estos textos.

Si quieres profundizar más sobre las iniciativas que se están llevando a cabo para identificar los contenidos maliciosos, no te pierdas el webinar completo de Spain AI, que podrás ver aquí. También podrás disfrutar de las preguntas que los asistentes pudieron hacerle a Alberto.


contenido malicioso
Spain AI

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *