Así pueden los partidos y empresas analizar sus opiniones en Twitter

Las personas expresamos continuamente nuestras opiniones y sentimientos de muchas maneras: mediante expresiones gestuales, de forma oral y también por escrito. Esta última forma ha ido adquiriendo mayor importancia debido al uso, cada vez más extendido, de las redes sociales, donde la comunicación se realiza principalmente publicando e intercambiando mensajes.

La proliferación de esta modalidad de comunicación lingüística ha generado un gran interés por los programas para procesar automáticamente textos y detectar y clasificar sentimientos y opiniones.

Para las empresas es cada vez más importante conocer la opinión que se tiene sobre sus productos y servicios, lo que se ha venido a llamar gestión de la reputación. La monitorización de la opinión ciudadana expresada en redes sociales complementa a los métodos tradicionales basados en encuestas: las redes sociales se han convertido en una fuente de fácil acceso a grandes cantidades de palabras, frases y textos que expresan opiniones de manera espontánea.

De las webs especializadas a las redes sociales

Los primeros foros donde los usuarios podían compartir opiniones fueron aquellos relacionados con las reseñas turísticas y de productos para el ocio (libros, películas, dispositivos electrónicos, etc.), como por ejemplo TripAdvisor, Booking, Amazon y los portales para cinéfilos IMDb y RottenTomatoes.

Hoy en día las las redes sociales (Facebook, YouTube, Instagram, Twitter, etc.) han ganado en popularidad a estas webs. Mientras que los foros de Tripadvisor reciben 270 contribuciones (opiniones) por minuto, se publican alrededor de 6 000 tuits por segundo en el mundo. Solo en España hay 6,4 millones de usuarios de Twitter.

El crecimiento exponencial de los datos en forma de textos escritos disponibles permite que se utilicen cada vez más las técnicas de procesamiento del lenguaje natural, basadas en inteligencia artificial. Se trata de algoritmos que analizan el lenguaje humano para detectar sentimientos y opiniones con respecto a productos, organizaciones (partidos políticos, empresas, etc.) o temas en concreto (Brexit, Unión Europea).

¿Es amor u odio?

Los sistemas que mejores resultados obtienen son los que utilizan categorías simples para clasificar los fragmentos de texto. Tienen en cuenta dos variables: la subjetividad (determinan si un texto es objetivo o subjetivo) y la polaridad (determinan la connotación o sentido de un texto).

A su vez, esta polaridad se clasifica en tres categorías según la opinión tenga carácter positivo, negativo o neutro, en base a una escala numérica (0-5). Veamos algunos ejemplos de tuits:

“Nos planteamos el porqué de su estrella y nos dolió el bolsillo”.
“Buen ambiente, servicio mediocre”.
“@USER jajajaja la tuya y la d mucha gente seguro!! Pero yo no puedo sin mi melena me muero”.

Las frases 1 y 3 expresan sentimientos negativos. Sin embargo, no resulta fácil asignar una polaridad a la frase 2.

La gran mayoría de los primeros sistemas que analizaban sentimientos clasificaban las opiniones usando un baremo como el de las reseñas de películas. Es decir, se simplificaba la clasificación haciendo que el sistema pudiera detectar una única polaridad de la opinión (lo que valdría para las frases 1 y 3).

El texto 2, sin embargo, demuestra la necesidad de analizar el mensaje más detalladamente, ya que en realidad expresa dos opiniones: una sobre el ambiente del local (positiva) y otra sobre el servicio (negativa). Dos aspectos sobre el mismo tema que forman parte de la opinión.

Las redes sociales son espacios de opinión. Tracy Le Blanc/Pexels

Así, cada objeto o tema puede incluir diferentes aspectos. En el caso de que el tema sea restaurantes, los aspectos a tener en cuenta podrían ser el ambiente, el precio, el servicio, la calidad de la comida, etc. Mientras que si el tema es sobre cámaras de fotos, los aspectos se corresponderían, por ejemplo, con las características del dispositivo.

Finalmente, en los ejemplos anteriores se ponen de manifiesto algunas de las dificultades a las que se enfrentan los sistemas de análisis de sentimientos: por ejemplo, la expresión “nos planteamos el porqué de su estrella” no indica explícitamente la polaridad de la opinión y las expresiones idiomáticas como “doler el bolsillo” y el lenguaje informal característico de las redes sociales como Twitter (“jajaja”) suponen obstáculos adicionales para el análisis automático.

¿Depende del idioma?

Ahora bien: ¿cómo es un programa capaz de reconocer nuestros sentimientos y saber si nuestras opiniones en las redes sociales son positivas o negativas, independientemente de que escribamos en lenguaje no estándar y en diferentes idiomas?

Resumiendo, se podrían distinguir tres métodos principales para detectar y clasificar sentimientos en un idioma concreto:

El primero consiste en generar previamente diccionarios de palabras tipo que indican si una frase es positiva o negativa (doler, mediocre, morir, “ja”) e identificar automáticamente esas palabras en el texto a clasificar.
El segundo consiste en la generación manual de reglas. Una regla como “adjetivo buen + nombre” podría ser buena para detectar expresiones con polaridad positiva. Estas reglas pueden llegar a ser muy elaboradas teniendo en cuenta la complejidad que puede alcanzar la estructura sintáctica de las oraciones.
El tercero consiste en aplicar técnicas de aprendizaje automático sobre un conjunto de textos generados previamente para entrenar modelos de clasificación estadística. Una vez se les enseña qué es positivo y qué es negativo, pueden hacer predicciones para clasificar otras publicaciones y mensajes.

Los tres métodos se aplican a un solo idioma y los tres asumen que se va a trabajar con lenguaje correcto gramatical y ortográficamente. Esto supone que, en casos como el texto 3 (jerga de Twitter) hay que transformar las expresiones a lenguaje estándar.

¿Hasta qué punto son fiables?

Los sistemas de análisis de sentimientos se evalúan mediante métodos cuantitativos y cualitativos.

La evaluación cuantitativa compara automáticamente los resultados del análisis del sistema respecto a un conjunto de textos y se calcula el margen de error. Esta evaluación permite guiar el desarrollo del sistema de análisis de sentimientos para modificarlo y paliar fallos.
La evaluación cualitativa la realizan personas con el objetivo de valorar si el sistema proporciona información relevante y útil para una aplicación en concreto. Por ejemplo, para detectar la bajada en clientes de una cadena hotelera, la explicación de los malos resultados electorales de un partido político, entender la pérdida de suscriptores de un medio digital, etc.

Ambas evaluaciones se realizan con respecto a una colección amplia de textos (miles de ellos), ya que al valorar si el sistema ha funcionado bien solo para una frase podríamos encontrar un acierto o fallo puramente anecdótico.

El valor de los sistemas de análisis de sentimientos y opiniones reside, por tanto, en la agregación de miles o millones de mensajes y publicaciones sobre un tema específico. Y sí, son fiables. Aunque, como el resto de las tareas de procesamiento del lenguaje natural, sigan teniendo margen de mejora. Pero son ya tan fiables que desde hace años sus aplicaciones para las empresas y para las administraciones no deja de crecer.

Este artículo fue publicado originalmente en The Conversation. Lea el original.