El aporte de la lingüística al desarrollo de chatbots o asistentes virtuales

Así es la evolución de los asistentes virtuales y el aporte de las ciencias humanas como la lingüística al desarrollo de los chatbots.

- ,
linguistica-chatbot

Hasta la década pasada en el desarrollo de los productos digitales, y en general el mundo de la tecnología, se había priorizado los lenguajes formales y la aplicación de las ciencias exactas para su evolución. Las ciencias sociales no ejercían un rol protagónico ni se incluían en estos procesos.

Al poner en el centro de estos desarrollos el usuario y sus interacciones permite que postulados importantes de ciencias como la lingüística, la sociología, la economía y la psicología, ejerzan un papel decisivo en las dinámicas de desarrollo. Es por esto, que hoy no nos es extraño escuchar hablar de conceptos como comportamiento, pensamiento, intención, contexto, empatía para valorar y evaluar un producto digital.

¿Por qué la lingüística como ciencia social es importante para la evolución de la inteligencia artificial?

La capacidad innata que tenemos como seres humanos de comunicarnos  es la  que nos permite crear realidades, construir el mundo y generar acciones, crear e innovar. Es a través del lenguaje natural que describimos e informamos acontecimientos, que relatamos historias que proponemos acciones. Con el lenguaje  actuamos, con el lenguaje “hacemos cosas” y estas se expresan o se enuncian por medio de las intenciones.

robot-ia

La intención es un fenómeno estudiado por la pragmática del lenguaje (cuyo objeto de estudio es el uso del lenguaje en función de la relación que se establece entre enunciado-contexto- la intención comunicativa) es un término muy usado en los motores cognitivos con los que se desarrollan los asistentes virtuales (chatbots).

Una intención comunicativa se define como: “la idea que se persigue con cierta acción y/o comportamiento”. Si nos basamos en esta definición nos damos cuenta que los “intents” en los motores cognitivos se definen de la misma manera, como las acciones que el usuario desea realizar a través del asistente virtual.

Un Intent es entonces una colección de oraciones o frases que tienen el mismo significado, donde subyacen un solo deseo del usuario, pero expresado de muchas maneras. El propósito de los “intents” es correlacionar estas oraciones con lo que esperamos que el haga el bot (por ejemplo, le decimos al robot que “haga una reserva” y esperamos que se realice una reserva y recibir una confirmación, o si queremos obtener información del plazo para retirar una compra hecha por Internet y con la posibilidad de retirar en la tienda). La colección de oraciones, también llamadas frases de entrenamiento (utterances), es la forma cómo le pedimos al bot que active el “Intent”: Compra_Online Retiro_Tienda.

En una simple definición, la intención es transmitir mi deseo y lograr que mi interlocutor me escuche y actúe de acuerdo a lo que yo le he pedido, en el caso de los asistentes virtuales, es el bot quien debe responder o cumplir con mi solicitud del usuario. Es estos turnos conversacionales pueden ocurrir muchas cosas, que el bot no comprenda del todo la intención del usuario, sea porque no está entrenado para dar una respuesta para lo demandado por el usuario, sea porque el usuario no fue lo suficientemente explícito en lo que expreso.

Entonces, la intención puede estar expresada por una sola palabra o por palabras claves en algunas ocasiones, esto siempre va a depender del contexto y de la situación de comunicación, pero por lo general, es indispensable escribir “oraciones completas” para que el bot pueda entender y dar una respuesta adecuada.

Este proceso permite generar lenguaje natural, sin embrago, no es un proceso natural como el que sucede en el cerebro de un ser humano, porque si bien las respuestas están integradas por palabras, artículos, pronombres,  verbos, sustantivos no se generan diferentes frases para cada intercambio conversacional, como un acto individual de utilización (“enunciación”: Benveniste). Eso sería lo ideal,  tal vez en un par de años sea así, pero por el momento las respuestas generadas son automáticas. Encontraremos entonces en nuestra ventana de conversación una respuesta clara y en relación con nuestra pregunta, a veces estas respuestas pueden ser personalizadas devolviendo el nombre del usuario o del producto pero son pre establecidas.

El lenguaje natural es muy complejo no solo por la ambigüedad que presentan los diferentes usos y significados de las palabras sino también por el vasto vocabulario que se maneja y el significado dependiente del contexto.

En el caso del español, crear un bot es una tarea que puede exigir dedicación y mucho entrenamiento dada lo prolija que es la lengua y a raíz también de todos sus modismos junto con las variantes regionales dentro y fuera de América Latina.

Palabras cortas grandes sentidos

En el proceso de creación de un asistente virtual intervienen varias  disciplinas de la lingüística que son necesarias para el desarrollo del bot y sus funcionalidades: fonología, morfosintaxis, semántica y pragmática. La fonología es utilizada en caso de los bots que tiene reconocimiento vocal. Las otras disciplinas como la morfosintaxis, la semántica, y  la pragmática hacen parte del análisis y la comprensión  de los textos escritos.

linguistica-chatbot

Muchas veces hemos escuchado hablar de la web semántica y de los motores de búsqueda semánticos, estos se basan en el procesamientos de palabras claves  sin tener en cuenta el significado de las palabras con los contenidos de las páginas. Para poder ir más allá del significado unívoco de las palabras, es necesario tener en cuenta el uso de estas bajo un contexto dado, esto implica incluir los fundamentos de la pragmática para hacer que el bot asemeje su forma de comunicar con el de un ser humano.  Donde la estructura del lenguaje importa pero no es definitiva, ya que toca lo que está en el discurso y lo adecua al contexto (entendido  como todo aquello que envuelve la situación de comunicación).

Entonces, el éxito de desarrollo de un chatbot tiene mucho que ver con el diseño de conversaciones o flujos de conversación que se asemejen al que tiene un usuario cuando consulta a un asistente o un vendedor en una tienda, pensar en la interacción real, definir bien los turnos conversacionales, establecer las inferencias y sobre todo priorizar el uso de los tópicos y de los sentidos que pueden tener las palabras bajo el contexto dado. . En esto consiste la riqueza del lenguaje natural porque se tiene en cuenta, el dinamismo de las interacciones y los referentes.

En la definición de los intents no podemos poner de lado palabras chicas, como las preposiciones, los pronombres complementarios y algunos deícticos porque muchas veces hacen grandes diferencias.

No es lo mismo decir: “me río de él” que decir “me río con él”; “tomé un vuelo desde Barcelona a Madrid” que decir “tome un vuelo a Barcelona desde Madrid”, en esta frase si cambio las preposiciones “desde” y “ a”

y las ubico en otra parte de la oración, estaría cambiando el sentido de la oración.

“Tomé un vuelo desde Barcelona a Madrid”

“Tomé un vuelo a Barcelona desde Madrid”

Analicemos dos palabras como cancelar y pagar y veamos como estas pueden tomar diferentes significados dependiendo del contexto que nos encontremos.

Si el chatbot que estamos entrenando es de una entidad financiera, la palabra pagar y cancelar pueden ser sinónimas si lo que busca el usuario es pagar el consumo del mes. Sin embargo, ante un enunciado como “cancelar tarjeta”, esta frase podría generar ambigüedad porque no sabemos si el usuario quiere pagar la tarjeta o lo que desea es no continuar contratando los servicios de la empresa.

Si tomamos este mismo ejemplo pero lo  una empresa de cobranzas, estas palabras serían 100% sinónimas porque sabemos que el usuario las va a usar indistintamente para expresar el deseo de pagar algo que debe. De hecho estas pueden ser consideradas como una intención sin necesidad de dentro de una oración estructurada.

Por lo tanto, no se pueden hacer análisis de palabras sueltas o de interacciones sin tener en cuenta la situación de comunicación que es la que da en definitiva el sentido “meaning” a las palabras.

Es cierto que las capacidades actuales de los chatbots en términos de comprensión del lenguaje natural son aún limitadas. Sin embargo, existen opciones que pueden mejorar la interacción, imágenes, botones o incluso calendarios para mejorar la experiencia del usuario. La precisión y utilidad de un chatbot y por lo tanto el sentir del usuario, dependerán en primer lugar de la atención dada a la construcción de su estructura conversacional.

En lo que compete a las respuestas, más que correctas o incorrectas estas deben ser construidas para satisfacer la necesidad del usuario. En la pragmática del lenguaje no se habla de mensajes verdaderos o falsos sino de mensajes exitosos o fallidos. El papel del UX Writer es construir esta experiencia con las palabras, usando un estilo y un tono acorde al público objetivo, definiendo una voz que haga recordar “con quién”(marca) se están comunicando. Las interacciones con el chatbot deben ser tan efectivas como las que se tienen con un humano (vendedor, ejecutivo de cuentas, asesor comercial). Si bien el “juego” de estos intercambios conversacionales no son tan ricos e infinitos como en una interacción humano-humano, deben ser los suficientemente dinámicas como las que se dan en el lenguaje natural.

¿Qué habría en el imaginario de los usuarios sobre los chatbots?

Para evitar que el usuario crea que un asistente virtual o chatbot puede responder a absolutamente todas las preguntas que se le ocurra, es necesario comenzar con la conversación con una corta presentación del bot, de su objetivo y de sus capacidades con el fin de no generar falsas expectativas.

Un chatbot se va alimentando (entrenando) poco a poco es un trabajo constante y diario. Todos los días puede ir creciendo en capacidades y en conocimiento, es un labor que se va trabajando por etapas. Es por esto que muchas veces no responden correctamente al deseo del usuario porque el usuario porque el tema consultado no ha sido lo suficientemente desarrollado. Es en este punto donde la sociolingüística ha hecho su aporte a la evolución de la experiencia de usuario porque nos permite ver todo aquello que no reposa en el lenguaje mismo. Nos da luces de los comportamientos de los hablantes (usuarios en el mundo digital) y nos ayuda a segmentar a esos personas por sus gustos y motivaciones. Nos deja ver cuáles son las formas preferidas usadas y las “normas” que se han establecido entre los hablantes para comunicarse. No olvidemos que con el lenguaje no solamente se transmiten mensajes sino que se generan “interpretantes” (en términos de Peirce) que a su vez viene siendo las experiencias.

Por lo tanto, para que un chatbot sea cada vez más eficiente debemos recurrir a los test de usuarios y a las preguntas que se hacen para saber que es lo que buscan resolver y cómo es la manera más adecuada de presentarlo.

Para terminar, quiero exponer otras dos situaciones en las que siempre el chatbot se ve en dificultades, y es cuando no tiene la información del usuario para responder a preguntas muy específicas o cuando el usuario se niega a dar datos de los que el chatbot necesita para dar una respuesta más acertada. Estas situaciones aún no son del todo resueltas, tal vez por el usuario no entiende que está frente a un bot y hace consultas tan específicas que sin consultar en una base de datos es imposible resolver o tal vez porque si bien el bot está en la capacidad del resolver la petición pero el usuario no desea dar sus datos por inseguridad o por temor de ser usados. Esto sería como ir a un banco y pedirle al asesor que nos indique qué paso con nuestra cuenta bancaria sin dar nuestro nombre o nuestra identidad.

Generar confianza y explicar los procesos de forma clara y concisa disipan las dudas del usuario y fomentan el aprendizaje del uso de esta entretenida tecnología.

Entradas del mismo autor

Deja un comentario