El futuro ha llamado a la puerta de tu oficina: eres diseñador o diseñadora UX y has recibido la tarea de crear el diálogo para la interfaz conversacional de un asistente virtual (AV) o un chatbot. Esto significa que tu objetivo es, prioritariamente, el desarrollo de una solución de voz centrada en el usuario. En el planteamiento de una experiencia en voz o una experiencia multimodal guiada por voz, dicha meta se relaciona con las siguientes acciones:

  1. La creación de una interacción conversacional lo más natural posible.
  2. La solución plena del problema planteado a través del intercambio conversacional.
  3. La definición de la persona del AV/chatbot.
  4. El desarrollo de memoria conversacional para el AV/chatbot.
  5. La contextualización de los universales de la conversación de manera natural.

1. Interacciones conversacionales naturales

Alexa, ¿conversarás algún día como un humano?

Como diseñador UX de interfaces conversacionales, debes pensar en la interacción entre el humano y la máquina como una unidad completa desde el principio hasta el fin y siempre desde el punto de vista de cómo el usuario experimenta la interacción verbal con el AV/chatbot.

La materialización de dicha perspectiva en el diseño de diálogos humano-máquina se traduce en la aplicación de prácticas conversacionales y estructuras interactivas propias de los humanos.

Al respecto, algunas de las soluciones con las que puedes mejorar tu diseño, de cara a la creación de interacciones más naturales, son:

  • Expande los intercambios tipo “comando-respuesta” con modelos más complejos de interacción y otros elementos conversacionales extraídos del diálogo entre humanos.
  • Incluye turnos de bienvenida para que tu interfaz de voz/chatbot cuente con la habilidad de estructurar de manera adecuada la apertura de la conversación desde un punto de vista sociopragmático.
  • Proporciona una variedad suficiente de turnos de apoyo (vale, perfecto, ok, sí) en las respuestas de la máquina. Su presencia es necesaria para generar secuencias de turnos (multi-turn sequences) con el nivel apropiado de cohesión interna.

Los turnos de apoyo de acuerdo generan un mayor grado de cohesión pragmática entre intents.

  • Utiliza secuencias de reparación para restablecer la intersubjetividadentre el humano y la máquina después de que se haya producido un error de audición, habla o comprensión. Las reparaciones resultan también más eficientes en el proceso de recuperación de errores cuando se extraen de modelos conversacionales naturales.
  • Diseña experiencias multimodales basadas en voz donde las transiciones entre los canales verbales y no verbales (táctil/visual) sucedan de manera sincronizada y multidimensional, tal como sucede en la comunicación entre humanos.
  • Usa modelos lingüísticos que incluyan aspectos relacionados con la cortesía y las dimensiones socioculturales de la conversación: expresiones agradecimiento como por favor / gracias deben incluirse tanto en los turnos del humano como en los de la máquina. Esta decisión refleja el tono formal de los intercambios transaccionales entre humanos, en los que el comportamiento viene marcado por la tendencia a interactuar de manera informal pero, al mismo tiempo, manteniendo cierta distancia social.

2. Soluciona el problema

¿Cuál es el objetivo final de la conversación?

Concéntrate en el objetivo finalque debes alcanzar con el diálogo. ¿Te encuentras, por ejemplo, diseñando una experiencia multimodal para la adquisición de prendas de vestir en una tienda online? En ese caso, define la psicología de tu AV/chatbot semejante a la de un vendedor y transfiere a la conversación humano-máquina las prácticas interactivas típicas de la tienda física y la versión Web o la app del servicio.

En el contexto específico de las compras a través de experiencias multimodales basadas en voz, algunas de las estrategias de implementación del diálogo que puedes llevar a cabo son:

  • La inserción de descripciones del artículo, en mayor o menor grado detalladas, a la conversación humano-máquina con fines informativos para el cliente.
  • El planteamiento de preguntas al cliente sobre su opinión sobre el artículo que se encuentra evaluando con el objetivo de (1) proporcionar otras opciones en caso de respuesta negativa o (2) agilizar la compra en caso de recibir una reacción positiva.
  • El ofrecimiento de opciones complementarias que amplíen la venta.
  • La agilización de la materialización de la compra con diversas técnicas de marketing (por ejemplo, limitando la cantidad de artículos disponibles).
  • La inclusión (o no) de turnos de confirmación en el momento de realización del pago.

3. Personas bien definidas

Todo el mundo lleva una máscara, tu VUI/chatbot también.

En el diseño UX conversacional, la creación de una persona adecuada para la máquina, que represente tanto la marca como el producto en sí, representa una decisión esencial, ya que facilita que los usuarios puedan interactuar socialmente con ella de manera más efectiva.

Cuando los humanos interactuamos con agentes de software, interpretamos su agencia como un tipo de acción social. Dicha elaboración psicológica de las capacidades sociales de la máquina se acentúa aún más en la cognición humana cuando mantenemos una conversación con un AV/chatbot.

Esto significa que la persona de la máquina debe quedar correctamente definida para, posteriormente, poder transferirla al diálogo en el lenguaje, el tono y las emociones que la máquina emplea con el usuario.

Las soluciones de diseño que puedes llevar a cabo relacionadas con este punto son las siguientes:

  • Define siempre una personalidad coherente con el servicio que esté proporcionando el AV/chatbot. Si el humor no es estrictamente necesario en la persona de tu chatbot, exclúyelo de tu diálogo.
  • El carácter, los sentimientos o las actitudes que muestre el AV/chatbot en su lenguaje también debe ser coherente con la marca y el producto que la máquina representa.
  • Usa un lenguaje que personalice el servicio y fomente el compromiso del usuario con la experiencia en voz/multimodal.

4. Memoria conversacional

La creación de memoria tanto a largo como a corto plazo para el AV/chatbot constituye una de las acciones fundamentales para que el usuario disfrute de una experiencia completamente satisfactoria conversando con la máquina.

Para que la máquina sea completamente conversacional, el AV/chabot debe recordar el contenido de las interacciones previas con el usuario en el mismo contexto (es decir, en la aplicación de voz en sí), además de la información que están compartiendo en el intercambio en marcha.

5. Universales contextualizados de manera natural

Alexa, ayuda.

En el diseño conversacional UX, el términouniversal de la conversación se define como las acciones que deben estar presentes en todos los estados (menú principal, ayuda, despedida, etc.).

En las interfaces conversacionales, no es posible (ni recomendable) mantener dichos conceptos en sentido estricto, pero es importante asegurarse de que el usuario pueda acceder a ellos durante su navegación de manera natural, intuitiva y, sobre todo, conversacional.

Dicha acción resulta especialmente relevante en el caso de la ayuda cuando los clientes se encuentran por primera vez en contextos interactivos multimodales. En estos casos, resulta inteligente la aplicación de un enfoque en el diseño de la interacción en el que la máquina aconseje de manera puntual la manera más eficiente (canal o aparato dentro de una combinación posible) para comunicarse con ella en dicho contexto dado.

En resumen

Como diseñador o diseñadora UX conversacional, tu principal objetivo debe ser la creación de productos en voz o multimodales centrados en las necesidades del cliente. Dicha acción equivale a comprender y saber aplicar:

  1. Cómo el usuario humano se encuentra cognitivamente preparado para experimentar la interacción en voz con la máquina;
  2. Cuáles son las estructuras conversacionales que aplica en sus conversaciones cotidianas, cuyo empleo sería natural emplear con la máquina;
  3. De qué manera interpreta la agencia social de la máquina;
  4. Qué tipo de información espera que la máquina memorice; y
  5. Qué es lo que necesita aprender para navegar la aplicación en voz o multimodal de manera eficiente.

Y, especialmente, el nuevo problema de la multimodalidad es el que te va situar como diseñador en contextos interactivos para los que nadie cuenta todavía con una solución óptima, en esos nuevos mundos a los que nadie ha podido llegar todavía.

¡Una gran tarea pero increíblemente apasionante!

Por Carmen Martínez

La Dra. Carmen Martinez es Analista de Conversación y Etnógrafa de Comunicación que trabaja en Inteligencia Artificial Conversacional en FlixBus. Como experta en conversaciones de persona a persona, contribuye a un equipo multidisciplinario automatizando las interacciones de servicio al cliente, modelando conversaciones de persona a máquina basadas en texto y voz, y desarrollando soluciones visuales para agentes conversacionales gráficos y multimodales. Carmen tiene un doctorado en Análisis de Conversaciones y es autora de “Conversar en español: un enfoque desde el Análisis de la Conversación” publicado por Peter Lang Berlin.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *