Tabla de contenidos

Introducción

En esta investigación basada en una matriz de comparación de diez puntos analizo las fortalezas, debilidades y posibles áreas de crecimiento de cada solución …

He construido prototipos con la mayor parte de la nube comercial y las plataformas de AI y UI conversacionales de código abierto actualmente disponibles. Obviamente habrá aspectos importantes que no he contemplado, por lo que cualquier comentario al respecto será más que bienvenido.

También hay una gran cantidad de otras herramientas de diseño y desarrollo disponibles; la idea aquí es centrarse en los servicios comerciales y autónomos más amplios.

Tendencias generales

Para empezar, están surgiendo seis tendencias generales en el mundo de los chatbots:

  1. Ha habido una creciente actividad en las interfaces de voz, particularmente el acceso a través de una llamada telefónica, y no necesariamente un dispositivo de asistente de voz. IBM Watson Voice Agent se lanzó en 2018, pero a partir de marzo de 2021 quedará obsoleto y se integrará completamente en Watson Assistant como la integración de teléfono recién lanzada. Además, se lanzaron Google DialogFlow CX y NVIDIA Jarvis.
  2. Desactivación de intenciones. Esto también se conoce como aprendizaje endtoend. La desaprobación por intención introduce más flexibilidad en términos de entradas de usuario y de hacer coincidir esas entradas con un nodo de diálogo.
  3. Las intenciones y las entidades continúan fusionándose y la anotación contextual de las entidades dentro de la intención o el enunciado se está volviendo algo común y muy necesario. Las entidades compuestas también son cada vez más importantes.
  4. Las estructuras de datos se introducen en las entidades… Esta tendencia es visible con Rasa, la herramienta de conversaciones de Alexa y especialmente Microsoft LUIS. Rasa lo llama Entidades, Roles y Grupos. AWS lo llama Slots with Properties. Y Microsoft LUIS, entidades ML que se pueden descomponer.
  5. Las instalaciones de Edge son cada vez más importantes… NVIDIA Jarvis y Rasa vienen a la mente para instalar en cualquier lugar.
  6. La depreciación de la máquina de estado es inevitable, Rasa está liderando la carga aquí. IBM está introduciendo la automatización en su sistema de gestión de diálogos con puntuaciones de esfuerzo del cliente y menús de desambiguación automática. Es necesario mencionar las acciones de Watson.

Descripción general del entorno de desarrollo

Los entornos son generalmente muy similares en su enfoque a las herramientas disponibles para crear una interfaz conversacional.

Teniendo en cuenta lo que está disponible, los entornos de desarrollo de chatbot aún se pueden segmentar en 4 grupos distintos.

Estos son:

  • Ofertas líderes en la nube comercial.
  • Herramientas NLU / NLP (principalmente de código abierto)
  • Lo que se conoce como Avant-Garde & Edge.
  • El servicio cloud en el que te encuentras.

Oferta comercial líder en la nube

Los entornos de nube comerciales atraen a clientes y usuarios únicamente por su capacidad y presencia de procesamiento del lenguaje natural, facilidad de uso sin instalación y gestión del entorno.

Microsoft Bot Framework Composer

Entre estos, cuento IBM Watson Assistant, Microsoft Bot Framework / Composer / LUIS / Virtual Agents, Google Dialog Flow, etc.

Las empresas más potentes apuesta por estos entornos, por supuesto, a un costo significativo. Estos se consideran una apuesta segura, para cumplir con sus requisitos de IA conversacional.

Son vistos como proveedores de herramientas de chatbot en sí mismos.

El escalado de cualquier solución empresarial no será un problema y el desarrollo y aumento continuo de las herramientas es un hecho. Los recursos abundan con material técnico, tutoriales y mucho más.

Herramientas NLU / NLP

También hay herramientas (de código abierto) como Hugging Face, spaCy, Apache OpenNLP, RASA NLU y otras que se pueden utilizar para procesar el lenguaje natural en tu propio entorno.

Algunas organizaciones están creando su propio framework haciendo uso de estas herramientas.

Industrial-Strength Natural Language Processing

Esta es la ruta más difícil y requiere más tiempo, pero si tienes un entorno existente, aumentarlo con capacidad de procesamiento de lenguaje natural y hacer uso de estas herramientas es una opción viable.

Es realmente asombroso el poder de la mayoría de estas herramientas de código abierto. Y con la documentación disponible, puede servir como un punto de partida “sin costo de software” para una primera incursión en el procesamiento del lenguaje natural. Cabe señalar que en algunos casos existen costos de empresa.

El Avant-Garde & Edge

Aquí RASA es el líder. Recientemente, desde una perspectiva de acceso a voz, NVIDIA Jarvis ha aparecido en el panorama. En este contexto, Jarvis tiene los dos impedimentos; acceso a la GPU NVIDIA según su arquitectura Turing o Volta. Y, en segundo lugar, la función de gestión y desarrollo del diálogo Jarvis está en desarrollo y aún no se ha lanzado.

RASA

Rasa sigue un camino único en términos de querer desaprobar la máquina de estado con sus flujos/árboles de diálogo codificados. Junto con su Conversation Driven Design(CDD) en forma de Rasa-X, esta es una opción muy convincente.

Tus entidades son conscientes del contexto y siguen un enfoque en el que las entidades y las intenciones realmente se fusionan.

Las entidades compuestas son parte de la oferta. Las entidades se pueden segmentar según roles y grupos.

Se ha anunciado e iniciado la desactivación de las intenciones. En función de su expansión, financiación, promoción de desarrolladores y eventos, esta es una empresa a tener en cuenta.

Con suerte, los players más grandes los emularán. Uno de sus puntos fuertes es la promoción de los desarrolladores y ser la tecnología elegida para los seed proyects. RASA ha logrado crear un público fiel de desarrolladores.

Usa la nube en la que estás

No puedo evitar sentir que Amazon Lex con Oracle Digital Assistant (ODA) se encuentran en este grupo. Mi sensación es que alguien no optará fácilmente por ODA o Lex si no tiene ya algún tipo de compromiso con Oracle o AWS desde una perspectiva cloud.

Especialmente si la solución que ya utilizan es Oracle Cloud u Oracle Mobile Cloud Enterprise. O con AWS a través de Echo y Alexa.

Oracle Digital Assistant

Otro impedimento de la ODA es el costo. El acceso gratuito juega un papel muy importante en la adopción por parte de los desarrolladores y la plataforma gana esa masa crítica. Hemos visto esto con IBM siendo muy accesible en términos de su nivel gratuito con una gran cantidad de funcionalidades.

Microsoft ha recorrido un largo camino en herramientas más accesibles, especialmente con entornos de desarrollo. RASA, aunque comenzó relativamente tarde, ha invertido mucho tiempo y esfuerzo en la defensa de los desarrolladores. Google Dialogflow también es popular y, a menudo, es un punto de partida para las empresas que exploran NLU y NLP.

La ODA no es lo suficientemente accesible y los impedimentos existentes para experimentar y crear prototipos no ayudan.

Tendencias intersectoriales

Crecimiento de la capacidad del chatbot

Estas tendencias incluyen:

  • Desaprobación intencionada.
  • Desambiguación de intenciones con menús de aprendizaje automático.
  • La fusión de intenciones y entidades.
  • Deprecation of the State Machine o al menos, hacia una interfaz más conversacional.
  • Entidades complejas; introduciendo entidades con propiedades, grupos, roles, etc.

Hay un crecimiento tanto horizontal como vertical con la tecnología chatbot. En el diagrama anterior, queda claro dónde se está produciendo este crecimiento:

Vertical — Tecnología

La interfaz de usuario conversacional se está alejando de un menú predefinido estructurado y una interfaz basada en palabras clave. Con movimiento hacia la entrada de lenguaje natural no estructurado y entrada de conversación más larga. Permitir a los usuarios desambiguarse cuando dos o tres intentos están cerca en puntuación. Utilizando esto como un mecanismo para el autoaprendizaje.

Horizontalexperiencia de usuario

En esta dimensión, el bot se está transformando de un bot de mensajería a una interfaz verdaderamente conversacional. Lejos de la navegación por clic para un eventual lenguaje natural compuesto sin restricciones.

El empleado digital

El juego final es donde el empleado digital, que emerge del entorno del chatbot, ha evolucionado hacia áreas de texto y habla.

Con conciencia contextual en cuatro niveles:

  • Dentro de la conversación actual.
  • De conversaciones anteriores.
  • De CRM y otras fuentes de datos relacionadas con el cliente / usuario.
  • A través de diferentes medios.

El crecimiento de un empleado digital dentro de una organización

El empleado digital crecerá a través de diferentes medios y modalidades. Dominar idiomas con detección, traducción, tono, sentimiento y categorización automática de conversaciones.

Los medios incluirán dispositivos como Google Home, Amazon Echo, IVR tradicional y más. Como nosotros, como humanos, podemos conversar en texto o voz; de manera similar, el empleado digital podrá conversar en texto o voz.

Matriz de calificación de ofertas de chatbot

Al calificar las nueve soluciones de chatbot, observé nueve puntos clave.Obviamente, la capacidad de NLU es clave en términos de intenciones y entidades. Fui especialmente severo en cuanto al grado en que las entidades pueden aplicarse de forma compuesta, anotadas y detectadas contextualmente con descomposición.

El diálogo y el desarrollo y la gestión del estado también son puntos clave; la facilidad de desarrollo es importante y en qué medida es posible la colaboración.

Los otros elementos se explican por sí mismos.

Clave para las calificaciones

Para diferentes organizaciones, los elementos dispares son importantes y guiarán su pensamiento y eventualmente determinarán su juicio. Por ejemplo, aunque Lex no se presenta en muchos aspectos, si una empresa está inmersa en AWS para otro servicio, Lex podría ser la opción correcta.

Lo mismo ocurre con Oracle, MindMeld, etc.

Herramientas de desarrollo de cuadros de diálogo / flujo de llamadas gráficas

Para organizaciones y equipos más grandes, la colaboración es importante. La facilidad para compartir partes del diálogo y la creación conjunta es primordial. Por tanto, las organizaciones necesitan entornos de desarrollo gráfico. Otros equipos prefieren un enfoque de código nativo más flexible.

Calificación del desarrollo y edición de flujo de llamadas de formularios GUI

IBM Watson Assistant hizo una gran adición con el lanzamiento de Actions.

Rasa con su herramienta llamada Rasa-X es tan única que es difícil categorizar con precisión con los otros entornos. Rasa-X es gráfico, permite la edición y el desarrollo, pero es mucho más completo.

La función de gestión y desarrollo del diálogo Jarvis está en desarrollo y aún no se ha lanzado.

NLU

La comprensión del lenguaje natural respalda las capacidades del chatbot. Sin la detección de entidades y el reconocimiento de intenciones, todos los esfuerzos por comprender al usuario fracasan.

En algunos elementos de un entorno de chatbot, la improvisación puede ser de gran ayuda. Este no es el caso de NLU. LUIS tiene una funcionalidad y categorización de entidades excepcionales. Esto incluye entidades descomponibles. IBM Watson Assistant también puede contarse como uno de los líderes, con RASA y NVIDIA Jarvis.

Capacidad de comprensión del lenguaje natural

También miré la integración de los componentes de NLU en los otros componentes del chatbot. Aquí es donde Microsoft sobresale con su creciente espacio de chatbot.

Escalabilidad

La madurez de cualquier marco se prueba en un entorno empresarial donde están presentes implementaciones con diversos casos de uso y una escala en constante expansión.

Escalabilidad y preparación empresarial

La preparación empresarial es un criterio de evaluación que no cuenta con la atención que merece. Una vez que se detectan las vulnerabilidades, ya se ha invertido demasiado dinero y tiempo en la tecnología.

Calificaciones generales

Es imposible comparar marcos uno a uno, por lo tanto, creé los cinco puntos de consideración como se ve en la próxima imagen. Cabe señalar que uno o más de estos cinco elementos pueden ser de mayor importancia para algunas organizaciones que para otras. Por lo tanto, eso puede llevarlos a cierta dirección.

Nuevamente, si una empresa ya ha invertido mucho en Oracle Cloud o AWS, ese será un gran factor decisivo para ellos. Anulando otras consideraciones y aliviando el dolor de otras deficiencias.

Matriz de puntuación basada en 5 elementos

El costo juega un papel importante, y esto nuevamente habla de la accesibilidad de entornos como Cisco MindMeld y RASA; especialmente para la creación inicial de prototipos.

Conclusión

Esta es una mera descripción general basada en una matriz con puntos de evaluación que personalmente considero importantes.

Y nuevamente, basado en cuán importante es un punto particular en la matriz para ti o para tu empresa, influirá en nuestro juicio.

En el análisis final, el software tiene un propósito en tu organización y en el panorama cloud actual. La oferta más adecuada para ese propósito es la mejor opción para ti.

Por Cobus Greyling

Rasa Hero. NLP / NLU, Chatbots, Voz, UI / UX conversacional, Diseñador CX, Desarrollador, Interfaces de usuario ubicuas.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *