Tabla de contenidos
Normas
✅ Planificar iteraciones
En alemán decimos que Roma no se construyó en un día; lo mismo se aplica a los datos de entrenamiento de tu chatbot. Un chatbot robusto se construye mediante múltiples iteraciones, ciclos de entrenamiento y pruebas y mediante monitoreo continuo y ajuste del rendimiento: CÓDIGO, PRUEBA, DESPLIEGUE, REPETICIÓN.
❌ NO subestimes la necesidad de una medición constante del rendimiento
Sin medir el rendimiento con conversaciones de usuarios reales, nunca sabrás si tu chatbot realmente está funcionando para tus usuarios.
✅ DO: aplicar la regla 80/20 para probar expresiones
La mayoría de los equipos se sienten tentados a utilizar el 100% de los datos disponibles para la formación del bot. No hagas esto. No sabrás si tus datos de entrenamiento funcionan si usas parte de los datos de entrenamiento también para las pruebas. La regla general es utilizar el 80% de los datos para el entrenamiento y el 20% para las pruebas.
Si la cantidad de datos disponibles es muy pequeña, puedes probar la validación K-Fold para obtener algunas ideas sobre la calidad de tus datos.
❌ NO confíes en pruebas de humo o pruebas de camino feliz
Nuevamente, la regla 80/20: el 20% es el trabajo dedicado a la zona de confort, el 80% del trabajo es la prueba y la corrección de errores. El 20% de tus usuarios seguirá el camino feliz, el 80% saldrá. Prepárate para esto.
✅ DO: dedica una cantidad de tiempo razonable a las pruebas exploratorias
Las pruebas de regresión automatizadas son superiores para encontrar defectos que sabes que pueden ocurrir. No ayudará a encontrar defectos que no conoces. Dedica algún tiempo a las pruebas exploratorias (= manuales): intenta llevar tu chatbot al límite y más allá.
❌ NO: ignora la necesidad de volver a realizar la prueba después del entrenamiento
Nunca sabrás qué efecto tendrá en otro punto del chatbot la introducción de nuevos datos, hasta que lo pruebes. Realiza una prueba de regresión completa de tu modelo NLU cada vez que realices cambios.
✅ DO: pruebas fuera de contexto
Uno de los comportamientos más parecidos a los humanos es desplazarse hacia arriba en el historial de conversaciones en la ventana del chatbot y reanudar desde un paso anterior. La mayoría de los chatbots fallarán en este desafío si no se preparan para que sean capaces de superar la situación.
Plan de ACCIÓN
A continuación se ofrecen sugerencias para abordar lo que debes y no debes hacer cuando estás probando el entrenamiento de tu chatbot:
Establecer una mentalidad de prueba continua
Las pruebas son una parte crucial del proceso de desarrollo. No existe una sola fase de prueba cuando se da vida a un chatbot. Las pruebas deben ser parte del trabajo diario del equipo, al igual que la codificación, el diseño y la supervisión.
Impresionante imagen que muestra pruebas continuas.
Pruebas holísticas
Tanto para los chatbots como para los productos de software en general, hay más que pruebas unitarias codificadas por los programadores.
Tipos de proyectos de prueba de Botium
- Prueba de regresión: identifica fallos o faltas en el flujo de la conversación antes de pasar a producción.
- Prueba de NLP: mejora la comprensión de tu chatbot.
- Prueba E2E: verificación de la experiencia del usuario final.
- Pruebas de voz: comprende a tus usuarios en los canales de voz.
- Prueba de rendimiento: asegúrate de que tu chatbot responde ante un mensaje con mucha información.
- Pruebas de seguridad: haz que tu chatbot sea seguro.
- Monitoreo: recibe notificaciones cuando surjan problemas.
Coloca las herramientas adecuadas
Sin las herramientas adecuadas, estarás perdido. Con Botium Box, estás preparado para los desafíos de implementarlos e integrarlos en el ciclo de vida de desarrollo de tu chatbot.
Obtén tu prueba gratuita de Botium Box Mini aquí