Anthropic acaba de presentar Claude 3.5 Sonnet, un nuevo modelo mejorado que supera a rivales como GPT-4o de OpenAI o al Gemini de Google y su predecesor Opus en las pruebas de rendimiento más importantes con importantes aumentos de velocidad y reducciones de costes en una amplia variedad de tareas.
El Claude 3.5 Sonnet será, en última instancia, el modelo intermedio de la gama. Anthropic utiliza el nombre Haiku para su modelo más pequeño, Sonnet para la opción intermedia más popular y Opus para su modelo de gama más alta. (Los nombres son raros, pero todas las empresas de inteligencia artificial parecen nombrar las cosas a su manera, así que lo dejaremos pasar).
Pero la empresa afirma que el 3.5 Sonnet supera al 3 Opus, y sus pruebas demuestran que lo hace por un margen bastante amplio.
Los detalles:
- 3.5 Sonnet ofrece el doble de velocidad que Opus, mientras que su precio simbólico es 1/5 del coste del anterior modelo de gama alta de Anthropic.
- 3.5 Sonnet supera a Opus y GPT-4o en varias pruebas de razonamiento, código, matemáticas y conocimientos. Dicho esto, el Claude 3.5 Sonnet parece impresionante: superó al GPT-4o, al Gemini 1.5 Pro y al Llama 3 400B de Meta en siete de nueve pruebas comparativas generales y en cuatro de cinco pruebas comparativas de visión.
- Anthropic dice que Claude 3.5 Sonnet será mucho mejor escribiendo y traduciendo código, manejando flujos de trabajo de varios pasos, interpretando tablas y gráficos y transcribiendo texto de imágenes. Al parecer, este Claude nuevo y mejorado también entiende mejor el humor y puede escribir de forma mucho más humana.
- Anthropic presentó «Artifacts», una nueva función que permite a los usuarios ver, editar y construir con Claude en un espacio de trabajo en tiempo real en el panel lateral. Con Artifacts, podrás ver e interactuar con los resultados de tus peticiones a Claude: si le pides al modelo que diseñe algo para ti, ahora puede mostrarte cómo queda y permitirte editarlo directamente en la aplicación. Si Claude te escribe un correo electrónico, puedes editarlo en la aplicación Claude en lugar de tener que copiarlo en un editor de texto. Es una función pequeña, pero inteligente.
- La empresa afirma que las versiones 3.5 de Haiku y Opus llegarán «a finales de este año», junto con nuevas funciones como Memory.
Después de que GPT-4o le robara brevemente el primer puesto en la clasificación de LLM, la última actualización de Anthropic parece recuperar el trono. La aceleración de los modelos no se detiene, y si la 3.5 Sonnet ya es tan buena, la próxima versión 3.5 Opus podría llevar a los LLM a nuevas cotas.
No se habla tanto de Claude como de Gemini o ChatGPT, pero está muy en la carrera.