Anthropic acaba de presentar Claude 3.5 Sonnet, un nuevo modelo mejorado que supera a rivales como GPT-4o de OpenAI o al Gemini de Google y su predecesor Opus en las pruebas de rendimiento m谩s importantes con importantes aumentos de velocidad y reducciones de costes en una amplia variedad de tareas.

El Claude 3.5 Sonnet ser谩, en 煤ltima instancia, el modelo intermedio de la gama. Anthropic utiliza el nombre Haiku para su modelo m谩s peque帽o, Sonnet para la opci贸n intermedia m谩s popular y Opus para su modelo de gama m谩s alta. (Los nombres son raros, pero todas las empresas de inteligencia artificial parecen nombrar las cosas a su manera, as铆 que lo dejaremos pasar).

Pero la empresa afirma que el 3.5 Sonnet supera al 3 Opus, y sus pruebas demuestran que lo hace por un margen bastante amplio.

Image source: Anthropic

Los detalles:

  • 3.5 Sonnet ofrece el doble de velocidad que Opus, mientras que su precio simb贸lico es 1/5 del coste del anterior modelo de gama alta de Anthropic.
  • 3.5 Sonnet supera a Opus y GPT-4o en varias pruebas de razonamiento, c贸digo, matem谩ticas y conocimientos. Dicho esto, el Claude 3.5 Sonnet parece impresionante: super贸 al GPT-4o, al Gemini 1.5 Pro y al Llama 3 400B de Meta en siete de nueve pruebas comparativas generales y en cuatro de cinco pruebas comparativas de visi贸n.
  • Anthropic dice que Claude 3.5 Sonnet ser谩 mucho mejor escribiendo y traduciendo c贸digo, manejando flujos de trabajo de varios pasos, interpretando tablas y gr谩ficos y transcribiendo texto de im谩genes. Al parecer, este Claude nuevo y mejorado tambi茅n entiende mejor el humor y puede escribir de forma mucho m谩s humana.
  • Anthropic present贸 芦Artifacts禄, una nueva funci贸n que permite a los usuarios ver, editar y construir con Claude en un espacio de trabajo en tiempo real en el panel lateral. Con Artifacts, podr谩s ver e interactuar con los resultados de tus peticiones a Claude: si le pides al modelo que dise帽e algo para ti, ahora puede mostrarte c贸mo queda y permitirte editarlo directamente en la aplicaci贸n. Si Claude te escribe un correo electr贸nico, puedes editarlo en la aplicaci贸n Claude en lugar de tener que copiarlo en un editor de texto. Es una funci贸n peque帽a, pero inteligente.
  • La empresa afirma que las versiones 3.5 de Haiku y Opus llegar谩n 芦a finales de este a帽o禄, junto con nuevas funciones como Memory.

Despu茅s de que GPT-4o le robara brevemente el primer puesto en la clasificaci贸n de LLM, la 煤ltima actualizaci贸n de Anthropic parece recuperar el trono. La aceleraci贸n de los modelos no se detiene, y si la 3.5 Sonnet ya es tan buena, la pr贸xima versi贸n 3.5 Opus podr铆a llevar a los LLM a nuevas cotas.

No se habla tanto de Claude como de Gemini o ChatGPT, pero est谩 muy en la carrera.

Por 脕ngel Leonardo Torres

Todo evoluciona 驴te vas a quedar atr谩s? Hablo un poco de inteligencia artificial y tecnolog铆a Electr贸nica y Telecomunicaciones.

Deja una respuesta

Tu direcci贸n de correo electr贸nico no ser谩 publicada. Los campos obligatorios est谩n marcados con *