Hace más de seis meses que Google anunció que estaba trabajando, junto con el equipo de Google DeepMind, en una IA Generativa multimodal que prometía ser un claro competidor de otros recursos que ya había en el mercado. Gemini, que es como decidieron bautizar a esta IA, sería una propuesta innovadora y revolucionaría que transformaría la interacción con sistemas inteligentes.
El pasado 6 de diciembre Google anunció de forma oficial el lanzamiento de la primera versión (1.0) de Gemini, una IA Generativa multimodal y flexible que gracias a la comprensión masiva de lenguajes multitarea (MMLU) es capaz de ofrecer una interacción fluida que reconoce en tiempo real modificaciones que se puedan producirse en el entorno que está observando.
Esta IA llega al mercado con diferentes versiones que permiten tanto a usuarios individuales como a empresas de todos los tamaños hacer uso de los recursos que ofrece. Estas versiones serían:
- Gemini Ultra: es la IA más potente y la que está detrás del vídeo que te mostramos unas líneas más abajo.
- Gemini Pro: cuyas capacidades serían similares a las de GPT 3.5.
- Gemini Nano: más eficaz y presente en diferentes dispositivos móviles como el Pixel 8 Pro.
De acuerdo a las pruebas realizadas por la compañía y a los datos publicados en el blog de Google, Gemini Ultra superaría a GPT 4 tanto en matemáticas como en código como en la generación de texto. Es importante tener en cuenta que solo se habría conseguido superar a OpenAI con la versión Ultra de Gemini, ya que con las demás, el nivel sería inferior al ofertado en GPT4.
No debemos confundir Google Bard con Gemini. Por un lado estaría Gemini, que es el modelo de IA Generativa que Google ha creado y, por otro, Google Bard, que sería el chatbot o aplicación conversacional desarrollada que usaría Gemini para su correcto funcionamiento (aunque actualmente funciona con el modelo de PaLM).
En su cuenta de Youtube han subido una gran cantidad de vídeos en los que diferentes empleados de la compañía y otros personajes del mundo tecnológico, así como compañías colaboradoras, ponen de manifiesto la gran cantidad de aplicaciones prácticas que la herramienta tiene. Como puedes apreciar en este vídeo, la interacción no solo es fluida, sino que pone de manifiesto una capacidad de comprensión en tiempo real que asombra incluso a los profesionales de este sector:
Con su llegada, la interacción con los dispositivos inteligentes promete ser mucho más fluida y personalizada, dando la opción de incluso jugar con el contexto y la desambiguación en tiempo real con un nivel de comprensión sorprendente. Por el momento, está disponible en inglés y en más de 180 países, pero no en Europa.
Desde la llegada de ChatGPT, el mundo de la IA no solo se ha democratizado sino que promete ser un compañero en la realización de un sin fin de tareas. Por el momento, Gemini estará disponible en tres versiones, convirtiéndose en un apoyo para los usuarios de Google de todo el mundo y a diferentes niveles. Bien es cierto que en las últimas horas se han compartido ciertas noticias que indican que el vídeo empleado por Google en la presentación podría estar editado para amplificar las habilidades de Gemini. Una realidad que ha abierto la puerta a cuestionar las verdaderas capacidades de esta IA Generativa.
En cualquier caso, estamos ante una nueva era de interacciones que está abriéndose paso de la mano de las principales empresas de tecnología y la IA parece ser el ingrediente principal en todo el desarrollo propuesto.
Fuente: Google