Esta IA está destinada a remodelar la forma en que interactuamos con la tecnología, tal y como hemos podido ver en su presentación oficial.
Gemini es un modelo de inteligencia artificial multimodal, que muestra una competencia sin precedentes en el procesamiento de diversos tipos de datos, incluidos texto, imágenes, código, voz y mucho, mucho más.
Todo lo que se ha visto hasta ahora traspasa los límites de lo que habíamos visto con GPT-4 y otras herramientas de inteligencia artificial.
El último salto de Google en el campo de la inteligencia artificial. A diferencia de los modelos de IA tradicionales que están diseñados para manejar un tipo de datos, Gemini es capaz de procesar múltiples tipos de datos y tareas simultáneamente.
Incluso gráficos, y con una velocidad de adaptación impresionante.Gemini no es, por tanto, solo texto o imágenes. Puede funcionar con audio y cualquier otro tipo de datos, lo que permite al usuario, tal y como se ha visto en la presentación oficial de Google, interacciones mucho mas naturales y atractivas; casi como hablar con una persona real.
Según el anuncio de la compañía, Gemini «fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar sin problemas diferentes tipos de información».
Gemini se describe como el «modelo más flexible», capaz de ejecutarse en centros de datos o dispositivos móviles.Y con la presentación de Gemini vienen varias versiones más basadas en ella: Ultra, Pro y Nano.
La versión Ultra ya ha logrado un hito al superar a los expertos humanos, con una puntuación del 90 % en una prueba multitarea que cubre diversas materias como matemáticas, física, derecho, medicina y ética. Además, Bard también utilizará «una versión mejorada de Gemini Pro», lo que representa la actualización más importante del robot de Google.
Fuente: muy interesante