El evento Google Next fue el lugar donde se presentó Gemini 1.5 Pro, y se anunció su disposición al público a través de su plataforma para crear aplicaciones de IA.
Gemini 1.5 Proahora será capaz de entender audio, usar archivos multimedia ilimitados, actuar según nuestros comandos y permitirá a cualquier desarrollador crear básicamente lo que quieran en el modo JSON ¿Lo mejor? Todo es gratis, convirtiéndose en una de las IA más importantes y poderosas del mercado.
GEMINI AHORA PUEDE OÍR
Si eres profesor, solo necesitarás cargar una grabación de una de tus conferencias para crear un cuestionario sobre el contenido más importante. Los consultores solo tendrán que cargar una grabación de un día completo fuera del lugar y crear un nuevo documento de estrategia del equipo. Si necesitas dar un discurso, graba los primeros minutos de tu idea principal y cárgala, así obtendrás comentarios y consejos específicos sobre cómo podría mejorarlo.
GEMINI PUEDE USAR ARCHIVOS ILIMITADOS
Ahora, cuando trabajemos en Gemini, seremos capaces de cargar cuantos archivos deseemos. Imágenes, videos, audio y más. Y todo esto podrá hacerse gratis.
Esto ayudará a que los profesionales creativos, que solo deberán cargar una idea o la inspiración de lo que desea trabajar y Gemini te dará un tema y color para el próximo producto. Los estudiantes de investigación solo tendrán que subir un documento, fotografías o notas y obtendrán un resumen de su tesis. Incluso, se subimos un álbum familiar, Gémini eligirá las mejores fotos para tus redes sociales, retratos, collage, y más.
ASISTENTES VIRTUALES ÚNICOS
El año 2023 fue el bum de las Inteligencias Artificiales basadas en texto, como ChatGPT. Sin embargo, 2024 apunta a ser el año en el que los agentes de IA actuarán en nombre de las personas. Gémini puede entender miles de acciones y, en base a eso, descubrir qué hacer a continuación por las personas.
Básicamente, podríamos desarrollar nuestras propios asistentes virtuales, como Siri o Alexa, pero infinitamente superior, con la capacidad de realizar miles de acciones más y personalizadas.
También se podrá crear un robot o centro de llamada, ideal para las empresas de atención al cliente y evitar esos molestos robots que enfurecen a los clientes.
MODO JSON
El obstáculo más grande para usar Gemini era su enorme lista de espera. Sin embargo, Google está demostrando su enorme capacidad para albergar estos modelos y, ahora, sus puertas están abiertas para que todas las personas puedan explorar sus nuevas funciones, ya que puede procesar hasta 128.000 tokens y hasta 1 millón de tokens. Tokens hace referencia a bits subdivididos de datos sin procesar, como las sílabas “fan”, “tas” y “tic” en la palabra “fantástico”.
Un millón de tokens equivale a unas 700.000 palabras o unas 30.000 líneas de código. Es aproximadamente cuatro veces la cantidad de datos que el modelo insignia de Anthropic, Claude 3, puede tomar como entrada y aproximadamente ocho veces más que el contexto máximo de GPT-4 Turbo de OpenAI.