Home Google Google I/O 2024, la propuesta de Google con su AI Gemini

Google I/O 2024, la propuesta de Google con su AI Gemini

138
0

En el marco del Google I/O 2024 la empresa anunció los cambios y mejoras de su AI, como habíamos avisado ayer, para competir directamente con ChatGPT de OpenAI.

El nuevo escenario de guerra tiene sus interesantes aristas porque Google no sólo tiene el mercado de búsquedas a su favor, tiene el ecosistema de Gmail y las apps asociadas que, justamente, existen para manejar datos personales del usuario. El foco que quieren brindar es facilitar las tareas repetitivas, de búsqueda y comprensión.

Todo Google estará asociado a Gemini, las búsquedas ofrecerán resultados por AI siempre, ya no importa si lo quieres o no, si te gusta o no, es AI para todo.

Google I/OGmail es la app principal que recibirá el “tratamiento AI”, con Gemini, su AI, incorporada como chatbot directo en la interfaz del correo permitiéndole a la AI operar con el correo, previo darle permisos para que acceda directamente a todo tu inbox.

Esto es un “red flag” para muchos, pero, quieran o no, el hecho de que Google posea tus emails no es precisamente indicativo de privacidad 😁 así que tan sólo es un paso más en la pérdida total de datos privados.

La herramienta permitirá resúmenes de correo, buscar algo perdido y que se encargue de encontrarlo, organizar adjuntos, analizarlos, procesarlos, obtener un bulleteo de los puntos claves de una conversación, etc. El nombre de todo esto es, tentativamente, “Gemini Pro in Workspace Labs”, veremos cuán efectivo es para la administración de datos.

Gemini 1.5 Flash y Pro

El motor detrás de todos los anuncios de Google es Gemini y un nuevo lanzamiento de la misma es su versión 1.5 Flash: optimizado para velocidad y eficiencia, segun Demis Hassabis, el CEO de Google DeepMind, Gemini 1.5 Flash es muy bueno sumarizando, chateando, subtitulando y entendiendo imágenes y audios, extrayendo datos de archivos grandes y tablas y mucho más.

La versión Flash es más liviana y económica que la Pro, algo que los desarrolladores estaban necesitando para abaratar un poco los costos y enfocarse en nuevas apps, se ubicaría entre el 1.5 Pro y el 1.5 Nano, este último es para uso local en dispositivos y no depender de la nube.

Y si bien puede parecer un modelo “menor” se ha utilizado un método de “destilación” (una cuantización menor) que le permite tener la misma base del Pro, pero en tamaño más pequeño, por ende en conocimientos y capacidades no debería haber tanta diferencia. Por ejemplo los tokens de entrada rondarán el millón, esto permite administrarle documentos enteros para que analice sin problema alguno.

Gemini en GmailPara dimensionarlo, sería como entregarle un documento de 1500 páginas y pedirle que lo analice, no hacen falta pequeñas frases.

Tanto el Pro como Flash ya están disponibles en las herramientas de Google AI Studio y Vertex AI.

El Pro agrega más funciones como transformar NotebookLM en una herramienta interactiva de aprendizaje. Ya con una ventana de contexto de 2 millones de tokens las cosas cambian, la aplicación de notas asociada a la AI podrá sumarizar las notas que un estudiante tome, hacer quizes y FAQs todo automatizado.

La función Audio Overviews ofrecerá la posibilidad de transformar el material en una discusión interactiva y responder las preguntas de los alumnos, algo así como tener un ayudante de cátedra por AI, una locura.

Tengan en cuenta que para Android 15 Gemini va a estar incorporado DENTRO del teléfono, usando seguramente la versión nano, brindándole contexto a cada aplicación.

AI en el buscadorAsk Photos

No soy muy fan de cómo Google organiza mis fotografías en Google Photos así que espero que esto lo haga mejorar, la idea de Ask Photos es justamente poder encontrar sencillamente preguntando, es decir, en vez de pedirle un lugar se le podrá especificar hasta los detalles de la fotografía que uno quiere ubicar.

Esto es ESCENCIAL si tenés diez años de fotografías juntas, hoy por hoy, por darles un ejemplo, el scroll por fechas es un desastre de inusable cuando uno tiene más de tres años de contenidos.

Lo interesante es preguntar por contexto, desde “qué día usé mi remera azul” hasta datos que estén en una foto, ya no más eso de que te envíen el número de cuenta bancaria con una foto y no poder transcribirlo, sencillamente se le pregunta y se obtiene el dato.

Contextual en todas las apps
Screenshot

Otras locuras

Google no sólo compite con ChatGPT sino con todo el ecosistema de AI, es como que tiene demasiados frentes abiertos al mismo tiempo y esto es, en parte, por la misma naturaleza de Google de tener apps para casi todo.

En el caso de generación de video anuncian Veo, que recién estará como preview con lista de acceso restringida, algo que también está presentando hace unos meses OpenAI.

Además hay un nuevo paso más allá de Gemini que es el proyecto Gemini Astra, su versión multimodal,  extendiendo las posibilidades desde el teléfono, algo que ya hemos visto en la demo de ChatGPT pero aquí le cambian el nombre, con la app mirando y brindando información de contexto en tiempo real.

Gemini AstraDesde el punto de vista científico presentaron Alpha Fold 3, con la capacidad de predecir estructuras moleculares, algo que, para mí, es el verdadero uso relevante de la AI.


Está claro que Google tiene que manejar espectativas como ningún otro, no pueden cubrir todo y pretender que quede todo perfectamente integrado desde el momento cero, pero a empresas como Apple y ellos se les demanda eso desde el público porque están en una posición dominante.

Si son los dueños de todo, tienen la “obligación” de entregar un buen producto desde el vamos, algo que Google no pudo hacer en su primer lanzamiento de Gemini, pero especialemnte con el generador de imágenes “woke” que tuvieron que sacar del mercado.

Incrustar Gemini en Android 15 es una jugada obvia, esperable, pero peligrosa ¿Deberá Google permitirle a cualquier proveedor de AI el mismo privilegio/lugar? Seguro la EU tendrá algo que decir al respecto.

¿Privacidad? ¿Qué es eso? Todo irá a parar a los servidores de Google para ser analizado en un afán desesperado por ser el líder indiscutido de AI a nivel global, pero ¿No abrirá eso una nueva caja de Pandora de violación a la privacidad e intimidad de las personas?

La desesperación por ganar les está provocando un efecto muy conocido: bajar toda regulación y autocontrol, ya habrá tiempo para eso, ahora hay que destruir a la competencia.

LEAVE A REPLY

Please enter your comment!
Please enter your name here