Las Novedades de Google IO 2024 que van a cambiar tu Vida

Inicio · Blog IA · Eventos · Las Novedades de Google IO 2024 que van a cambiar tu Vida
Presentación de Google I/O 2024 con su CEO al frente.

Este año, durante su conferencia anual para desarrolladores, Google no solo presentó actualizaciones de software impresionantes, sino que también introdujo una nueva versión llamada Gemini Nano con Multimodalidad. ¿Qué significa esto para nosotros? Bueno, imagina tener la capacidad de transformar cualquier tipo de entrada—ya sea texto, fotos, audio, o vídeo—en cualquier salida que necesites. ¡Es casi como tener un superpoder en tu dispositivo!

Sundar Pichai, el CEO de Google, explicó que esta nueva capacidad permite a Gemini interactuar con una variedad impresionante de medios para ofrecer respuestas y análisis en tiempo real. Por ejemplo, podrías escanear una estantería llena de libros con la cámara de tu teléfono y Gemini te ayudaría a organizar esos títulos en una base de datos para reconocerlos más tarde. Increíble, ¿verdad?

Además, los desarrolladores están de enhorabuena, ya que ahora tienen acceso a Gemini 1.5 Pro, una versión más robusta y basada en la nube de esta tecnología, disponible globalmente desde hoy. Esto es parte de un esfuerzo mayor de Google por dominar la era de la IA generativa, ofreciendo más potencia de computación que otros modelos de lenguaje grandes disponibles actualmente.

¿Quieres saber más sobre cómo estas innovaciones podrían cambiar tu interacción diaria con la tecnología? Antes te dejo una tabla completa con todas las novedades presentadas por Google en la conferencia I/O 2024:

NovedadDescripciónCategoría/Productos Afectados
Gemini Nano con MultimodalidadModelo de IA mejorado que puede procesar inputs de diversos tipos (texto, fotos, audio, video) y sintetizarlos para proporcionar respuestas y análisis en tiempo real.Mobile Large Language Model (LLM)
Gemini 1.5 ProVersión más potente y basada en la nube de Gemini, disponible para desarrolladores a nivel global. Proporciona mayor capacidad computacional que otros LLM.Cloud-Based AI System
Ask PhotosFunción en Google Photos que permite realizar búsquedas avanzadas dentro de las fotos por medio de Gemini, como buscar un coche a través del número de matrícula.Google Photos
Integración de Gemini en WorkplaceImplementación de Gemini en Google Workspace, permitiendo a los usuarios acceder a funcionalidades de IA en aplicaciones como Gmail, Google Drive, Docs, Sheets y Slides para mejorar la productividad en la redacción y gestión de documentos y comunicaciones.Google Workspace (Gmail, Drive, Docs, Sheets, Slides)
AI TeammateAsistente virtual dentro de las aplicaciones de Google que facilita la coordinación y gestión de tareas y proyectos. Se mostró con el nombre de «Chip» en la demo.Google Workspace
VideoFXHerramienta de generación de videos basada en texto que produce videos en 1080p, desarrollada por Google Labs y basada en el generador de video de DeepMind, Veo.Google Labs
ImageFXGenerador de imágenes de alta resolución que mejora la calidad y precisión de las imágenes creadas a partir de prompts de texto.Google Labs
DJ Mode en MusicFXModo dentro de MusicFX que permite a los músicos crear bucles y muestras de canciones basadas en prompts de texto.MusicFX
Gemini 1.5 FlashModelo de IA enfocado en tareas que requieren rapidez y baja latencia.Gemini AI
Project AstraChatbot visual avanzado que permite interactuar con el entorno mediante la cámara del teléfono, mejorando la identificación y comprensión de contextos y objetos en tiempo real.Gemini AI
Nuevas capacidades de búsqueda AIMejoras en Google Search que incluyen la organización de resultados de búsqueda mediante IA, respuestas mejoradas para consultas largas y la capacidad de incluir fotos en las búsquedas.Google Search
Multi-Step ReasoningFunción de búsqueda que permite encontrar información más detallada y organizada sobre un tema, por ejemplo, planificación de viajes.Google Search/Maps
Scam DetectionCaracterística de seguridad en Android que detecta lenguaje típico de estafas durante llamadas telefónicas y sugiere acciones preventivas al usuario.Android
SynthIDHerramienta de watermarking para identificar medios generados por IA, como imágenes y videos. Se planea lanzar como una herramienta de código abierto más adelante.DeepMind

Nuevas Capacidades de Búsqueda en Fotos

¿Alguna vez has deseado poder buscar información específica dentro de tus fotos con solo pedírselo a tu teléfono? Bueno, Google ha hecho justo eso con su nueva característica Ask Photos en Google Fotos. Este desarrollo no solo es avanzado, sino que redefine lo que significa la búsqueda visual. Con Ask Photos, puedes decirle a Gemini que busque tu número de matrícula, y él se encargará de encontrar tu coche en todas las fotos que has tomado. ¿No es eso sorprendente?

Lo mejor de todo es que esta herramienta es increíblemente respetuosa con tu privacidad. Según Google, Ask Photos no recopila datos de tus fotos para usarlos en publicidad o para entrenar otros modelos de IA de Gemini. Esta característica comenzará a implementarse este verano, prometiendo una experiencia de usuario más segura y personalizada.

Además, esta búsqueda avanzada forma parte de una serie de actualizaciones que Google está introduciendo para hacer que la búsqueda de fotos sea más intuitiva y eficiente. La integración de capacidades de IA en Google Fotos no solo mejora la funcionalidad del servicio, sino que también establece un nuevo estándar en cómo interactuamos con nuestras memorias digitales.

Integración de Gemini en el Ámbito Laboral

¿Recuerdas Gmail? Bueno, Google no solo se ha acordado de él, sino que lo ha revitalizado integrando su tecnología de IA, Gemini, en toda la suite de herramientas de oficina de Google Workspace. Desde hoy, un botón para activar la IA de Gemini estará disponible en el panel lateral de numerosas aplicaciones de Google, como Gmail, Google Drive, Docs, Sheets y Slides.

Esta integración significa que ahora podrás pedirle ayuda a Gemini para redactar correos electrónicos, elaborar documentos o incluso resumir largos hilos de emails o documentos. Imagina tener un asistente personal que no solo entiende lo que necesitas, sino que también te proporciona información y sugerencias al instante.

Pero eso no es todo, ¿y si te dijera que Gemini también puede ser tu compañero de productividad en el trabajo? Bajo el nombre de AI Teammate, este asistente virtual puede ayudarte a coordinar comunicaciones entre compañeros, gestionar archivos de proyectos, organizar listas de tareas y asegurarse de que se hagan seguimientos. Esencialmente, actúa como un colaborador más en tu equipo, facilitando la comunicación y la organización diaria.

Y para los estudiantes y padres, Google también ha pensado en ellos. Gemini ahora puede ayudar a los estudiantes con sus tareas escolares o proporcionar resúmenes de las reuniones del AMPA que te hayas perdido. Con la actualización de Circle to Search, también se espera que estas capacidades se extiendan para ayudar en las tareas escolares.

Innovaciones en Herramientas Creativas y Modelos Gemini

En el lado creativo de las cosas, Google no se ha quedado atrás. La compañía presentó una suite de nuevas herramientas desarrolladas por su división de IA experimental en Google Labs. ¿Te imaginas generar videos de alta resolución a partir de simples textos? Eso es exactamente lo que VideoFX, basado en el generador de video de DeepMind, Veo, permite hacer ahora. Esta herramienta puede crear videos en 1080p que se adaptan flexiblemente a los procesos de producción, ofreciendo más control y menos artefactos digitales indeseados.

Pero eso no es todo en el ámbito creativo. Google también ha mejorado ImageFX, su generador de imágenes de alta resolución, optimizando la forma en que analiza y responde a los prompts de los usuarios. Además, introdujeron DJ Mode en MusicFX, una función que permite a los músicos generar bucles de canciones y muestras basadas en prompts, demostrada en la vibrante actuación de Mark Rebillet durante el keynote.

Además, Google ha lanzado dos nuevos modelos de su IA Gemini, llamados Gemini 1.5 Flash y Project Astra. Gemini 1.5 Flash es ideal para tareas que requieren rapidez y baja latencia. Por su parte, Project Astra ofrece un chatbot visual que puede responder preguntas sobre prácticamente cualquier cosa que puedas capturar con la cámara de tu teléfono, mostrando una comprensión espacial y contextual superior.

Estas herramientas no solo abren nuevas posibilidades para los creadores de contenido, sino que también redefinen la interacción con la tecnología en nuestra vida cotidiana.

DESCUBRE MÁS SOBRE EL TEMA

Deja el primer comentario