Este es el resumen del video que Jon Hernández del canal de YouTube Inteligencia Artificial del 21-05-2025.

Google I/O 2024: Las 9 Revoluciones de IA que Cambiarán Todo
Jon Hernández resume las principales novedades de IA presentadas por Google, destacando avances que prometen transformar la interacción con la tecnologÃa.
- Proyecto Astra: Es la visión de Google para un futuro asistente de IA universal. Funcionará en móviles y permitirá interactuar en tiempo real usando la cámara y la pantalla. Podrá entender el contexto visual (como resolver problemas matemáticos que ve en pantalla o identificar objetos) y, en su visión más avanzada, actuar como un agente que realiza tareas en el dispositivo (buscar manuales, abrir apps, hacer llamadas, etc.).
- Nuevos Modelos de IA (Gemini):
- Gemini 2.5 Flash: Un modelo más rápido y eficiente en costes, especialmente bueno para programación y tareas que requieren velocidad, situándose como el segundo mejor en benchmarks de programación, solo por detrás de Gemini 2.5 Pro.
- Gemini 2.5 Pro "Deep Think": Un modo que permite al modelo un razonamiento más avanzado y "profundo" para tareas complejas que requieren más tiempo de "pensamiento".
- Gemini Diffusion: Un nuevo tipo de modelo (similar a los de generación de imágenes) enfocado en generar texto y código de forma muy rápida (5 veces más que el modelo pequeño más rápido anterior de Google), aunque no necesariamente con la calidad de los modelos más grandes.
- Canvas y DeepSearch en Gemini:
- Canvas: Una especie de editor de texto dentro de Gemini que ahora permite, con el botón "Crear", generar contenido diverso como páginas web, infografÃas, quizzes o resúmenes en audio a partir del texto elaborado.
- DeepResearch: Próximamente, permitirá a Gemini conectarse a los archivos locales del usuario, Google Drive y Gmail para elaborar informes y análisis basados en la información personal.
- IA en el Buscador de Google (Search AI):
- Integración profunda de IA directamente en las búsquedas de Google.
- Incluye "AI Mode" para una experiencia más conversacional y respuestas resumidas.
- Resultados personalizados basados en el contexto del usuario (información de Gmail, Gemini, etc.).
- Funciones como prueba virtual de ropa ("Try-on", inicialmente en EE.UU.) y seguimiento de precios de productos.
- FireSat: Un nuevo sistema de satélites con IA y cámaras de visión diseñados para detectar incendios forestales de forma temprana y rápida (en 20 minutos frente a las 12 horas anteriores), incluso en áreas pequeñas como un parking. Tendrá un gran impacto ambiental.
- Veo 3 y Flow (Generación y Edición de VÃdeo con IA):
- Veo 3: El nuevo y potente modelo de generación de vÃdeo de Google, capaz de incluir audio y diálogos generados por la propia IA de forma nativa en la escena.
- Flow: Un editor de vÃdeo complementario (similar a lo que se espera de Sora) para crear, cortar, expandir vÃdeos, usar imágenes de referencia y aplicar controles de cámara avanzados. Se podrá usar desde Gemini.
- Plan Google AI Ultra: Una nueva suscripción premium con un coste de $249.99/mes (con una oferta inicial de $124.99 durante 3 meses). Este plan dará acceso a las funciones más avanzadas y experimentales como Veo 3, Gemini 2.5 Pro Deep Think, Project Mariner, además de incluir YouTube Premium y 30TB de almacenamiento.
- Agentes de IA:
- Project Mariner: Un agente de IA diseñado para automatizar tareas complejas en el navegador y el dispositivo del usuario (buscar vuelos, hoteles, rellenar formularios, etc.), similar a lo que OpenAI presentó con Operator.
- Jules: Un agente de IA especializado en asistencia para programación y desarrollo de software.
- Android XR: El nuevo sistema operativo de Google para gafas de Realidad Extendida (XR). Estas gafas, de aspecto similar a unas Ray-Ban Meta pero con una pantalla integrada en la lente, permitirán funciones como traducción simultánea con subtÃtulos en tiempo real, navegación GPS proyectada y acceso a información contextual. El presentador cree que este tipo de gafas se volverán masivas pronto.
En resumen: Google está apostando fuertemente por la IA multimodal (texto, imagen, vÃdeo, audio), asistentes personales mucho más capaces y la integración profunda de la inteligencia artificial en todos sus productos, aunque algunas de las funciones más potentes y novedosas estarán bajo planes de suscripción premium.