Skip to content
IA • • 3 min read

Resumen! Google revienta la IA 🔥🤯

Este es el resumen del video que Jon Hernández del canal de YouTube Inteligencia Artificial del 21-05-2025.


Google I/O 2024: Las 9 Revoluciones de IA que Cambiarán Todo

Jon Hernández resume las principales novedades de IA presentadas por Google, destacando avances que prometen transformar la interacción con la tecnología.

  1. Proyecto Astra: Es la visión de Google para un futuro asistente de IA universal. Funcionará en móviles y permitirá interactuar en tiempo real usando la cámara y la pantalla. Podrá entender el contexto visual (como resolver problemas matemáticos que ve en pantalla o identificar objetos) y, en su visión más avanzada, actuar como un agente que realiza tareas en el dispositivo (buscar manuales, abrir apps, hacer llamadas, etc.).
  2. Nuevos Modelos de IA (Gemini):
    • Gemini 2.5 Flash: Un modelo más rápido y eficiente en costes, especialmente bueno para programación y tareas que requieren velocidad, situándose como el segundo mejor en benchmarks de programación, solo por detrás de Gemini 2.5 Pro.
    • Gemini 2.5 Pro "Deep Think": Un modo que permite al modelo un razonamiento más avanzado y "profundo" para tareas complejas que requieren más tiempo de "pensamiento".
    • Gemini Diffusion: Un nuevo tipo de modelo (similar a los de generación de imágenes) enfocado en generar texto y código de forma muy rápida (5 veces más que el modelo pequeño más rápido anterior de Google), aunque no necesariamente con la calidad de los modelos más grandes.
  3. Canvas y DeepSearch en Gemini:
    • Canvas: Una especie de editor de texto dentro de Gemini que ahora permite, con el botón "Crear", generar contenido diverso como páginas web, infografías, quizzes o resúmenes en audio a partir del texto elaborado.
    • DeepResearch: Próximamente, permitirá a Gemini conectarse a los archivos locales del usuario, Google Drive y Gmail para elaborar informes y análisis basados en la información personal.
  4. IA en el Buscador de Google (Search AI):
    • Integración profunda de IA directamente en las búsquedas de Google.
    • Incluye "AI Mode" para una experiencia más conversacional y respuestas resumidas.
    • Resultados personalizados basados en el contexto del usuario (información de Gmail, Gemini, etc.).
    • Funciones como prueba virtual de ropa ("Try-on", inicialmente en EE.UU.) y seguimiento de precios de productos.
  5. FireSat: Un nuevo sistema de satélites con IA y cámaras de visión diseñados para detectar incendios forestales de forma temprana y rápida (en 20 minutos frente a las 12 horas anteriores), incluso en áreas pequeñas como un parking. Tendrá un gran impacto ambiental.
  6. Veo 3 y Flow (Generación y Edición de Vídeo con IA):
    • Veo 3: El nuevo y potente modelo de generación de vídeo de Google, capaz de incluir audio y diálogos generados por la propia IA de forma nativa en la escena.
    • Flow: Un editor de vídeo complementario (similar a lo que se espera de Sora) para crear, cortar, expandir vídeos, usar imágenes de referencia y aplicar controles de cámara avanzados. Se podrá usar desde Gemini.
  7. Plan Google AI Ultra: Una nueva suscripción premium con un coste de $249.99/mes (con una oferta inicial de $124.99 durante 3 meses). Este plan dará acceso a las funciones más avanzadas y experimentales como Veo 3, Gemini 2.5 Pro Deep Think, Project Mariner, además de incluir YouTube Premium y 30TB de almacenamiento.
  8. Agentes de IA:
    • Project Mariner: Un agente de IA diseñado para automatizar tareas complejas en el navegador y el dispositivo del usuario (buscar vuelos, hoteles, rellenar formularios, etc.), similar a lo que OpenAI presentó con Operator.
    • Jules: Un agente de IA especializado en asistencia para programación y desarrollo de software.
  9. Android XR: El nuevo sistema operativo de Google para gafas de Realidad Extendida (XR). Estas gafas, de aspecto similar a unas Ray-Ban Meta pero con una pantalla integrada en la lente, permitirán funciones como traducción simultánea con subtítulos en tiempo real, navegación GPS proyectada y acceso a información contextual. El presentador cree que este tipo de gafas se volverán masivas pronto.

En resumen: Google está apostando fuertemente por la IA multimodal (texto, imagen, vídeo, audio), asistentes personales mucho más capaces y la integración profunda de la inteligencia artificial en todos sus productos, aunque algunas de las funciones más potentes y novedosas estarán bajo planes de suscripción premium.