Google presenta Gemini 2.5, modelo de IA que interactúa con navegadores
NOTICIAS TECNOLOGÍA
Alex León
10/8/20252 min read


Google ha revelado una nueva versión de su modelo de inteligencia artificial: Gemini 2.5, diseñado para interactuar directamente con interfaces web. A diferencia de versiones anteriores centradas en texto, este modelo puede hacer clics, rellenar formularios, desplazarse por páginas y ejecutar acciones visuales, como lo haría un humano. El anuncio marca un paso importante hacia asistentes digitales que no solo entienden el lenguaje, sino que también navegan activamente por internet.
Comprensión visual aplicada a la web
Gemini 2.5 incorpora capacidades de visión artificial que le permiten interpretar el diseño de una página web: botones, menús, campos de texto, imágenes y estructuras dinámicas. Esto le permite tomar decisiones contextuales, como seleccionar una opción en un formulario o detectar si una página requiere autenticación. En lugar de depender de instrucciones codificadas, el modelo analiza visualmente la interfaz y actúa en consecuencia.
Más allá del texto: IA que navega
La novedad de Gemini 2.5 no está en generar respuestas, sino en ejecutar tareas. Puede reservar vuelos, buscar productos, completar registros o navegar por plataformas complejas sin intervención humana. Esto abre la puerta a asistentes que no solo responden preguntas, sino que realizan acciones concretas en tiempo real, desde compras hasta trámites administrativos.
Relacionado: Qué pasará cuando la inteligencia artificial supere la mente humana (y qué riesgos implica)
Aplicaciones prácticas y riesgos
Google ha mostrado ejemplos de Gemini 2.5 realizando tareas como comprar entradas, comparar precios o completar formularios gubernamentales. Sin embargo, también surgen preguntas sobre seguridad, privacidad y control. ¿Qué ocurre si la IA accede a datos sensibles o realiza acciones no deseadas? La compañía asegura que se implementarán límites, revisiones humanas y sistemas de validación para evitar errores críticos.
Relacionado: El peligro del Wi-Fi del avión: cómo los ciberdelincuentes podrían controlar una aeronave
Gemini 2.5 representa un salto técnico hacia asistentes autónomos capaces de interactuar con el mundo digital de forma activa. Ya no se trata solo de entender lo que decimos, sino de ejecutar lo que pedimos. Si esta tecnología se consolida, podría transformar la forma en que usamos internet: menos clics, menos formularios, más resultados. Y con ello, una nueva etapa en la evolución de la inteligencia artificial aplicada.
Te puede interesar
Divulgación Científica y Tecnológica
Ciencia, Tecnología y Astronomía
Comunidad
© 2025. Todos los derechos reservados