2026

Cuando las máquinas aprenden a mirar

Ver no consiste únicamente en captar imágenes, sino en comprender objetos, relaciones y espacios. Esta capacidad, aparentemente natural para las personas, constituye uno de los grandes desafíos de la inteligencia artificial.

En esta charla, Fei-Fei Li explica cómo la inteligencia espacial puede permitir que los modelos interpreten el mundo real y actúen sobre él. Esta evolución resulta especialmente interesante en campos como la visión por computador y la observación de la Tierra mediante satélites, donde cada imagen puede convertirse en información útil para comprender nuestro entorno.

Vídeo: With spatial intelligence, AI will understand the real world

Mi identidad digital como investigador

Mi nombre académico es Rodrigo Pascual-García y actualmente desarrollo mi tesis doctoral en la Universidad de Burgos, orientada a la aplicación de la inteligencia artificial y el deep learning en problemas de teledetección. Mi investigación se centra especialmente en el uso de imágenes satelitales, datos etiquetados y modelos de aprendizaje automático para analizar y comprender mejor el territorio agrícola.

Mi formación combina la Ingeniería de la Salud con el Máster en Investigación en Inteligencia Artificial, lo que me ha permitido acercarme a la IA desde una perspectiva aplicada, interdisciplinar y orientada a problemas reales. También podéis consultar mi perfil profesional en LinkedIn.

Para mantener una identidad digital clara y facilitar la localización de mis trabajos, utilizo distintos perfiles académicos y personales. Mi identificador ORCID es 0009-0005-8791-4159 y puede consultarse aquí: ORCID.

También podéis consultar mi perfil en Google Scholar, donde aparecen mis publicaciones, líneas de investigación y citas académicas.

También he publicado el dataset S4A-CyL: A Sentinel-2 Time Series Dataset for Deep Learning in Agriculture (2020-2024), disponible en el Repositorio Institucional de la Universidad de Burgos.

Este dataset reúne series temporales de imágenes Sentinel-2 y datos etiquetados de cultivos en Castilla y León, con el objetivo de alimentar modelos de deep learning aplicados a la teledetección agrícola. Su finalidad es facilitar el desarrollo de sistemas capaces de analizar grandes superficies de cultivo, mejorar la monitorización agrícola y contribuir, desde la inteligencia artificial, a retos como la sostenibilidad y la seguridad alimentaria.

A día 16 de junio de 2026, el dataset cuenta con 876 visitas y 118 descargas, lo que refleja el interés de la comunidad investigadora por disponer de datos abiertos, estructurados y reutilizables para entrenar y evaluar modelos de inteligencia artificial en agricultura.

Además, he creado una página personal en About.me, que funciona como punto de acceso rápido a mi perfil investigador y profesional.

Otra de mis líneas recientes de trabajo mas en la parte afición e inquietud personal se centra en el diseño de agentes de inteligencia artificial. En concreto, he desarrollado un bot que genera comparaciones entre código visual producido a partir de texto y el resultado renderizado de ese código. El sistema también registra los metadatos de cada generación y automatiza la publicación de los resultados en redes sociales. Todeo esto se orquesta automáticamente en un servidor en la nube de Oracle Cloud. Parte de este proyecto puede consultarse en el canal The LLM Lab.

Además, he incorporado un sistema de evaluación automática que mide la correspondencia entre el prompt original y el resultado visual renderizado. Esto permite comparar de forma iterativa el rendimiento de distintos modelos, tanto modelos frontera de compañías como OpenAI, Google o Anthropic, como alternativas más ligeras y económicas como DeepSeek, Qwen, MiniMax u otros modelos disponibles vía API.

Tengo planeado también otro agente, esta vez orientado a IA física y modelos locales. A diferencia del sistema anterior, centrado en evaluar modelos frontera vía API, este proyecto buscaría experimentar con modelos de lenguaje y visión ejecutados directamente en una placa de desarrollo, reduciendo la dependencia de servicios externos y los costes de inferencia. El objetivo sería que el agente pudiera recibir información del entorno mediante cámara, micrófono y sensores, responder preguntas y ejecutar movimientos sencillos de manera autónoma, incluso sin conexión a internet. Para ello tendré que aprender electrónica, control de motores, alimentación, comunicación entre placas y despliegue de modelos ligeros en hardware local.

Reflexión sobre el blog como herramienta científica

Un blog puede ser una herramienta muy útil para la comunicación científica porque permite explicar el trabajo investigador de una forma más cercana, flexible y comprensible que una publicación académica tradicional. En mi caso, puede servirme como portfolio para reunir avances, proyectos, recursos y reflexiones sobre inteligencia artificial, visión por computador, modelos de lenguaje y observación de la Tierra.

Además, el blog ayuda a conectar distintos espacios de identidad digital: ORCID, Google Scholar, About.me, redes profesionales, repositorios, vídeos divulgativos y proyectos personales. De esta manera, no solo se muestra qué investiga una persona, sino también cómo comunica, cómo aprende y cómo relaciona su trabajo con problemas reales.

Dos blogs o espacios científicos relacionados con mi temática de investigación son NASA Earthdata Blog, centrado en datos de observación de la Tierra, ciencia abierta y uso de tecnologías como modelos fundacionales y visualización de datos, y Google Research Blog: Google Earth AI, sobre modelos fundacionales, razonamiento geoespacial, visión-lenguaje y análisis de imágenes satelitales.

Buscar este blog

Satélites que Miran, Modelos que Interpretan