Este experimento muestra cuán frágil es nuestra confianza visual cuando lo real se confunde con lo digital.
Ámsterdam, agosto de 2025
Microsoft ha estrenado una experiencia interactiva llamada Real or Not?, un juego global que desafía a usuarios a determinar si una de 15 imágenes fue capturada por una cámara o generada por inteligencia artificial. La iniciativa forma parte del trabajo de su laboratorio AI for Good, y se basa en una muestra que contempló más de 287 000 evaluaciones realizadas por 12 500 participantes, lo que revela preocupantes limitaciones en nuestra percepción visual: la precisión promedio en la identificación fue apenas del 62 %, apenas algo superior a lanzar una moneda.
El objetivo explícito de Microsoft no es exponer errores individuales, sino fomentar alfabetización visual. El test incluye fotografías reales y creaciones producidas por modelos como DALL·E 3, Stable Diffusion y Midjourney, algunas combinadas con ediciones posteriores mediante IA. La complejidad de las imágenes mixtas llevó a precipitaciones drásticas en la tasa de acierto: en ciertos casos, el porcentaje se desplomó a entre 21 % y 23 %.
El análisis segmentado muestra que los participantes identificaron correctamente cerca del 65 % de retratos humanos generados por IA, mientras que las tasas de acierto caían a entre 59 % y 61 % cuando se trataba de paisajes, objetos o entornos urbanos. Esto refleja la ventaja cognitiva del rostro humano frente a otros tipos de imágenes más homogéneas o carentes de referencias familiares.
Un contraste notable se observa cuando se usan herramientas automatizadas de detección: Microsoft está desarrollando su propio detector de imágenes por IA que alcanzó una precisión superior al 95 % en las mismas muestras examinadas por humanos. Esa brecha sugiere que la capacidad humana está quedando atrás frente a la eficiencia algorítmica.
Desde una perspectiva analítica, esta iniciativa no es solo un juego: es un experimento social que desnuda la sofisticación de la generación visual artificial y la fragilidad de nuestra confianza. En un ambiente saturado de contenido sintético, la incapacidad para distinguir lo real puede abrir puertas a campañas de desinformación, manipulación y deepfakes maliciosos. Los expertos advierten que sin mecanismos robustos de etiquetado y transparencia, la confianza visual queda erosionada.
Este desafío también ocurre en un momento crítico de debate regulatorio. En Estados Unidos y Europa, legisladores evalúan la implementación de normativas como el Take It Down Act, que obliga a remover contenido sexual no consensuado generado por IA. Herramientas como Real or Not? alimentan esos debates al mostrar que incluso el ojo experto puede ser engañado con facilidad.
Las fuentes académicas y técnicas complementan la mirada tecnológica del experimento. Estudios recientes comparativos —como los publicados por el laboratorio de Microsoft y otros académicos— confirman que la mayoría de la gente acierta solo entre el 62 % y 63 % de las veces, y que el tipo de imagen influye en el error sistemático, con retratos siendo ligeramente más detectables que paisajes.
Al mismo tiempo, surgen propuestas de tecnologías más resilientes: modelos avanzados como LDR‑Net o esquemas como DinoHash —que combinan perceptual hashing con cifrado homomórfico— buscan identificar inconsistencias digitales resistentes incluso a ediciones adversariales comunes, como recortes o filtros. Estas herramientas podrían fortalecer la confianza en medios digitales verificables.
Desde la visión del usuario común, Real or Not? se presenta como una herramienta educativa intuitiva: no requiere registro ni instalación y puede repetirse de forma ilimitada, generando nuevos conjuntos de imágenes en cada sesión. Cada respuesta actúa como retroalimentación perceptual, permitiendo aprender a reconocer texturas sospechosas, anomalías de iluminación o distorsiones en la perspectiva.
En contexto regional, portales especializados recomiendan observar detalles específicos como fondos borrosos, deformaciones en objetos, inconsistencias tipográficas o texturas poco naturales como señales clave de alerta. En entornos digitales latinoamericanos se resaltan estos patrones como filtros críticos para identificar contenido fabricado por IA.
En resumen, Microsoft no solo ofrece un test visual: presenta un espejo de nuestra vulnerabilidad cognitiva frente a la tecnología que hemos creado. En una era donde lo sintético puede parecer indistinguible de lo real, la percepción humana necesita refuerzos: educación visual, regulación tecnológica y señales explícitas sobre el origen del contenido. El verdadero desafío ya no es crear imágenes creíbles, sino restaurar la confianza en lo que vemos.
Esta pieza fue desarrollada por el equipo editorial de Phoenix24 con base en fuentes confiables, datos públicos y análisis riguroso, en coherencia con el contexto global vigente.
This piece was developed by the Phoenix24 editorial team using reliable sources, public data, and rigorous analysis in alignment with the current global context.