Sobre el hundimiento de la Historia de la Fotografía

(más apuntes sobre las imágenes generadas con inteligencias artificiales)


por Martin Bollati - 2023
I
Las imágenes de semejanza fotográfica producidas con el uso de inteligencias artificiales son abstractas. No tienen un referente situado. No hay índice. Hay fuentes y combinación algorítmica, pero no hay un solo referente que se le pueda contraponer a cada una de esas imágenes. No tienen memoria adjunta. No tienen autor. No tienen Historia, aún. Y aunque las miramos como si fuesen fotografías, no representan absolutamente nada y en consecuencia no son fotografías. Solo simulan aquello que evocan.

II

Este nuevo tipo de imagen está hecha de información, expectativa, y fagocitación de la Historia de la Fotografía. Los procesos con los cuales se generan podrían definirse como una caja negra llena de ruido vivo y muerto a la vez. Cuando abrimos ese interior oscuro, el ruido permanece en ambos estados, porque la confirmación de su estado es imposible de verificar para nosotros. Simplemente no tenemos la capacidad cognitiva para hacerlo. Es en ese agujero negro (de caja a agujero) donde nacen estas imágenes abstractas, que miramos como si fuesen fotografías, pero que en realidad son una distribución de información procesada buscando producir una imagen que parezca una fotografía normativa.

III

Estas nuevas imágenes se fundamentan principalmente en la expectativa. Funcionan porque las miramos como fotografías, aunque sepamos que no lo son. Es en el espacio de recepción y no de producción en donde ocupan un lugar en el medio. Sin esa mirada, no serían. Pero las miramos y las confundimos. Y cada vez lo hacemos con mayor precisión.

IV

Las fotografías tradicionales no son abstractas porque siempre tienen un origen referencial.

Aunque el resultado que veamos sea indescifrable, existe una escena que corresponde al detrás de esa imagen. La idea de abstracción sucede en la percepción, pero responde a una forma de producción que necesita de lo concreto para existir. Uno pudiera argumentar que las fotografías hechas sin lentes, solamente a partir de la exposición de un medio sensible a la luz, son abstractas. Pero la antítesis de eso indica que incluso en la falta de precisión de su visualidad, refieren a un instante, o a una luz específica. Aunque no sean nítidas llevan en ellas un punto de origen que se suscribe con una contraparte física. Son como la huella que borra la primera ola luego de su impresión. Queda indefinida pero no deja de ser huella por ilegible.

El caso de la fotografía digital es más complejo. Porque aunque existen formas de edición, que permitirían modificar uno por uno todos los píxeles de una imagen hasta reemplazarla por completo, existe un origen indicial desde el cual se parte. Pudiéramos tomar cualquier fotografía digital y alterarla con distintas herramientas o mezclar pedazos de fotografías digitales, hasta hacer la imagen original irreconocible. Pero para empezar la conversión hace falta esa primera imagen digital realizada por una cámara. En el caso contrario no estaríamos hablando de una fotografía, sino dé una imagen generada a partir de píxeles, con similitudes a la imagen fotográfica.

Lo más parecido en términos digitales a una imagen de semejanza fotográfica producida con el uso de inteligencias artificiales sería construir una imagen digital desde cero, pintando pixel por pixel, hasta conseguir algo que se parezca a una imagen fotográfica. La diferencia de ese proceso con el actual, son los rangos de velocidad y precisión qué se necesitan para lograrlo. Pintar esa imagen digital de similitud fotográfica lleva un tiempo y un carácter de manualidad que acercara esa imagen más a la pintura que al carácter automático de la producción fotográfica.

V

En 1970 Masahiro Mori acuñó el concepto de “Valle inquietante”. Según esta premisa, a medida que percibimos mayor semejanza de algo con un ser humano nuestro grado de familiaridad o empatía crece. Sin embargo, hay un tramo en ese gráfico, que se sitúa justo antes de lograr la identificación total, en el cual se produce una drástica caída de empatía. De hecho sucede lo contrario, el rechazo. En ese valle se sitúan aquellos eventos que se parecen mucho a un ser humano, pero que por algún detalle particular, nuestro aparato sensorial identifica como engaño y entonces se aleja rápido de ese suceso extraño que quiere ser, pero que no es. Es esa incomodidad que se genera por ejemplo al ver prótesis de extremidades, o robots modelados cómo figuras humanas que no parpadean del todo bien, o incluso con la figura ficticia de un muerto vivo.

Una posible síntesis sería así.

100% Humano = empatía.
99% Humano = rechazo.
Hay una similitud entre las fotografías y las imágenes generadas por IAs que parecen fotografías. Los dos dispositivos pueden saltarse El Valle de Mori. Ambas imágenes pueden parecer, y no ser, y en ambos casos, nuestra mirada puede posar cómoda sobre ellas. Esto sucede cuando el grado de realismo fotográfico está logrado. Así no inquietan por su similitud, sino que en esa definición es exactamente en donde se sostienen. Cabe aclarar que el fenómeno inquietante todavía está presente en muchas imágenes sintéticas en donde por particularidades de cada programa aparecen detalles que producen el salto apático. El ejemplo más claro es la representación de las manos. Pero estos defectos se corrigen y mejoran de forma muy acelerada. Quedó claro con la última actualización del funcionamiento de la plataforma Midjourney, cuando migró de su versión 4 a la 5, mejorando radicalmente este problema para producir similitud fotográfica en estas imágenes estadísticas.

La fotografía puede saltear El Valle porque puede parecer, sin ser, y hacer que nosotros empaticemos con ella.

Las imágenes producidas por inteligencia artificial lo logran cuando se parecen a una fotografía.

Ninguna es lo que parece. Y a las dos podemos mirarlas en calma como si fueran.

VI

En esta primera etapa de las imágenes generadas por inteligencia artificial en la que nos encontramos, la producción funciona por fagocitación. Estas imágenes se construyen a partir del bache de fotografías disponible para cada programa y sobre cuyo complejo el modelo realiza procesos para construir algo que se asemeje lo suficiente a una imagen fotográfica como para que nuestra mirada crea que estamos ante ella. Estas imágenes se paran sobre la Historia de la Fotografía. Se construyen desde la biblioteca disponible de imágenes fotográficas. A partir de la abundancia o escasez de tipologías de fotografía construyen su canon. Fagocitan el programa de la Historia. Y todo el prejuicio y violencia que hay en ella.

En una segunda etapa, cuya línea temporal no puedo aseverar con certeza pero que siento no es tan lejana, habrá tanta producción de imágenes sintéticas que los modelos generadores empezarán a alimentarse también de su propia biblioteca para producir estas imágenes de expectativa fotográfica. Esta etapa será una de canibalismo, donde las inteligencias artificiales comenzarán a alimentar su creación a partir de sus propias producciones anteriores.

Existe una tercera hipotética etapa, donde el aluvión de imágenes de semejanza fotográfica será de tal abundancia que a la hora de procesar la biblioteca, las IAs ya casi no accederán a las fotografías debido a su escasez estadística en la distribución completa.

Ese quizás sea el hundimiento de la Historia de la Fotografía, que quedará sepultada. Estará allí, pero no podremos verla. Será también el nacimiento independiente de la Historia de las imágenes sintéticas de semejanza fotográfica.

Corrección de texto: 
Gonzalo Golpe
Valeria Rovatti