Descripción: La similitud perceptual es una medida que evalúa cuán similares parecen dos imágenes a un observador humano. Este concepto es fundamental en el campo de la visión por computadora y se utiliza frecuentemente en la evaluación de las salidas generadas por Redes Generativas Antagónicas (GAN). Las GAN son un tipo de modelo de aprendizaje profundo que consiste en dos redes neuronales: un generador y un discriminador. El generador crea imágenes a partir de ruido aleatorio, mientras que el discriminador intenta distinguir entre imágenes reales y generadas. La similitud perceptual se convierte en un criterio clave para determinar la calidad de las imágenes generadas, ya que no solo se considera la similitud pixel a pixel, sino también cómo un observador humano percibiría esas imágenes. Esto implica que la similitud perceptual puede capturar características más abstractas y contextuales de las imágenes, como la composición, el color y la textura, lo que la hace más relevante en aplicaciones donde la percepción humana es crucial, como en el arte digital, la publicidad y la creación de contenido visual. En resumen, la similitud perceptual es una herramienta valiosa para evaluar la efectividad de las GAN y su capacidad para producir imágenes que sean indistinguibles de las reales desde la perspectiva humana.
Historia: La noción de similitud perceptual ha evolucionado con el desarrollo de la visión por computadora y el aprendizaje profundo. Aunque los conceptos de percepción visual se remontan a estudios psicológicos del siglo XX, su aplicación en el ámbito de la inteligencia artificial comenzó a tomar forma en la década de 2010, coincidiendo con el auge de las redes neuronales profundas y las GAN. En 2014, Ian Goodfellow y sus colegas introdujeron las GAN, lo que llevó a un interés creciente en métricas que pudieran evaluar la calidad de las imágenes generadas, incluyendo la similitud perceptual.
Usos: La similitud perceptual se utiliza principalmente en la evaluación de modelos generativos, especialmente en el contexto de las GAN. Se aplica en diversas áreas, como la generación de imágenes, la mejora de la calidad de imágenes, la transferencia de estilo y la síntesis de imágenes. También se utiliza en la comparación de imágenes en aplicaciones de reconocimiento facial y en la evaluación de la calidad de video.
Ejemplos: Un ejemplo de uso de la similitud perceptual es en la evaluación de imágenes generadas por GANs en el arte digital, donde se compara la calidad de las obras generadas con las de artistas humanos. Otro ejemplo es en la mejora de imágenes, donde se utilizan métricas de similitud perceptual para evaluar la efectividad de algoritmos de superresolución. Además, se aplica en la comparación de imágenes en sistemas de reconocimiento facial, donde se busca asegurar que las imágenes coincidan de manera perceptual.