Colección de citas famosas - Slogan de motivación - ¡Ai hace "reír" las fotos antiguas! ¿Por qué es tan sorprendente?

¡Ai hace "reír" las fotos antiguas! ¿Por qué es tan sorprendente?

¿Las fotografías en blanco y negro no pueden traer recuerdos del pasado? ¿Y si pudiera convertirse en una animación en color? Recientemente, el artista independiente Hu, con la ayuda de la tecnología de inteligencia artificial (IA), restauró fotografías antiguas de la protagonista de la película "Hola, mamá" que tocaron a cientos de millones de personas en imágenes coloridas y dinámicas, transportando a las personas a través del tiempo y espacio para ver Es tan vívido y hermoso que los internautas lo llaman "mágico".

La restauración de fotografías en blanco y negro mediante inteligencia artificial ha hecho que la gente recuerde el pasado, y los pasos de la operación no son complicados. En el vídeo de "AI Restoring Old Photos", Hu fue "resucitado" con la ayuda de la inteligencia artificial después de pasar por varios pasos: restauración del color por IA, mejora de la nitidez por IA, refinamiento del rostro y ajuste fino de los pintados a mano.

Entonces, ¿cómo se realiza esta tecnología mágica?

Los pasos de la IA para reparar fotos y el algoritmo detrás de ellos

En términos generales, hay tres pasos principales para reparar fotos: encontrar defectos, reparar defectos y colorear. Dado que las fotografías de Hu Fuyuan no están obviamente dañadas, los pasos que muestra son principalmente pasos para colorear. Encontrar y reparar defectos es un proceso de "entrenamiento" del algoritmo, que requiere marcar y reparar defectos en una gran cantidad de imágenes para construir un modelo de algoritmo completo para su posterior reparación automática.

Para facilitar el aprendizaje de todos, Hu anunció sus propios proyectos de código abierto: Paddle Gan y DFDNet. GAN y DFDNet detrás de esto son algoritmos de inteligencia artificial comúnmente utilizados para reparar fotografías.

GAN es una red generativa adversaria. Su modelo logra el resultado de generar imágenes a través de la interacción de dos módulos: el modelo generativo y el modelo discriminativo. El modelo generativo es responsable de generar imágenes. Por ejemplo, dada una serie de imágenes de cachorros, genera una imagen de cachorros que no pertenece a la imagen dada. El modelo discriminativo es responsable de distinguir las imágenes generadas por el modelo generativo de las imágenes reales. Su proceso de "interacción" es similar a la imagen generada que "explora" la generación de un cachorro con tres ojos. Después de ser "contraatacado" por el modelo de juicio, aprende que el cachorro no tiene tres ojos. El resultado de la interacción entre los dos es que el modelo generado eventualmente puede generar una imagen "falsa", lo que hace imposible que el modelo discriminativo la distinga de una imagen real.

DFDNet, o Deep Face Dictionary Network, se basa en el hecho de que los cuatro componentes de las caras de diferentes personas (dos ojos, nariz y boca) son básicamente similares. El algoritmo puede comparar una gran cantidad de caras diferentes. rostros Imágenes de rostros de alta definición para crear un "diccionario" de componentes faciales. Cuando se usa, se puede "hacer coincidir", como si se redujera el rango a partir de la primera letra de un diccionario. Puede utilizar este proceso para guiar la restauración facial.

Otras aplicaciones de los algoritmos de reparación de fotografías con inteligencia artificial

La tecnología de inteligencia artificial para reparar fotografías antiguas no solo puede reparar fotografías en blanco y negro, muy borrosas y dañadas, sino también en blanco y negro. películas blancas. Sus beneficios van más allá de simplemente "recordar el pasado". Al restaurar detalles históricos, no solo restaura fotografías, sino que también hereda una cultura.

Con el advenimiento de la era 5G, con la "bendición" de los grandes datos y la computación en la nube, la tecnología de restauración de películas mediante IA puede incluso utilizarse para la restauración y optimización en tiempo real de vídeos instantáneos, resolviendo imágenes confusas y nerviosas. e imágenes borrosas como el ruido... La combinación de múltiples tecnologías puede generar una amplia aplicación de la IA en industrias como la seguridad, el transporte, las imágenes médicas, la filmación de películas y televisión y la transmisión en vivo.

Experto: Yu Han, profesor asociado de la Universidad de Comunicación de China.

上篇: ¿Qué significa congelable? 下篇: ¿Qué significa DNS y cómo lo configuro?