Tarea de inteligencia artificial
Imagen a texto
Una tarea multimodal que utiliza algoritmos de visión por computadora en combinación con modelos de generación de lenguaje para reconocer objetos, personajes, escenas o actividades dentro de imágenes y luego generar descripciones o identificaciones textuales relevantes.