Inteligências artificiais (IAs) capazes de gerar imagens tem alcançado resultados impressionantes, indiscerníveis de fotos reais – a montagem do Papa de jaqueta que o diga.
Natural. Softwares desse tipo funcionam a partir de um princípio conhecido como machine learning (“aprendizado de máquina”), cuja premissa é o aperfeiçoamento constante. Esses programas (Midjourney, Dall-E, Staple Diffusion, entre outros) recebem incontáveis imagens de todos os cantos da internet, associadas a uma descrição em texto do que elas são (uma foto de um cacho de uva vai ter a legenda “cacho de uva”, simples assim). As IAs então, traduzem essas informações para conjuntos numéricos, e “entendem” que aquilo é a representação visual da fruta.
A partir daí, elas estão prontas para receber pedidos. Quando você escreve “cacho de uva” para o Dall-E, por exemplo, ele vai buscar no seu banco de dados o conceito de um “cacho de uva” – várias esferas lustrosas, verdes ou roxas, presas por um caule de planta. O robô, então, se prepara para um processo chamado de “difusão”.
Nesse processo, é como se ela jogasse várias peças de quebra-cabeça aleatórias em uma mesa e fosse, aos poucos, organizando o caos na imagem requisitada. No caso, as peças são pixels que, depois do comando, vão se alinhando para tentar se aproximar do pedido.
Fonte: Revista Superinteressante