O que é geração de imagens por IA?

Os geradores de imagens por inteligência artificial (IA) podem produzir imagens detalhadas em vários estilos com base em grandes conjuntos de dados de treinamento.

Objetivos de aprendizado

Após ler este artigo, você será capaz de:

  • Entender como funciona a geração de imagens por IA
  • Descrever redes neurais e redes adversárias generativas
  • Saiba como a Cloudflare ajuda os desenvolvedores a criar geradores de imagens por IA

Copiar o link do artigo

Como funciona a geração de imagens por IA?

A geração de imagens por inteligência artificial (IA) é um tipo de IA generativa para produzir conteúdo visual. Ele usa análise matemática para identificar e duplicar padrões em fotos e ilustrações. Em termos mais simples, os geradores de imagens por IA criam imagens com base em um conjunto de exemplos.

Os geradores de imagens por IA são criados em um tipo especializado de modelo de aprendizado de máquina chamado rede neural. Por meio do uso de análise estatística avançada, juntamente com alguns ajustes por parte do desenvolvedor, os geradores de imagens podem produzir imagens relevantes e detalhadas em vários estilos.

Em vez de um artista com um pincel, um gerador de imagens por IA é mais parecido com um jogador que faz apostas em prováveis resultados esportivos. O conteúdo produzido tem probabilidade estatística de atender à solicitação recebida. Além disso, seu conteúdo criado é baseado em conteúdo preexistente, assim como o jogador pode examinar os desempenhos anteriores dos atletas antes de fazer suas apostas.

Os geradores de imagens por IA podem criar fotografias de aparência realista. Eles também podem editar imagens preexistentes. Como outros tipos de IA generativa, os modelos de geração de imagens por IA podem interpretar prompts de linguagem natural e criar imagens em resposta. "Faça a imagem de um elefante" é um prompt válido, embora esse prompt possa precisar ser refinado antes de produzir a imagem que o prompter tem em mente.

O que é IA generativa?

IA generativa é uma categoria de modelo de aprendizado profundo que produz texto, imagens, código de computador, áudio ou conteúdo visual. Como um tipo de aprendizado de máquina, ela depende de análises matemáticas e estatísticas de conjuntos de dados de amostra para produzir conteúdo com probabilidade estatística de ser relevante em resposta a prompts. Em outras palavras, a IA generativa cria conteúdo rapidamente com base em exemplos anteriores que viu.

Qual tecnologia está por trás da geração de imagens por IA?

Como descrito acima, a geração de imagens por IA é construída usando aprendizado de máquina, uma classe de programas de computador avançados que podem aprender sem instruções definidas. Especificamente, a geração de imagens por IA é construída com base em redes neurais.

Uma rede neural é um tipo de arquitetura de computação de aprendizado profundo. Essencialmente, as redes neurais visam imitar a estrutura de um cérebro humano. Elas são uma coleção de unidades de processamento chamadas "nós". Os nós transmitem dados entre si, semelhante à maneira que um cérebro humano funciona, com os neurônios enviando impulsos elétricos entre si.

Existem muitas classes diferentes de redes neurais no campo da IA. O tipo específico de rede neural usada pela maioria dos modelos de IA geradores de imagens é chamado de rede adversária generativa (GAN). Uma GAN tem dois fluxos de trabalho: um produz imagens e o outro compara essas imagens com exemplos da vida real e identifica erros. Assim, um modelo baseado em GAN é capaz de se treinar e melhorar continuamente. Pense em um artista que aprende imitando pinturas famosas do passado e comparando seu trabalho com as peças reais.

Como a geração de imagens por IA difere de outros tipos de IA generativa?

Embora os mesmos algoritmos ou algoritmos semelhantes possam ser usados em todos os tipos de IA generativa, os modelos geradores de imagens são treinados em conjuntos de imagens visuais, em oposição a grandes quantidades de texto, como o ChatGPT e outros modelos de linguagem grande (LLMs).

O que são alucinações de IA em imagens?

As alucinações de IA podem ocorrer com qualquer tipo de modelo de IA generativa e a IA geradora de imagens não é exceção. Elas aparecem como imprecisões na imagem: por exemplo, se for solicitado que gere um retrato de uma pessoa, aparece um dedo extra na mão da pessoa. Com prompts e refinamento suficientes, geralmente é possível remover essas alucinações.

As imagens geradas por IA têm direitos autorais?

Qualquer trabalho criativo produzido por humanos está protegido por direitos autorais, a menos que o criador renuncie aos direitos autorais ou que os direitos autorais tenham expirado. Os direitos de uma obra podem ser transferidos ou vendidos a outras partes através de uma licença.

As licenças de imagens se enquadram em vários níveis:

  • Isentas de royalties: essas imagens podem ser usadas de qualquer forma após um pagamento único ao proprietário dos direitos.
  • Isenta de direitos autorais: uma imagem que foi divulgada ao público e pode ser usada por qualquer pessoa para qualquer finalidade sem dar os créditos ao criador.
  • Domínio público: um trabalho criativo está em domínio público se os direitos autorais expiraram. Qualquer pessoa pode usar imagens de domínio público para qualquer finalidade. Os trabalhos entram no domínio público em momentos diferentes em diferentes jurisdições, portanto, o uso internacional de imagens de domínio público pode ser complicado.
  • Creative Commons: existem seis tipos diferentes de licença nesta categoria. Todas permitem o uso generalizado da imagem, mas nem todas permitem seu uso comercial ou modificações. Todas as licenças Creative Commons exigem crédito ao criador da imagem.

As imagens geradas por IA não são protegidas pela lei de direitos autorais, pois um ser humano não as criou. Portanto, essas imagens geralmente entram em domínio público.

O problema, no entanto, é que o conjunto de dados de treinamento no qual um modelo se baseia pode conter imagens com uma gama de licenças e também pode conter propriedade intelectual protegida. Se um gerador de imagens por IA produzir uma imagem muito semelhante a uma imagem preexistente de um criador humano ou a uma marca de propriedade de outra empresa, essas partes podem processar alguém que usa a imagem. (Por exemplo, uma imagem do Super-Homem gerada por IA ainda pode estar protegida pelas mesmas proteções legais que se aplicam às imagens oficiais do personagem).

Para aumentar o problema, alguns modelos de geração de imagens por IA são criados com base em conjuntos de dados selecionados por bots de raspagem de IA que rastreiam textos e imagens em sites sem permissão. Na verdade, isso está se tornando um problema crescente para as empresas que não conseguem evitar que esses bots de raspagem de IA roubem seus dados. É por isso que a Cloudflare criou a ferramenta AI Audit para ajudar as empresas a ter controle sobre os bots de raspagem de IA que rastreiam suas mídias e sites.

Você pode usar imagens geradas por IA comercialmente?

Para imagens geradas por IA, isso depende da licença e do serviço de geração de imagens usado. Alguns serviços de geração de IA treinaram seus modelos em uma coleção selecionada de imagens para as quais eles detêm os direitos. Esses serviços podem permitir o uso comercial das imagens geradas por seus serviços sob uma licença Creative Commons, o que significa que qualquer outra pessoa também pode usar as imagens. Isso complica o uso comercial, pois as imagens não podem ser protegidas contra o uso por concorrentes da forma como imagens, marcas ou marcas registradas originais podem ser.

Como a Cloudflare ajuda os desenvolvedores a criarem seus próprios geradores de imagens por IA?

O Cloudflare Workers AI fornece elementos básicos de IA full stack, permitindo que os desenvolvedores integrem uma infinidade de modelos populares de IA generativa, incluindo geradores de imagens, em seus aplicativos e os executem em uma rede global de GPUs. Veja este tutorial para saber como começar a criar geradores de imagens por IA.