O que é IA generativa?

Inteligência artificial (IA) generativa é um tipo de programa de computador que pode produzir conteúdo em resposta a prompts de humanos.

Objetivos de aprendizado

Após ler este artigo, você será capaz de:

  • Definir a IA generativa
  • Explicar como funciona a IA generativa
  • Listar as vantagens e desvantagens da IA generativa

Copiar o link do artigo

O que é IA generativa?

Inteligência artificial (IA) generativa é um tipo de modelo de aprendizado profundo que pode produzir texto, imagens, código de computador e conteúdo audiovisual como resposta a prompts.

Os modelos de IA generativa são treinados com grandes quantidades de dados brutos — geralmente, os mesmos tipos de dados que foram criados para produzir. Com base nesses dados, esses modelos aprendem a formular respostas com probabilidade estatística de serem relevantes para as inserções arbitrárias que lhes são fornecidas. Por exemplo, alguns modelos de IA generativa são treinados com grandes quantidades de texto para conseguirem responder aos prompts escritos de uma maneira que nos pareça ser orgânica e original.

Em termos mais simples, a IA generativa pode reagir a solicitações de forma muito parecida com a de artistas ou autores humanos, mas com mais rapidez. Se o conteúdo que esses modelos geram pode ser considerado "novo" ou "original" é discutível, mas, em muitos casos, pode se equiparar ou exceder certas habilidades criativas de humanos.

Os modelos de IA generativa mais populares incluem o ChatGPT para geração de texto e o DALL-E para geração de imagens. Muitas organizações também já criaram seus próprios modelos.

Como funciona a IA generativa?

Aprendizado de máquina, aprendizado profundo e redes neurais

IA generativa é um tipo de aprendizado de máquina, o que significa que depende de uma análise matemática para detectar conceitos, imagens ou padrões relevantes. Em seguida, usa essa análise para produzir um conteúdo com probabilidade estatística de ser semelhante ou relacionado ao prompt recebido.

Especificamente, a IA generativa depende de um tipo de aprendizado de máquina chamado aprendizado profundo. Os modelos de aprendizado profundo são suficientemente poderosos para aprender com dados não rotulados e usam um tipo de arquitetura de computação conhecida como rede neural. Essas arquiteturas são compostas de vários nós que transmitem dados entre si, da mesma forma que um cérebro humano transmite dados por meio de neurônios. As redes neurais são capazes de realizar tarefas altamente sofisticadas e refinadas.

Transformers e autoatenção

Os modelos de IA generativa capazes de interpretar textos precisam entender mais do que as palavras individuais. Precisam ser capazes de interpretar frases, parágrafos e documentos inteiros. Os primeiros modelos de aprendizado de máquina tinham dificuldade de entender frases inteiras e "esqueciam" o início de uma frase quando chegavam ao seu final, o que resultava em uma interpretação incorreta.

Os modelos de IA generativa modernos usam um tipo específico de rede neural chamada "transformer". Esses transformers usam um recurso chamado autoatenção para detectar como os elementos em uma sequência estão conectados. Os transformers permitem que modelos de IA generativa façam coisas como processar e contextualizar grandes blocos de texto, em vez de apenas palavras e frases individuais.

Dados de treinamento

Para funcionar bem, os modelos de IA generativa precisam ser alimentados com uma grande quantidade de dados — mais dados, na maioria dos casos, do que um ser humano poderia processar ao longo de toda a sua vida. Por exemplo, o modelo de linguagem grande ChatGPT foi treinado com milhões de documentos. Um gerador de imagens pode ser treinado com milhões de imagens e um gerador de códigos com bilhões de linhas de código.

Esses dados de treinamento são armazenados em um banco de dados vetorial. Nesse banco de dados, os pontos de dados são armazenados como vetores, ou seja, um conjunto de coordenadas em um campo multidimensional. Assim como a latitude e a longitude permitem que alguém que esteja procurando em um mapa encontre locais nas redondezas, o armazenamento de dados como vetores permite que os modelos de aprendizado de máquina encontrem pontos de dados "nas redondezas". Isso permite que os modelos façam associações e entendam o contexto de uma palavra, uma imagem, um som ou qualquer outro tipo de conteúdo.

Após atingir um determinado nível de refinamento, o modelo de IA generativa não precisa mais de tantos dados para produzir um resultado. Por exemplo, os modelos de IA geradores de voz podem ser treinados com milhares de horas de gravações de voz, mas, após terem sido ajustados, alguns modelos precisam de apenas alguns segundos de uma amostra de gravação para imitar a voz de alguém de maneira realista.

Quais são as vantagens e desvantagens da IA generativa?

A popularidade dos modelos de IA generativa está aumentando porque oferecem várias vantagens em potencial. As vantagens incluem, mas não se limitam a:

  • Concepção de conteúdo: o uso de IA generativa pode ajudar os criadores de conteúdo a elaborarem uma direção criativa mais rapidamente.
  • Chatbot melhores: os modelos de IA generativa podem ser integrados a chatbots para responderem melhor às perguntas dos clientes, envolverem clientes em potencial e assim por diante.
  • Pesquisa aprimorada: os modelos de IA generativa podem processar rapidamente grandes quantidades de dados para facilitar as pesquisas, inclusive dados médicos ou estudos científicos.
  • Resultados de pesquisa aprimorados: os mecanismos de pesquisa e os assistentes virtuais podem incorporar recursos de IA generativa para fornecerem mais rapidamente informações relevantes em resposta a consultas.
  • Entretenimento: muitas pessoas usam ferramentas de IA generativa disponíveis publicamente apenas por diversão.
  • Outras vantagens: a IA é um campo em rápido crescimento e é provável que outras vantagens da IA generativa apareçam futuramente.

No entanto, a IA generativa tem sua parcela de desvantagens, entre elas:

  • Alucinação e outras imprecisões: os modelos de IA generativa costumam ser muito bons em identificar padrões, mas, às vezes, identificam padrões que na verdade não existem. Isso pode fazer com que forneçam informações falsas, um fenômeno conhecido como "alucinação". Além disso, a precisão dos modelos de IA generativa se limita à dos dados que lhes são fornecidos e a verificação de fatos dos resultados da IA generativa pode se revelar difícil sem o acesso aos dados originais.
  • Vazamento de dados: os modelos podem pegar os dados dos prompts que os alimentam e revelá-los em contextos inesperados. Diversas grandes empresas já vazaram informações confidenciais ou códigos-fonte acidentalmente dessa maneira.
  • Plágio ou uso indevido de propriedade intelectual por acidente: como são baseados em conteúdo preexistente, os modelos de IA generativa podem reproduzir o conteúdo recebido sem a permissão do autor original ou do detentor dos direitos autorais.
  • Manipulação maliciosa de respostas: invasores podem alimentar um modelo de IA generativa com dados que o leve a produzir informações perigosas ou inseguras para outros usuários.
  • Preconceitos: qualquer preconceito contido nas informações que alimentam um modelo durante o treinamento provavelmente será mantido ou até mesmo exacerbado, a menos que o modelo seja ajustado para corrigi-lo. Ainda assim, é quase impossível garantir que os resultados estejam livres de preconceitos sem que todo o conjunto de treinamento seja revisado.

O que é um modelo de linguagem ampla (LLM)?

"Modelo de linguagem grande" (LLM) é o termo técnico para modelos de IA generativa que processam linguagem — incluindo idiomas falados por humanos e linguagens de programação — e podem gerar texto. Os LLMs mais populares incluem o ChatGPT (da OpenAI), o Llama (da Meta), o Bard (do Google), o Copilot (do GitHub) e o Bing Chat (da Microsoft).

O que é um gerador de imagens de IA?

Os geradores de imagens de IA funcionam de forma semelhante aos LLMs, mas para imagens, em vez de texto. O DALL-E e o Midjourney são dois exemplos de geradores de imagens populares baseados em IA generativa.

A Cloudflare oferece suporte ao desenvolvimento de IA generativa?

A Cloudflare capacita os desenvolvedores e empresas a criarem seus próprios modelos de IA generativa. Oferecemos o Vectorize aos desenvolvedores para que possam gerar e armazenar incorporações na rede global da Cloudflare a partir de seus próprios dados e o Workers AI da Cloudflare para a execução de tarefas de IA generativa em uma rede global de GPUs. Saiba mais sobre como a Cloudflare está possibilitando a IA generativa de última geração.