Inteligência artificial (IA) generativa é um tipo de programa de computador que pode produzir conteúdo em resposta a prompts de humanos.
Após ler este artigo, você será capaz de:
Copiar o link do artigo
Inteligência artificial (IA) generativa é um tipo de modelo de aprendizado profundo que pode produzir texto, imagens, código de computador e conteúdo audiovisual como resposta a prompts.
Os modelos de IA generativa são treinados com grandes quantidades de dados brutos — geralmente, os mesmos tipos de dados que foram criados para produzir. Com base nesses dados, esses modelos aprendem a formular respostas com probabilidade estatística de serem relevantes para as inserções arbitrárias que lhes são fornecidas. Por exemplo, alguns modelos de IA generativa são treinados com grandes quantidades de texto para conseguirem responder aos prompts escritos de uma maneira que nos pareça ser orgânica e original.
Em termos mais simples, a IA generativa pode reagir a solicitações de forma muito parecida com a de artistas ou autores humanos, mas com mais rapidez. Se o conteúdo que esses modelos geram pode ser considerado "novo" ou "original" é discutível, mas, em muitos casos, pode se equiparar ou exceder certas habilidades criativas de humanos.
Os modelos de IA generativa mais populares incluem o ChatGPT para geração de texto e o DALL-E para geração de imagens. Muitas organizações também já criaram seus próprios modelos.
IA generativa é um tipo de aprendizado de máquina, o que significa que depende de uma análise matemática para detectar conceitos, imagens ou padrões relevantes. Em seguida, usa essa análise para produzir um conteúdo com probabilidade estatística de ser semelhante ou relacionado ao prompt recebido.
Especificamente, a IA generativa depende de um tipo de aprendizado de máquina chamado aprendizado profundo. Os modelos de aprendizado profundo são suficientemente poderosos para aprender com dados não rotulados e usam um tipo de arquitetura de computação conhecida como rede neural. Essas arquiteturas são compostas de vários nós que transmitem dados entre si, da mesma forma que um cérebro humano transmite dados por meio de neurônios. As redes neurais são capazes de realizar tarefas altamente sofisticadas e refinadas.
Os modelos de IA generativa capazes de interpretar textos precisam entender mais do que as palavras individuais. Precisam ser capazes de interpretar frases, parágrafos e documentos inteiros. Os primeiros modelos de aprendizado de máquina tinham dificuldade de entender frases inteiras e "esqueciam" o início de uma frase quando chegavam ao seu final, o que resultava em uma interpretação incorreta.
Os modelos de IA generativa modernos usam um tipo específico de rede neural chamada "transformer". Esses transformers usam um recurso chamado autoatenção para detectar como os elementos em uma sequência estão conectados. Os transformers permitem que modelos de IA generativa façam coisas como processar e contextualizar grandes blocos de texto, em vez de apenas palavras e frases individuais.
Para funcionar bem, os modelos de IA generativa precisam ser alimentados com uma grande quantidade de dados — mais dados, na maioria dos casos, do que um ser humano poderia processar ao longo de toda a sua vida. Por exemplo, o modelo de linguagem grande ChatGPT foi treinado com milhões de documentos. Um gerador de imagens pode ser treinado com milhões de imagens e um gerador de códigos com bilhões de linhas de código.
Esses dados de treinamento são armazenados em um banco de dados vetorial. Nesse banco de dados, os pontos de dados são armazenados como vetores, ou seja, um conjunto de coordenadas em um campo multidimensional. Assim como a latitude e a longitude permitem que alguém que esteja procurando em um mapa encontre locais nas redondezas, o armazenamento de dados como vetores permite que os modelos de aprendizado de máquina encontrem pontos de dados "nas redondezas". Isso permite que os modelos façam associações e entendam o contexto de uma palavra, uma imagem, um som ou qualquer outro tipo de conteúdo.
Após atingir um determinado nível de refinamento, o modelo de IA generativa não precisa mais de tantos dados para produzir um resultado. Por exemplo, os modelos de IA geradores de voz podem ser treinados com milhares de horas de gravações de voz, mas, após terem sido ajustados, alguns modelos precisam de apenas alguns segundos de uma amostra de gravação para imitar a voz de alguém de maneira realista.
A popularidade dos modelos de IA generativa está aumentando porque oferecem várias vantagens em potencial. As vantagens incluem, mas não se limitam a:
No entanto, a IA generativa tem sua parcela de desvantagens, entre elas:
"Modelo de linguagem grande" (LLM) é o termo técnico para modelos de IA generativa que processam linguagem — incluindo idiomas falados por humanos e linguagens de programação — e podem gerar texto. Os LLMs mais populares incluem o ChatGPT (da OpenAI), o Llama (da Meta), o Bard (do Google), o Copilot (do GitHub) e o Bing Chat (da Microsoft).
Os geradores de imagens de IA funcionam de forma semelhante aos LLMs, mas para imagens, em vez de texto. O DALL-E e o Midjourney são dois exemplos de geradores de imagens populares baseados em IA generativa.
A Cloudflare capacita os desenvolvedores e empresas a criarem seus próprios modelos de IA generativa. Oferecemos o Vectorize aos desenvolvedores para que possam gerar e armazenar incorporações na rede global da Cloudflare a partir de seus próprios dados e o Workers AI da Cloudflare para a execução de tarefas de IA generativa em uma rede global de GPUs. Saiba mais sobre como a Cloudflare está possibilitando a IA generativa de última geração.