A inferência de IA é quando um modelo de IA produz previsões ou conclusões. O treinamento de IA é o processo que permite que os modelos de IA façam inferências precisas.
Após ler este artigo, você será capaz de:
Copiar o link do artigo
No campo da inteligência artificial (IA), a inferência é o processo que um modelo de aprendizado de máquina treinado* usa para tirar conclusões a partir de dados totalmente novos. Um modelo de IA capaz de fazer inferências pode fazer isso sem exemplos do resultado desejado. Em outras palavras, a inferência é um modelo de IA em ação.
Um exemplo de inferência de IA seria um carro autônomo capaz de reconhecer um sinal de parada, mesmo em uma estrada em que ele nunca tenha dirigido antes. O processo de identificação desse sinal de parada em um novo contexto é a inferência.
Outro exemplo: um modelo de aprendizado de máquina treinado com base no desempenho anterior de jogadores esportivos profissionais pode ser capaz de fazer previsões sobre o desempenho futuro de um determinado jogador esportivo antes que ele assine um contrato. Essa previsão é uma inferência.
*O aprendizado de máquina é um tipo de IA.
Para chegar ao ponto de conseguir identificar sinais de parada em novos locais (ou prever o desempenho de um atleta profissional), os modelos de aprendizado de máquina passam por um processo de treinamento. Para o veículo autônomo, seus desenvolvedores mostraram ao modelo milhares ou milhões de imagens de sinais de parada. Um veículo que esteja executando o modelo pode até mesmo ter sido dirigido em estradas (com um motorista humano como apoio), permitindo que ele aprenda por tentativa e erro. Ao final, após treinamento suficiente, o modelo é capaz de identificar sinais de parada por conta própria.
Quase todos os aplicativos de IA do mundo real dependem da inferência de IA. Alguns dos exemplos mais comumente usados incluem:
Em sua essência, o treinamento de IA envolve alimentar modelos de IA com grandes conjuntos de dados. Esses conjuntos de dados podem ser estruturados ou não estruturados, rotulados ou não rotulados. Alguns tipos de modelos podem precisar de exemplos específicos de entradas e seus resultados desejados. Outros modelos, como os de aprendizagem profunda, podem precisar apenas de dados brutos. Ao final, os modelos aprendem a reconhecer padrões ou correlações e podem, então, fazer inferências com base em novas entradas.
À medida que o treinamento progride, os desenvolvedores podem precisar ajustar os modelos. Eles fazem com que o modelo forneça algumas inferências logo após o processo de treinamento inicial e, em seguida, corrigem os resultados. Imagine que um modelo de IA tenha sido encarregado de identificar as fotos de cães em um conjunto de dados de fotografias de animais de estimação. Se, em vez disso, o modelo identificar fotos de gatos, ele precisará de alguns ajustes.
Os programas de IA ampliam os recursos dos computadores para muito além do que eles eram capazes de fazer anteriormente. Mas isso tem o custo de usar muito mais poder de processamento do que os programas de computador tradicionais, assim como, para uma pessoa, resolver uma equação matemática complexa exige mais foco e concentração do que resolver "2 + 2."
O treinamento de um modelo de IA pode ser muito caro em termos de capacidade de computação. Mas é mais ou menos uma despesa única. Quando um modelo é treinado adequadamente, o ideal é que ele não precise ser treinado novamente.
A inferência, no entanto, está em andamento. Se um modelo estiver em uso ativo, ele estará constantemente aplicando seu treinamento a novos dados e fazendo inferências adicionais. Isso exige uma grande capacidade de computação e pode ser muito caro.
O Cloudflare Workers AI oferece aos desenvolvedores acesso a GPUs em todo o mundo para executar tarefas de IA. Isso é combinado com o Vectorize, um serviço para gerar e armazenar embeddings para modelos de aprendizado de máquina. A Cloudflare também oferece armazenamento de objetos econômico para manter coleções de dados de treinamento, o R2, uma plataforma de armazenamento com taxa de saída zero.
Saiba mais sobre como a Cloudflare permite que os desenvolvedores executem a inferência de IA na borda.