O que é uma rede neural?

As redes neurais, um componente crucial dos modelos de inteligência artificial (IA), funcionam com base em uma arquitetura que imita os neurônios do cérebro humano.

Objetivos de aprendizado

Após ler este artigo, você será capaz de:

  • Explicar o que é uma rede neural
  • Listar os tipos de redes neurais
  • Entender como funcionam as redes neurais

Copiar o link do artigo

O que é uma rede neural?

Uma rede neural, ou rede neural artificial, é um tipo de arquitetura de computação que se baseia em um modelo de como o cérebro humano funciona — daí o nome "neural". As redes neurais são formadas por uma coleção de unidades de processamento chamadas de "nós." Esses nós transmitem dados entre si, da mesma forma que, em um cérebro, os neurônios transmitem impulsos elétricos entre si.

As redes neurais são usadas no aprendizado de máquina, que se refere a uma categoria de programas de computador que aprendem sem instruções definidas. Especificamente, as redes neurais são usadas na aprendizagem profunda, um tipo avançado de aprendizagem de máquina que pode tirar conclusões de dados não rotulados sem intervenção humana. Por exemplo, um modelo de aprendizagem profunda criado em uma rede neural e alimentado com dados de treinamento suficientes poderia ser capaz de identificar itens em uma foto que nunca viu antes.

Uma rede neural composta de nós divididos em uma camada de entrada, várias camadas ocultas e uma camada de saída identifica a foto de um gato

As redes neurais possibilitam muitos tipos de inteligência artificial (IA). Modelos de linguagem grande (LLMs) como o ChatGPT, geradores de imagens de IA como o DALL-E e modelos de IA preditiva dependem das redes neurais até certo ponto.

Como funcionam as redes neurais?

As redes neurais são compostas por uma coleção de nós. Os nós são distribuídos por pelo menos três camadas. As três camadas são:

  • Uma camada de entrada
  • Uma camada "oculta"
  • Uma camada de saída

Essas três camadas são um número mínimo. Além da camada de entrada e da camada de saída, as redes neurais podem ter mais de uma camada oculta.

Independentemente da camada da qual faz parte, cada nó executa algum tipo de tarefa ou função de processamento em qualquer inserção recebida do nó anterior (ou da camada de entrada). Essencialmente, cada nó contém uma fórmula matemática, com cada variável dentro da fórmula sendo ponderada de forma diferente. Se o resultado da aplicação dessa fórmula matemática à inserção (ou entrada) exceder um determinado limite, o nó repassará os dados para a próxima camada da rede neural. Se o resultado (ou saída) estiver abaixo do limite, nenhum dado será repassado para a próxima camada.

Imagine que a Acme Corporation tenha um departamento de contabilidade com uma hierarquia rígida. Os funcionários do departamento de contabilidade da Acme em nível de gerente aprovam despesas inferiores a US$ 1.000, os diretores aprovam despesas inferiores a US$ 10.000 e o diretor financeiro aprova quaisquer despesas que excedam US$ 10.000. Quando funcionários de outros departamentos da Acme Corporation enviam seus comprovantes de despesas, os primeiros a recebê-las são os gerentes de contabilidade. Qualquer despesa superior a US$ 1.000 é repassada a um diretor, enquanto as despesas inferiores a US$ 1.000 permanecem no nível de gerência e assim por diante.

O departamento de contabilidade da Acme Corporation funciona, de certa forma, como uma rede neural. Quando os funcionários enviam seus relatórios de despesas, é como se fosse a camada de entrada de uma rede neural. Cada gerente e cada diretor são como um nó dentro da rede neural.

E, assim como um gerente de contabilidade pode pedir ajuda a outro gerente para interpretar um relatório de despesas antes de repassá-lo para um diretor de contabilidade, as redes neurais podem ser arquitetadas de várias maneiras. Os nós podem se comunicar em várias direções.

Quais são os tipos de redes neurais?

Não há limite para o número de nós e camadas que uma rede neural pode ter, e esses nós podem interagir quase de qualquer maneira. Por essa razão, a lista de tipos de redes neurais está sempre se expandindo. No entanto, as redes podem ser classificadas, grosso modo, nas seguintes categorias:

  • Redes neurais rasas, que costumam ter apenas uma camada oculta
  • Redes neurais profundas, que têm várias camadas ocultas

As redes neurais rasas são rápidas e exigem menos poder de processamento do que as redes neurais profundas, mas não conseguem executar tantas tarefas complexas quanto as redes neurais profundas.

Abaixo temos uma lista incompleta dos tipos de redes neurais que podem ser usados atualmente:

As redes neurais perceptron são redes simples e superficiais com uma camada de entrada e uma camada de saída.

Dois nós na camada de entrada e um nó na camada de saída

As redes neurais perceptron multicamadas aumentam a complexidade das redes perceptron e incluem uma camada oculta.

Dois nós na camada de entrada, dois nós na camada oculta e um nó na camada de saída

As redes neurais feed-forward só permitem que seus nós passem informações para um nó forward.

Os dados passam adiante entre os nós. Camada de entrada, camada oculta e camada de saída.

As redes neurais recorrentes podem retroceder, permitindo que a saída de alguns nós afete a entrada dos nós anteriores.

Camada de entrada, duas camadas ocultas, camada de saída. Os dados retrocedem de uma camada oculta para a camada oculta anterior.

As redes neurais modulares combinam duas ou mais redes neurais para chegar à saída.

Duas redes neurais, a Rede 1 e a Rede 2, conectam-se à mesma camada de saída.

Os nós da rede neural de função de base radial usam um tipo específico de função matemática chamada função de base radial.

Os nós da camada oculta da rede neural são funções de base radial.

As redes neurais de máquina de estado líquido apresentam nós que são conectados aleatoriamente uns aos outros.

Os dados vão da camada de entrada para o reservatório de nós conectados aleatoriamente na camada oculta.

As redes neurais residuais permitem que os dados avancem por meio de um processo chamado mapeamento de identidade, combinando a saída das camadas iniciais com a saída das camadas posteriores.

O mapeamento de identidade ignora os dados dos nós anteriores em várias camadas.

O que é uma rede neural transformer?

Vale a pena destacar as redes neurais transformer porque assumiram um lugar de enorme importância nos modelos de IA amplamente utilizados atualmente.

Propostos pela primeira vez em 2017, os modelos transformer são redes neurais que usam uma técnica chamada "autoatenção" para levar em conta o contexto dos elementos em uma sequência, não apenas os elementos em si. Por meio da autoatenção, os modelos podem detectar até mesmo as maneiras sutis pelas quais as partes de um conjunto de dados se relacionam entre si.

Essa capacidade os torna ideais para analisar (por exemplo) frases e parágrafos de texto, em vez de apenas palavras e frases soltas. Antes de os modelos transformer serem desenvolvidos, os modelos de IA que processavam textos muitas vezes "esqueciam" o início de uma frase quando chegavam ao seu final e, como resultado, combinavam frases e ideias de maneiras que não faziam sentido para os leitores humanos. Os modelos transformer, no entanto, podem processar e gerar linguagem humana de uma forma muito mais natural.

Os modelos transformer são um componente integral da IA generativa, em especial os LLMs que podem produzir texto em resposta a prompts humanos arbitrários.

História das redes neurais

Na verdade, as redes neurais são bastante antigas. O conceito de redes neurais pode ser remetido a um artigo técnico matemático de 1943 que modelou como o cérebro poderia funcionar. Os cientistas de computação começaram a tentar construir redes neurais simples nas décadas de 1950 e 1960, mas o conceito acabou caindo em desuso. Na década de 1980 o conceito foi retomado e, na década de 1990, as redes neurais já eram amplamente utilizadas em pesquisas de IA.

No entanto, somente com o advento do processamento hiper rápido, dos recursos gigantescos de armazenamento de dados e do acesso a recursos de computação as redes neurais conseguiram avançar até o ponto em que se encontram hoje, podendo imitar ou até mesmo superar as habilidades cognitivas humanas. O campo ainda está sendo desenvolvido, e um dos tipos de redes neurais mais importantes em uso atualmente, o transformer, data de 2017.

Como a Cloudflare oferece suporte a redes neurais?

Com locais em mais de 310 cidades em todo o mundo, a Cloudflare está em uma posição única para oferecer poder computacional aos desenvolvedores de IA em qualquer lugar com um mínimo de latência. A suite Cloudflare para AI permite que os desenvolvedores executem tarefas de IA em uma rede global de unidades de processamento gráfico (GPUs) sem nenhuma configuração adicional. A Cloudflare também oferece opções de armazenamento em nuvem econômicas para as grandes quantidades de dados necessários para treinar redes neurais. Saiba mais sobre a suíte Cloudflare para IA.