paint-brush
Funções de base radial: tipos, vantagens e casos de usopor@sanjaykn170396
17,932 leituras
17,932 leituras

Funções de base radial: tipos, vantagens e casos de uso

por Sanjay Kumar6m2023/01/24
Read on Terminal Reader

Muito longo; Para ler

Este artigo explica a intuição básica, a ideia matemática e o escopo da função de base radial no desenvolvimento de modelos preditivos de aprendizado de máquina. A função Radial Basis é uma função matemática que recebe uma entrada de valor real e gera uma saída de valor real com base na distância entre o valor de entrada projetado no espaço de um ponto fixo imaginário colocado em outro lugar. Essa função é popularmente usada em muitos algoritmos de aprendizado de máquina e aprendizado profundo.
featured image - Funções de base radial: tipos, vantagens e casos de uso
Sanjay Kumar HackerNoon profile picture


Este é um artigo introdutório que explica a intuição básica, a ideia matemática e o escopo das funções de base radial no desenvolvimento de modelos preditivos de aprendizado de máquina.


Índice

  1. Introdução
  2. Intuição básica de uma função de base radial
  3. Tipos de função de base radial
  4. O conceito da Rede RBF
  5. Escopo e Vantagens do RBF
  6. Conclusão
  7. Referências

Introdução

No aprendizado de máquina, a solução de problemas baseada em algoritmos baseados em hiperplanos depende muito da distribuição dos pontos de dados no espaço. No entanto, é um fato conhecido que os dados do mundo real raramente seguem suposições teóricas.


Existem muitas funções de transformação que podem converter a forma natural dos pontos de dados em distribuições teoricamente recomendadas, preservando os padrões ocultos dos dados. Radial Basis é uma dessas funções renomadas que é discutida em muitos livros didáticos de aprendizado de máquina. Neste artigo, aprenderemos sobre intuição básica, tipos e uso da função de base radial.

A intuição básica de uma função de base radial

A função de base radial é uma função matemática que recebe uma entrada de valor real e gera uma saída de valor real com base na distância entre o valor de entrada projetado no espaço de um ponto fixo imaginário colocado em outro lugar.


Essa função é popularmente usada em muitos algoritmos de aprendizado de máquina e aprendizado profundo, como máquinas de vetores de suporte, redes neurais artificiais, etc.


Vamos entender o conceito e o uso dessa função matemática.

Em tempo real, sempre que resolvemos problemas complexos de aprendizado de máquina usando algoritmos como SVM, precisamos projetar todos os nossos pontos de dados em um espaço multidimensional imaginário onde cada recurso será uma dimensão.


Vamos supor que temos um problema de classificação para prever se um aluno será aprovado ou reprovado no exame.


Temos as seguintes características como variáveis independentes:


  • Notas em exames internos
  • Marcas em projetos
  • porcentagem de atendimento


Então, essas 3 variáveis independentes tornam-se 3 dimensões de um espaço como este-

Fonte da imagem: Ilustrada pelo autor


Vamos considerar que nossos pontos de dados se parecem com isso onde-

  • A cor verde representa os alunos que passaram no exame

  • A cor vermelha representa os alunos que falharam no exame

    Fonte da imagem: Ilustrada pelo autor


    Agora, o SVM criará um hiperplano que percorre essas 3 dimensões para diferenciar os alunos reprovados dos aprovados.

    Fonte da imagem: Ilustrada pelo autor


Portanto, tecnicamente agora o modelo entende que todos os pontos de dados que caem em um lado do hiperplano pertencem aos alunos que passaram nos exames e vice-versa.


Em nosso exemplo, foi fácil criar o hiperplano porque um hiperplano linear e reto era suficiente para discriminar as 2 categorias. Mas em projetos complexos em tempo real, essas relações podem ser violadas em muitos cenários. Especialmente quando você tem centenas de variáveis independentes, não há possibilidade de obter uma relação linear entre os pontos de dados de forma que seja difícil criar um hiperplano ideal.


Nesses cenários, os pesquisadores geralmente aplicam a função de base radial a cada um dos pontos de dados para que possam passar um hiperplano linear pelos pontos de dados para resolver facilmente o problema.


Considere que nossos pontos de dados estão assim no espaço-

Fonte da imagem: Ilustrada pelo autor


É claro que não podemos usar um hiperplano linear de forma que ele possa agrupar os pontos de dados de acordo com suas classes.


O RBF nos ajudará nesses tipos de cenários.


Alguns pesquisadores geralmente projetam esses pontos de dados em dimensões muito maiores para que a distância entre os pontos de dados seja crescente para que possam aplicar alguma função (RBF ou qualquer outra função) para construir um hiperplano. Mas não é necessário construir dimensões altas, pois é sempre decisão do estatístico/pesquisador que entende os padrões dos dados.


Em seguida, temos que marcar um ponto imaginário no espaço como este onde precisarmos.

Fonte da imagem: Ilustrada pelo autor


Depois disso, precisamos desenhar alguns círculos concêntricos com base nesse ponto imaginário.


Fonte da imagem: Ilustrada pelo autor
A distância entre o centro e qualquer ponto de dados posicionado no limite do círculo é chamada de raio.
Fonte da imagem: Ilustrada pelo autor

Após calcular o raio, precisamos passar esse valor dentro de uma função matemática (RBF) que retornará um valor real. O valor retornado será a magnitude transformada de um determinado ponto de dados usado para procedimentos posteriores.


Tipos de funções de base radial

Existem vários tipos de funções de base radial. Cada um deles transformará o valor de entrada de uma maneira diferente. Alguns deles são-


Função de base radial multiquadrática


Fonte da imagem: Ilustrada pelo autor

Onde,

  • r é o raio
  • ε é uma constante


A função ficará assim em relação ao tempo,

Fonte da imagem: referência 1


Função de base radial multiquádrica inversa


Fonte da imagem: Ilustrada pelo autor

Onde,

  • r é o raio
  • ε é uma constante


Fonte da imagem: referência 1

Função de base radial gaussiana

Fonte da imagem: Ilustrada pelo autor Onde,

  • r é o raio
  • ε é uma constante


Fonte da imagem: referência 1


Vou explicar intuitivamente o que essas funções farão intuitivamente no espaço. Existem 2 processos diferentes que são feitos por essas funções-


  • Expandindo os pontos de dados na direção horizontal
  • Comprimindo os pontos de dados na direção vertical


O processo de expansão será visualmente mais ou menos assim-

Fonte da imagem: Ilustrada pelo autor


O processo de compactação será visualmente semelhante a este:

Fonte da imagem: Ilustrada pelo autor


Após a expansão e compactação, os pontos de dados teriam sido transformados assim-

Fonte da imagem: Ilustrada pelo autor


Agora, podemos facilmente construir um hiperplano linear que pode classificar os pontos de dados como este-
Fonte da imagem: Ilustrada pelo autor

O Conceito da Rede RBF

Às vezes, o RBF também é usado junto com redes neurais artificiais com uma camada oculta. Nesses tipos de redes, o RBF será usado como funções de ativação nas camadas ocultas. Além da camada oculta, haverá uma camada de entrada que contém vários neurônios onde cada um deles representa uma variável de característica e a camada de saída terá uma soma ponderada das saídas da camada oculta para formar as saídas da rede.


Fonte da imagem: Ilustrada pelo autor


Essas redes são chamadas de redes RBF.

Escopo e Vantagens do RBF

  • Com a ajuda da função RBF é possível resolver os problemas em conjuntos de dados que possuem distribuições não lineares complexas.
  • A função RBF tem uma forte tolerância ao ruído de entrada
  • Na rede neural RBF, haverá apenas uma camada oculta que é muito fácil de manusear.
  • Padrões ocultos na distribuição podem ser melhor generalizados após a aplicação da função RBF.
  • Na rede neural RBF, podemos facilmente interpretar qual é o significado/função de cada nó na camada oculta do RBNN. Isso é difícil na percepção multicamada.
  • Alguns dos hiperparâmetros presentes no perceptron multicamadas, como o número de nós na camada oculta, o número de camadas ocultas, etc., são difíceis de otimizar. Mas estes não são encontrados em redes neurais RBF.

Conclusão

Neste artigo, discutimos uma das funções de transformação mais úteis no aprendizado de máquina. Tentei explicar esse conceito complicado sem muitos cálculos matemáticos aprofundados de maneira lúcida, visando iniciantes no espaço de aprendizado AIML.


Essa função está disponível como uma biblioteca embutida na maioria das linguagens de programação orientadas para a ciência de dados, como Python ou R. Portanto, é fácil implementá-la depois que você entende a intuição teórica. Adicionei os links para alguns dos materiais avançados na seção de referências, onde você pode se aprofundar nos cálculos complexos, se estiver interessado.

Referências

  1. Funções de base radial - Wikipedia
  2. Redes de função de base radial Arquivado em 23/04/2014 na Wayback Machine
  3. Broomhead, David H.; Lowe, David (1988)."Interpolação Funcional Multivariável e Redes Adaptativas" (PDF). Sistemas Complexos . 2 : 321–355. Arquivado do original (PDF) em 2014-07-14.
  4. Michael JD Powell (1977). "Procedimentos de reinício para o método de gradiente conjugado". Programação Matemática . 12 (1): 241–254. doi : 10.1007/bf01593790 . S2CID 9500591 .
  5. Sahin, Ferat (1997). Uma abordagem de função de base radial para um problema de classificação de imagens coloridas em uma aplicação industrial em tempo real (M.Sc.). Tecnologia Virgínia . pág. 26. hdl : 10919/36847 . As funções de base radial foram introduzidas pela primeira vez por Powell para resolver o problema real de interpolação multivariada.