Sobre a função de ativação de redes neurais, é CORRETO afirm...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é: D - é uma função que transforma a saída de um neurônio em um novo valor.
Tema Central da Questão: A questão aborda um conceito fundamental em redes neurais: as funções de ativação. Estas funções são cruciais no processamento de dados e no aprendizado de máquinas, pois definem a forma como o neurônio processa sua entrada para gerar uma saída. Elas introduzem a não-linearidade necessária para que a rede possa aprender padrões complexos.
Resumo Teórico: Em redes neurais, a função de ativação é aplicada à saída de cada neurônio, transformando a soma ponderada das entradas em um valor útil para a próxima camada. Sem essas funções, as redes não conseguiriam modelar relações complexas, pois se comportariam como um modelo linear. Exemplos comuns de funções de ativação incluem ReLU (Rectified Linear Unit), Sigmoid, e tanh.
Justificativa da Alternativa Correta (D): A alternativa D é correta porque descreve precisamente o papel da função de ativação: transformar a saída linear do neurônio em um novo valor que pode ser utilizado para a entrada da próxima camada. Esta transformação é essencial para introduzir não-linearidade na rede.
Análise das Alternativas Incorretas:
A - Step, ReLU, Adam, Sigmoid, tanh e sigmoid são exemplos de funções de ativação. - Esta alternativa está incorreta porque Adam não é uma função de ativação; ele é um algoritmo de otimização.
B - é recomendável aplicar funções diferentes a cada neurônio da camada. - Embora algumas arquiteturas avançadas possam usar diferentes funções de ativação, em geral, a mesma função de ativação é aplicada a todos os neurônios de uma camada para manter a consistência e simplicidade.
C - é sempre linear, ou seja, pode ser descrita em termos de adições e multiplicações. - Esta afirmação é incorreta. A função de ativação, na maioria dos casos, é não-linear, o que é essencial para que a rede neural possa capturar relações complexas nos dados.
E - é recomendável usar a função sigmoid em camadas ocultas. - Embora a função sigmoid tenha sido popular no passado, atualmente ela é menos usada em camadas ocultas devido ao problema do desvanecimento do gradiente. Funções como ReLU são preferidas por seu desempenho superior em redes profundas.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
✅ D) é uma função que transforma a saída de um neurônio em um novo valor.
Justificativa: A função de ativação recebe o sinal de entrada (combinação linear dos inputs e pesos) e produz uma saída não linear (na maioria dos casos), permitindo que a rede aprenda relações complexas. Ela "ativa" ou não o neurônio com base em um limiar, introduzindo não linearidade.
❌ A) Step, ReLU, Adam, Sigmoid, tanh e sigmoid são exemplos de funções de ativação.
Erro: "Adam" não é uma função de ativação, mas um otimizador (algoritmo de atualização de pesos). Step, ReLU, Sigmoid e tanh são de fato funções de ativação, mas a presença de "Adam" invalida a alternativa.
❌ B) é recomendável aplicar funções diferentes a cada neurônio da camada.
Erro: Em geral, usa-se a mesma função de ativação para todos os neurônios de uma mesma camada para manter consistência e facilitar o treinamento. Aplicar funções diferentes aleatoriamente pode levar a instabilidade e dificuldades de convergência.
❌ C) é sempre linear, ou seja, pode ser descrita em termos de adições e multiplicações.
Erro: Se todas as funções de ativação fossem lineares, a rede neural como um todo seria equivalente a um modelo linear (uma combinação linear das entradas), perdendo a capacidade de aprender padrões não lineares. Funções como ReLU, Sigmoid e tanh são não lineares.
❌ E) é recomendável usar a função sigmoid em camadas ocultas.
Erro: A função sigmoid sofre com o problema de "vanishing gradient" (gradiente desaparecente) em redes profundas, o que dificulta o treinamento. Em camadas ocultas, funções como ReLU ou suas variantes (Leaky ReLU, ELU) são preferidas por serem mais eficientes e estáveis.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo