No treinamento de grandes modelos de linguagem (LLMs), como
o GPT-4, uma técnica importante, utilizada para estabilizar o
treinamento e favorecer a convergência - especialmente ao lidar
com camadas profundas -, é a normalização por camada,
conhecida como Layer Normalization, que consiste em:
Incorreta. Gabarito oficial da banca:
Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência
teste
Parabéns! Você acertou!
Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência