Considere-se a aplicação de um modelo grande de linguagem
(LLM) com 3 bilhões de parâmetros, distribuído em formato não
quantizado, meia-precisão.
A quantidade mínima de memória necessária para carregar os
pesos do modelo para inferência (sem gradientes), considerando
apenas o espaço ocupado pelos pesos, é:
Incorreta. Gabarito oficial da banca:
Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X
teste
Parabéns! Você acertou!
Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X