Um órgão de controle estuda implantar uma plataforma avançad...

Próximas questões
Com base no mesmo assunto
Q3874752 Engenharia de Software
Um órgão de controle estuda implantar uma plataforma avançada baseada em grandes modelos de linguagem para apoiar a análise de documentos, a consulta a bases normativas e a execução de fluxos complexos (por exemplo, checagem automática em diários oficiais, sistemas internos e bases abertas). A arquitetura em estudo combina LLMs, geração aumentada por recuperação (RAG), agentes de IA com uso de ferramentas externas e mecanismos de monitoramento para riscos éticos e de segurança.
Com base em conceitos de transformers e LLMs, RAG, agentificação, engenharia de prompts, bem como ética e segurança em IA, analise as afirmativas a seguir.

I. Em uma arquitetura com RAG, o LLM é utilizado principalmente como gerador condicionado a evidências: os documentos relevantes são buscados por similaridade de embeddings em um índice vetorial e incorporados ao contexto de entrada, de modo que decisões sobre fragmentação (tamanho dos trechos, sobreposição, estratégia de indexação) influenciam diretamente tanto a recuperação quanto a qualidade e a fundamentação das respostas.
II. Em arquiteturas que combinam LLMs com RAG, o risco de exposição indevida de dados sensíveis tende a ser intrinsecamente menor do que no uso direto de LLMs, porque os documentos sigilosos não precisam ser indexados: o modelo passa a depender principalmente de representações paramétricas já aprendidas no pré-treinamento, reduzindo a necessidade de controles específicos sobre o ciclo de vida dos dados no índice vetorial.
III. Técnicas de alinhamento com preferências humanas, como Reinforcement Learning e variantes de preference optimization, são frequentemente combinadas com boas práticas de engenharia de prompts (zero-shot, few-shot, encadeamento de pensamento) e com avaliações sistemáticas de prompts e saídas, pois, mesmo após o alinhamento, permanecem desafios como viés algorítmico, suscetibilidade a jailbreaks e prompt injection, exigindo camadas adicionais de governança, monitoramento e auditoria.

Está correto o que se afirma em: 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: C

Fundamento decisivo: O ponto decisivo era a afirmativa II: ela contraria o funcionamento do RAG ao dizer que documentos sigilosos não precisam ser indexados e que o modelo depende principalmente do pré-treinamento. Isso a torna incorreta e conduz ao gabarito C.

Tema central: RAG e governança em LLMs
Análise das alternativas
A
Errada
Incorreta porque exclui a afirmativa III. A III está correta ao reconhecer que alinhamento não basta, por si só, para resolver problemas de segurança e ética, permanecendo necessárias camadas adicionais de avaliação, monitoramento e auditoria.
B
Errada
Incorreta porque inclui a afirmativa II. O erro da II é afirmar que, com RAG, documentos sigilosos não precisam ser indexados e que o modelo passa a depender principalmente do conhecimento paramétrico do pré-treinamento; isso contraria a finalidade do RAG, que justamente recupera conhecimento externo e, se esse conhecimento for sensível, exige controles específicos no índice vetorial e no contexto fornecido ao modelo.
C
Certa
A alternativa C está certa porque reúne exatamente as afirmativas I e III. A I descreve corretamente o RAG como geração condicionada a evidências recuperadas, com busca por similaridade em representações indexadas e incorporação dos trechos ao contexto; por isso, decisões de fragmentação, sobreposição e indexação afetam diretamente a recuperação e a qualidade da resposta. A III também está correta porque técnicas de alinhamento com preferências humanas, como reinforcement learning e variantes de preference optimization, melhoram o comportamento do modelo, mas não eliminam riscos como viés, jailbreaks e prompt injection, o que mantém necessária a avaliação de prompts e saídas, além de governança, monitoramento e auditoria.
D
Errada
Incorreta porque comete dois erros ao mesmo tempo: inclui a II, que é falsa, e exclui a I, que é verdadeira. A I está correta ao apontar que chunking, overlap e estratégia de indexação influenciam a recuperação e a fundamentação das respostas em RAG.
E
Errada
Incorreta porque inclui a afirmativa II. Basta a presença dessa afirmativa falsa para invalidar a alternativa.
Pegadinha da questão
A confusão explorada foi tratar RAG como se ele reduzisse intrinsecamente o risco de dados sensíveis por substituir a consulta documental por conhecimento paramétrico do pré-treinamento. Outra armadilha real foi supor que alinhamento resolve sozinho segurança e ética, dispensando governança adicional.
Dica para questões semelhantes
  • Em questões sobre RAG, verifique se a afirmação respeita a ideia central de recuperação externa de documentos indexados; se negar essa dependência, tende a estar errada.
  • Se a base consultada pode conter dados sigilosos, não presuma menor risco só porque há embeddings ou índice vetorial; o ponto técnico é a necessidade de controles sobre ciclo de vida, recuperação e exposição.
  • Quando o enunciado falar de alinhamento de LLMs, não trate isso como solução completa; confira se a afirmação preserva a necessidade de monitoramento, auditoria e mitigação adicional.
  • Em RAG, qualidade de resposta não se analisa só pelo modelo: chunk size, overlap e estratégia de indexação são variáveis decisivas da recuperação.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo