Um órgão de controle estuda implantar uma plataforma avançad...
Com base em conceitos de transformers e LLMs, RAG, agentificação, engenharia de prompts, bem como ética e segurança em IA, analise as afirmativas a seguir.
I. Em uma arquitetura com RAG, o LLM é utilizado principalmente como gerador condicionado a evidências: os documentos relevantes são buscados por similaridade de embeddings em um índice vetorial e incorporados ao contexto de entrada, de modo que decisões sobre fragmentação (tamanho dos trechos, sobreposição, estratégia de indexação) influenciam diretamente tanto a recuperação quanto a qualidade e a fundamentação das respostas.
II. Em arquiteturas que combinam LLMs com RAG, o risco de exposição indevida de dados sensíveis tende a ser intrinsecamente menor do que no uso direto de LLMs, porque os documentos sigilosos não precisam ser indexados: o modelo passa a depender principalmente de representações paramétricas já aprendidas no pré-treinamento, reduzindo a necessidade de controles específicos sobre o ciclo de vida dos dados no índice vetorial.
III. Técnicas de alinhamento com preferências humanas, como Reinforcement Learning e variantes de preference optimization, são frequentemente combinadas com boas práticas de engenharia de prompts (zero-shot, few-shot, encadeamento de pensamento) e com avaliações sistemáticas de prompts e saídas, pois, mesmo após o alinhamento, permanecem desafios como viés algorítmico, suscetibilidade a jailbreaks e prompt injection, exigindo camadas adicionais de governança, monitoramento e auditoria.
Está correto o que se afirma em:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: C
Fundamento decisivo: O ponto decisivo era a afirmativa II: ela contraria o funcionamento do RAG ao dizer que documentos sigilosos não precisam ser indexados e que o modelo depende principalmente do pré-treinamento. Isso a torna incorreta e conduz ao gabarito C.
- Em questões sobre RAG, verifique se a afirmação respeita a ideia central de recuperação externa de documentos indexados; se negar essa dependência, tende a estar errada.
- Se a base consultada pode conter dados sigilosos, não presuma menor risco só porque há embeddings ou índice vetorial; o ponto técnico é a necessidade de controles sobre ciclo de vida, recuperação e exposição.
- Quando o enunciado falar de alinhamento de LLMs, não trate isso como solução completa; confira se a afirmação preserva a necessidade de monitoramento, auditoria e mitigação adicional.
- Em RAG, qualidade de resposta não se analisa só pelo modelo: chunk size, overlap e estratégia de indexação são variáveis decisivas da recuperação.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo