O caso Panama Papers é um dos episódios mais marcantes do jo...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa Correta: A - Processamento de linguagem natural.
Tema Central: A questão aborda o uso de tecnologias para a análise de grandes volumes de dados textuais, como no caso dos Panama Papers. Este tema é relevante para o cargo de Tecnologista, já que envolve o entendimento e a aplicação de ferramentas computacionais avançadas para manipulação e análise de dados.
Resumo Teórico: O Processamento de Linguagem Natural (PLN) é uma subárea da inteligência artificial que lida com a interação entre computadores e linguagens humanas. O objetivo é permitir que máquinas leiam, interpretem e extraiam informações de textos em linguagem natural. Com o crescente volume de dados digitais, o PLN se tornou essencial para a análise de grandes corpora textuais, como no caso do Panama Papers.
Justificativa da Alternativa Correta: A alternativa A é correta porque o processamento de linguagem natural é crucial para lidar com grandes volumes de dados textuais, como os 11,5 milhões de documentos mencionados. O PLN permite automatizar a tarefa de extração de informações relevantes de textos complexos, facilitando o trabalho de jornalistas e tecnologistas na investigação de dados. Segundo Jurafsky & Martin (2021), o PLN é amplamente utilizado em jornalismo de dados para extrair e analisar informações textuais de maneira eficaz.
Análise das Alternativas Incorretas:
B - Raspagem cruzada: Esta alternativa está incorreta porque o termo "raspagem cruzada" não é uma técnica reconhecida. A raspagem de dados (ou web scraping) é uma técnica para extrair dados de websites, mas ela não lida diretamente com o processamento linguístico de textos.
C - Mineração CSV: Esta alternativa também é errada. A mineração de dados pode envolver o uso de arquivos CSV (Comma-Separated Values) para estruturar dados tabulares, mas não trata do processamento de grandes volumes de texto e linguagem natural.
D - Checagem em duas etapas: Este não é um método específico de análise de dados textuais em grande escala. A checagem em duas etapas pode ser um processo em segurança da informação para verificar autenticação, mas não se aplica diretamente ao contexto de análise textual dos Panama Papers.
E - PyTesseract: O PyTesseract é uma ferramenta OCR (Reconhecimento Óptico de Caracteres) usada para extrair texto de imagens. Embora útil em contextos onde os dados textuais estão em formato de imagem, não é apropriada para processar grandes volumes de dados textuais pré-existentes, como no caso em questão.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo