O caso Panama Papers é um dos episódios mais marcantes do jo...

Próximas questões
Com base no mesmo assunto
Q3332242 Jornalismo
O caso Panama Papers é um dos episódios mais marcantes do jornalismo recente. Um consórcio formado por profissionais de diferentes países analisou 11,5 milhões de documentos de um escritório panamenho de advocacia. Com isso, expôs empresas offshore de centenas de milhares de pessoas. Para o trabalho de investigação em bases de dados com um volume tão grande de texto, é possível recorrer a recursos de:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa Correta: A - Processamento de linguagem natural.

Tema Central: A questão aborda o uso de tecnologias para a análise de grandes volumes de dados textuais, como no caso dos Panama Papers. Este tema é relevante para o cargo de Tecnologista, já que envolve o entendimento e a aplicação de ferramentas computacionais avançadas para manipulação e análise de dados.

Resumo Teórico: O Processamento de Linguagem Natural (PLN) é uma subárea da inteligência artificial que lida com a interação entre computadores e linguagens humanas. O objetivo é permitir que máquinas leiam, interpretem e extraiam informações de textos em linguagem natural. Com o crescente volume de dados digitais, o PLN se tornou essencial para a análise de grandes corpora textuais, como no caso do Panama Papers.

Justificativa da Alternativa Correta: A alternativa A é correta porque o processamento de linguagem natural é crucial para lidar com grandes volumes de dados textuais, como os 11,5 milhões de documentos mencionados. O PLN permite automatizar a tarefa de extração de informações relevantes de textos complexos, facilitando o trabalho de jornalistas e tecnologistas na investigação de dados. Segundo Jurafsky & Martin (2021), o PLN é amplamente utilizado em jornalismo de dados para extrair e analisar informações textuais de maneira eficaz.

Análise das Alternativas Incorretas:

B - Raspagem cruzada: Esta alternativa está incorreta porque o termo "raspagem cruzada" não é uma técnica reconhecida. A raspagem de dados (ou web scraping) é uma técnica para extrair dados de websites, mas ela não lida diretamente com o processamento linguístico de textos.

C - Mineração CSV: Esta alternativa também é errada. A mineração de dados pode envolver o uso de arquivos CSV (Comma-Separated Values) para estruturar dados tabulares, mas não trata do processamento de grandes volumes de texto e linguagem natural.

D - Checagem em duas etapas: Este não é um método específico de análise de dados textuais em grande escala. A checagem em duas etapas pode ser um processo em segurança da informação para verificar autenticação, mas não se aplica diretamente ao contexto de análise textual dos Panama Papers.

E - PyTesseract: O PyTesseract é uma ferramenta OCR (Reconhecimento Óptico de Caracteres) usada para extrair texto de imagens. Embora útil em contextos onde os dados textuais estão em formato de imagem, não é apropriada para processar grandes volumes de dados textuais pré-existentes, como no caso em questão.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo