Questões de Concurso
Sobre data mining em banco de dados
Foram encontradas 568 questões
Considere que a SANASA busca realizar a gestão de recursos hídricos subterrâneos com base em parâmetros conhecidos que determinam a poluição das águas subterrâneas. Um desses parâmetros, para exemplificar, seria o nitrato, um indicador de poluição difusa de água subterrânea. Criando-se regras para realizar o aprendizado supervisionado do sistema de Data Mining utilizando-se uma certa técnica, chegar-se-á a um resultado que considera os diversos parâmetros para se descobrir se um certo aquífero tem água potável ou não, comparando-se com uma definição conhecida.
Nesse cenário, a técnica aplicada é denominada
Um Tribunal pretende analisar fatos (fatores ambientais e perfis profissionais, entre outros) que esclareçam por que alguns colaboradores se destacam profissionalmente enquanto outros não se desenvolvem e acabam por se desligar do órgão. Para facilitar essa análise, o Tribunal solicitou um auxílio tecnológico que indique quais características nos fatos apresentam razões positivas que justifiquem investimentos mais robustos no treinamento de colaboradores que tendem a se destacar a médio e longo prazos.
Para tanto, o Analista implantará um processo de análise científica preditiva com base em dados estruturados, que consiste na obtenção de padrões que expliquem e descrevam tendências futuras, denominado
Além dos indicadores reativos que, uma vez implantados, automaticamente detectam as ocorrências com base nos indicadores mapeados, existem também os controles proativos, que requerem que os gestores os promovam periodicamente. Uma das técnicas que os gestores podem usar requer que sejam selecionadas, exploradas e modeladas grandes quantidades de dados para revelar padrões, tendências e relações que podem ajudar a identificar casos de fraude e corrupção. Relações ocultas entre pessoas, entidades e eventos são identificadas e as relações suspeitas podem ser encaminhadas para apuração específica. As anomalias apontadas por esse tipo de técnica não necessariamente indicam a ocorrência de fraude e corrupção, mas eventos singulares que merecem avaliação individualizada para a exclusão da possibilidade de fraude e corrupção e, no caso da não exclusão, uma investigação.
(Adaptado de: TCU - Tribunal de Contas da União)
O texto se refere à técnica de
“A Secretaria da Fazenda realizou procedimento que visa estimular os contribuintes paulistas a, voluntariamente, regularizarem as obrigações tributárias que devem ser transmitidas ao Fisco. Em uma etapa da operação foram selecionados 48 contribuintes do Regime Periódico de Apuração com R$ 143 milhões em débitos de ICMS.
Esta ação tem caráter orientador, com o objetivo de alertar as empresas sobre divergências em suas declarações e indicar a regularização, porém, a ação pode resultar em indicações de empresas de fachada que apresentaram um conjunto de indícios que sugerem tratar-se de documentos fiscais inidôneos ou de simulação de operações para gerar créditos falsos de ICMS na apuração mensal do tributo a recolher.
Para a elaboração da operação autorregularização foram selecionados contribuintes com divergências nas notas fiscais emitidas entre janeiro a dezembro de 2016 em comparação com as informações declaradas nas Guias de Informação e Apuração do ICMS do mesmo período."
(Baseado em: https://portal.fazenda.sp.gov.br)
Ao ler esta notícia, uma Auditora Fiscal da área de TI concluiu, corretamente, que o cruzamento e a análise simultânea de diversas informações, como Nota Fiscal Eletrônica (NF-e), inadimplência, regularidade no cumprimento de obrigações, porte da empresa, composição do quadro societário, autos de infração anteriores, localização geográfica e atividade econômica, entre outras,
Castro e Ferrari (2016) mencionam que as funcionalidades da mineração de dados são utilizadas para especificar os tipos de informação a serem obtidos nas tarefas de mineração. Sobre esse tema, considere as seguintes funcionalidades:
1. Análise de grupos: tarefa supervisionada que separa um conjunto de objetos em grupos.
2. Classificação: tarefa supervisionada para predição de valores discretos.
3. Regressão (ou estimação): tarefa supervisionada para predição de valores contínuos.
4. Associação: tarefa que descobre relações entre atributos por meio da detecção de anomalias nos conjuntos de dados.
É/São funcionalidade(s) da etapa de mineração:
Seja então um atributo numérico A com n valores observados {v1 , v2 , ... , vn }, média
e desvio-padrão σA. Nesse contexto, a técnica de normalização de dados que gera
, dado um valor vi
ϵ A , é aUma das características desse algoritmo é a de
Uma nuvem de palavras é um recurso gráfico (usado principalmente na internet) para descrever os termos mais frequentes de um determinado texto. O tamanho da fonte em que a palavra é apresentada é uma função da frequência da palavra no texto: palavras mais frequentes são desenhadas em fontes de tamanho maior, palavras menos frequentes são desenhadas em fontes de tamanho menor.
Qual é a técnica de análise de dados descrita pelo texto acima?
Rafael aplicou um teste de múltipla escolha de cem questões para um numeroso grupo de alunos e notou que houve uma variada distribuição de notas.
Rafael resolveu trabalhar esses dados, e agrupar esses alunos de modo que cada um ficasse no grupo mais adequado para a sua nota. Assim, poderia preparar atividades específicas para cada grupo.
Assinale a opção que indica o algoritmo mais adequado para essa tarefa.
Julgue o item a seguir, a respeito de data mining e OLAP.
No data mining, uma regra de associação relaciona a presença
de um conjunto de itens com outra faixa de valores de um
outro conjunto de variáveis.
Atenção: Para responder à questão, considere o seguinte caso hipotético:
Um Auditor da Receita Estadual pretende descobrir, após denúncia, elementos que possam caracterizar e fundamentar a possível existência de fraudes, tipificadas como sonegação tributária, que vêm ocorrendo sistematicamente na arrecadação do ICMS. A denúncia é que, frequentemente, caminhões das empresas Org1, Org2 e Org3 não são adequadamente fiscalizados nos postos de fronteiras. Inobservâncias de procedimentos podem ser avaliadas pelo curto período de permanência dos caminhões dessas empresas na operação de pesagem, em relação ao período médio registrado para demais caminhões.
Para caracterizar e fundamentar a existência de possíveis fraudes, o Auditor deverá coletar os registros diários dos postos por, pelo menos, 1 ano e elaborar demonstrativos para análises mensais, trimestrais e anuais.