Questões de Concurso Comentadas sobre data mining em banco de dados

Foram encontradas 523 questões

Q4013973 Banco de Dados
No ciclo de vida CRISP-DM (Cross-Industry Standard Process for Data Mining), usado em Ciência de Dados, qual etapa trata da limpeza, tratamento e formatação dos dados:
Alternativas
Q4013972 Banco de Dados
A ciência de dados utiliza métodos e técnicas com o objetivo de extrair conhecimento e insights a partir de grandes volumes de dados. A análise de dados inicia-se com uma pergunta que pode ser classificada em diversos tipos. O tipo de pergunta que busca identificar se existem padrões, tendências ou relacionamentos em um conjunto de dados, sem a necessidade de uma hipótese prévia, é classificada como:
Alternativas
Q4009191 Banco de Dados
No contexto da Ciência de Dados, o conceito que está diretamente relacionado ao estabelecimento de políticas, processos, papéis e responsabilidades para garantir qualidade, segurança, conformidade e uso adequado dos dados ao longo de seu ciclo de vida é 
Alternativas
Q3968381 Banco de Dados
No processo de descoberta de conhecimento (KDD), a etapa de mineração de dados se caracteriza por
Alternativas
Q3956761 Banco de Dados
No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados (como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de
Alternativas
Q3951157 Banco de Dados
Ao executar o algoritmo Apriori, as seguintes regras associativas foram determinadas como relevantes:

{café, açúcar} => {leite} e {açúcar, trigo} => {leite}.

Considerando essas duas regras associativas relevantes, é verdade que
Alternativas
Q3880237 Banco de Dados
Matheus foi empossado recentemente pela ALEGO como analista e está se aprofundando nos estudos das redes neurais (RN). Ele sabe que as RN podem ter diversas formas de aprendizagem não supervisionada.

O tipo de aprendizado onde os neurônios de saída da rede disputam entre si para se tornarem ativos e somente um neurônio de saída é ativado em determinado instante se denomina:
Alternativas
Q3865193 Banco de Dados
O processo de KDD (Knowledge Discovery in Databases) é fundamental na mineração de dados e envolve etapas bem definidas.
Baseando-se nessas informações, pode-se concluir que a etapa do KDD responsável pela limpeza, seleção e transformação dos dados antes da aplicação dos algoritmos é denominada:
Alternativas
Q3856600 Banco de Dados
Assinale a opção correta acerca do modelo LDA (latent dirichlet allocation), amplamente utilizado para extração de tópicos em tarefas de mineração de textos.
Alternativas
Q3841867 Banco de Dados
Atualmente, as empresas têm executado um processo administrativo, denominado gestão de dados, que consiste em recolher, organizar, proteger e usar informações, com o objetivo de utilizar os dados para melhorar a eficiência, a produtividade e a tomada de decisões. Nesse contexto, um termo, que tem por significado a mineração de dados, consiste no uso de processos para explorar grandes quantidades de dados digitais à procura de padrões consistentes, como regras de associação ou sequências temporais, visando descobrir relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. Paralelamente, outro termo, traduzido como armazém de dados, é, basicamente, um depósito de dados digitais para armazenar informações corporativas detalhadas.
Esses dois termos são conhecidos, respectivamente, como:
Alternativas
Q3756313 Banco de Dados
Texto para as questão. 


    O conhecimento tem sido reconhecido como um dos mais importantes recursos de uma organização, que torna possíveis ações inteligentes nos planos organizacional e individual e leva a inovações e à capacidade de continuamente criar produtos e serviços excelentes. O processo de gestão do conhecimento abrange toda a forma de gerar, armazenar, distribuir e utilizar o conhecimento, de modo que se torna necessária a utilização de tecnologias de informação para facilitar esse processo, dado o grande aumento no volume de dados.

    Ao longo do tempo, percebeu‑se que a velocidade de coleta de informações era muito maior que a velocidade de processamento ou de análise dessas informações. Isso gerou um problema e uma contradição, pois as organizações, por possuírem uma grande quantidade de dados, possuem uma falsa sensação de que estão bem‑informadas, no entanto essas informações de nada servem se não forem analisadas de forma correta e em tempo hábil.

    Em outras palavras, a coleta e o armazenamento de dados, por si sós, não contribuem para melhorar a estratégia da organização. É necessário que sejam feitas análises sobre essa grande quantidade de dados, estabelecendo‑se indicadores para descobrir padrões de comportamento implícitos nos dados, além de relações de causa e efeito. O processamento e a análise das informações geradas pelas enormes bases de dados atuais de forma correta estão entre os requisitos essenciais para uma boa tomada de decisão.

    Em um ambiente tão mutável como o das organizações, na atualidade, torna‑se necessária a aplicação de técnicas e ferramentas automáticas que agilizem o processo de extração de informações relevantes de grandes volumes de dados. Uma metodologia emergente, que tenta solucionar o problema da análise de grandes quantidades de dados e ultrapassa a habilidade e a capacidade humanas, é a descoberta de conhecimento em banco de dados.

    Data mining, ou mineração de dados, é uma técnica que faz parte de uma das etapas da descoberta de conhecimento em banco de dados. Ela é capaz de revelar, automaticamente, o conhecimento que está implícito em grandes quantidades de informações armazenadas nos bancos de dados de uma organização. Essa técnica pode fazer, entre outras atividades, uma análise antecipada dos eventos, prevendo tendências e comportamentos futuros e permitindo aos gestores a tomada de decisões com base em fatos, em vez de em suposições.


Internet:  <scielo.br> (com adaptações).
Segundo o texto, a técnica de mineração de dados
Alternativas
Q3729820 Banco de Dados
Há múltiplas maneiras de criar sistemas de recomendação. Uma das maneiras, baseada em mineração de dados, é identificar quais itens costumam ocorrer em conjunto e posteriormente programá-las no sistema. Tal problema é solucionado por algoritmos de associação que podem gerar regras ao estilo setA→setB (leia-se, conjunto A implica conjunto B), em que diversas métricas podem ser obtidas para validar a força da regra.
Assinale a alternativa que, respectivamente, corresponde a um algoritmo de associação e a uma métrica usada para validar a regra.
Alternativas
Q3660448 Banco de Dados
Um analista de dados da AgSUS sabe que a detecção de anomalias, ou detecção de valores discrepantes, é a identificação de uma observação, evento ou ponto de dados que se desvia do que é padrão ou esperado, tornando-o inconsistente em relação ao resto do conjunto de dados. Relacione os tipos de anomalias de dados às suas respectivas definições.

1. Anomalias não intencionais.
2. Anomalias pontuais.
3. Anomalias contextuais.
4. Anomalias coletivas.

( ) Essas anomalias, também conhecidas como valores discrepantes globais, são pontos de dados individuais que estão muito fora do restante do conjunto de dados. Um exemplo desses tipo anomalia é um saque de conta bancária que é significativamente maior do que qualquer um dos saques anteriores do usuário;
( ) Essas anomalias envolvem um conjunto de instâncias de dados que juntas se desviam da norma, mesmo que as instâncias individuais possam parecer normais. Um exemplo desse tipo de anomalia seria um conjunto de dados de tráfego de rede que mostra um aumento repentino no tráfego de vários endereços IP ao mesmo tempo;
( ) Essas anomalias são pontos de dados que se desviam da norma devido a erros ou ruído no processo de coleta de dados. Esses erros podem ser sistemáticos ou aleatórios, originados por problemas como sensores defeituosos ou erro humano durante a entrada de dados. Esse tipo de anomalia pode distorcer o conjunto de dados, dificultando a obtenção de insights precisos;
( ) Essas anomalias são pontos de dados que se desviam da norma dentro de um contexto específico. Essas anomalias não são necessariamente valores discrepantes quando consideradas isoladamente, mas se tornam anômalas quando vistas dentro de seu contexto específico. Por exemplo, considere o uso de energia. Se houver um aumento repentino no consumo de energia ao meio-dia, quando normalmente nenhum membro da família está em casa. Este dado pode não ser um valor discrepante quando comparado ao consumo de energia pela manhã ou à noite (quando as pessoas geralmente estão em casa), mas é anômalo em relação ao horário em que ocorreu.

A relação correta, na ordem dada, é: 
Alternativas
Q3595755 Banco de Dados
Durante a preparação de um conjunto de dados para análise preditiva de inadimplência, um cientista de dados identificou diversos problemas de qualidade nos dados, incluindo:

• campos numéricos com valores negativos que não fazem sentido (como "idade" ou "renda");
• colunas categóricas com múltiplas grafias para a mesma categoria (ex: "PE", "pe", "Pernambuco");
• presença de valores nulos em campos-chave como “renda” e “número de dependentes”;
• valores repetidos na chave primária “ID cliente”.

Com base nas dimensões de qualidade de dados e nas boas práticas de tratamento com Python - especialmente usando Pandas -, é correto afirmar que a: 
Alternativas
Q3594430 Banco de Dados
A mineração de dados é um dos principais componentes do processo de descoberta de conhecimento em bases de dados (KDD - Knowledge Discovery in Databases). Seu objetivo é extrair padrões relevantes, previamente desconhecidos, e potencialmente úteis a partir de grandes volumes de dados.
Sobre a mineração de dados, assinale a afirmativa correta.
Alternativas
Q3593196 Banco de Dados
A Mineração de Dados é a etapa do processo de KDD (Knowledge Discovery in Databases) responsável por extrair modelos de conhecimento a partir dos dados disponíveis. Após a construção desses modelos, é fundamental avaliar sua qualidade, o que exige compará-los com dados específicos para mensurar métricas que reflitam seu desempenho. Para garantir uma avaliação imparcial, os dados utilizados na criação do modelo não devem ser os mesmos empregados em sua validação. Assim, o processo de KDD deve utilizar, no mínimo, dois conjuntos distintos de dados: um conjunto de treinamento, para gerar o modelo, e um conjunto de testes, para avaliá-lo.
Selecione a opção que identifica o método de particionamento de dados em que o “conjunto de treinamento” é gerado por N sorteios aleatórios com reposição a partir do conjunto de dados original (que contém N registros). Já o “conjunto de testes” é composto pelos registros não selecionados para o “conjunto de treinamento”.
Alternativas
Q3530279 Banco de Dados

Julgue o item subsequente, relativos à teoria da informação e a banco de dados.  


A mineração de dados é uma técnica em que se utilizam exclusivamente algoritmos de aprendizado supervisionado para a identificação de padrões em grandes volumes de dados; no contexto de Big Data, a premissa principal é a utilização de bancos de dados relacionais tradicionais, que são suficientes para o enfrentamento dos desafios de volume, variedade e velocidade característicos desse ambiente. 


Alternativas
Q3530064 Banco de Dados

Acerca de segurança da informação, bancos de dados e aprendizado de máquina, julgue o próximo item. 


A técnica de clustering em data mining atribui categorias aos grupos de dados para facilitar a análise e a tomada de decisão. 

Alternativas
Q3472935 Banco de Dados
Um analista judiciário especialista em tecnologia da informação do TRE-TO está atuando em uma demanda para mais implementações de IA nas operações do tribunal. Os objetivos dessa tarefa são oferecer soluções mais práticas e simplificar e automatizar atividades rotineiras, fazendo com que a IA atue como uma aliada na tomada de decisões. Considerando essa situação, a partir do uso do Banco de Dados Oracle 21C, qual ferramenta o analista pode utilizar para simplificar o desenvolvimento de modelos de machine learning preditivos, auxiliando a escolha do modelo, a seleção de atributos a serem utilizados e os ajustes dos parâmetros necessários para a criação de modelos cada vez mais precisos? 
Alternativas
Q3409309 Banco de Dados
Acerca de deep learning, de Big Data e de redes neurais, julgue o item subsequente.
Em uma rede neural artificial, a função de ativação é responsável por armazenar os pesos de cada conexão entre os neurônios para posterior retropropagação.
Alternativas
Respostas
1: C
2: B
3: A
4: D
5: B
6: A
7: C
8: D
9: A
10: A
11: A
12: B
13: B
14: A
15: C
16: B
17: E
18: E
19: A
20: E