Questões de Concurso Sobre data mining em banco de dados

Foram encontradas 568 questões

Q2078034 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O entendimento do negócio é a fase do ciclo do CRISP-DM que exige mais tempo em mineração de dados, pois estima-se que essa etapa, geralmente, leve entre 50 e 70% do tempo e do esforço de um projeto. 

Alternativas
Q2078033 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

Modelagem e avaliação são algumas das fases do ciclo do CRISP-DM. 

Alternativas
Q2078032 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

A única desvantagem que impede o uso em larga escala do CRISP-DM é o seu alto custo, uma vez que os usuários somente podem utilizá-lo após a aquisição da licença. 

Alternativas
Q2078031 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O CRISP-DM é uma metodologia abrangente de mineração de dados e um modelo de processo que fornece, para os usuários de data mining (DM), um modelo completo para a realização de um projeto de DM. 

Alternativas
Q2066826 Banco de Dados
Sobre detecção de anomalias, analise as afirmativas a seguir.
I. São exemplos de detecção de anomalias: detecção de fraude, detecção de intrusão, monitoramento de sistemas de saúde, qualidade de um produto. II. São métodos que conseguem lidar com detecção de anomalias: algoritmos baseados em densidade, análise de agrupamento, redes neurais recorrentes, redes bayesianas e modelos de Markov escondidos. III. A distribuição normal é a distribuição mais comum dos dados considerados dentro de uma normalidade, porém, podemos obter normalidade também por meio de outros tipos de distribuição como a distribuição de Bernoulli, distribuição uniforme, distribuição binomial e distribuição de Minkowski. IV. A métrica de avaliação desses métodos pode ajudar na identificação de dados fora do padrão. Portanto, as métricas de precisão, sensibilidade e medida-F1 são exemplos de métricas utilizadas para detecção de anomalias.
Está correto o que se afirma em
Alternativas
Q3997128 Banco de Dados
A Mineração de Dados é comumente classificada pela sua capacidade em realizar determinadas tarefas. Qual das tarefas abaixo descreve a natureza de ocorrências futuras, de certos eventos, com base nos acontecimentos passados? 
Alternativas
Q3997127 Banco de Dados
A Mineração de Dados requer uma adequação prévia dos dados por meio de técnicas de pré-processamento. Algumas técnicas estão listadas abaixo:

(A) Agregação.
(B) Amostragem.
(C) Redução de Dimensionalidade.
(D) Discretização e Binarização.

Relacione os itens acima com os seus respectivos conceitos:

(1) É a técnica que diminui o número de atributos de um conjunto de dados, criando novos atributos que sejam uma combinação dos atributos antigos.
(2) É a combinação de dois ou mais objetos em um único.
(3) É comumente usada para selecionar um subconjunto dos objetos de dados a serem analisados.
(4) É aquela que transforma um atributo contínuo em um categorizado e transforma, tanto os atributos contínuos quanto os discretos, em um ou mais atributos binários.


Entre as alternativas abaixo, qual é a que apresenta a relação da técnica com o seu conceito de forma CORRETA?
Alternativas
Q3997105 Banco de Dados
Podem haver vários tipos de análises, em grandes ambientes, de Data Warehouse. Para além de consultas em SQL, é possível ter operações analíticas mais avançadas sobre os dados. Dois dos principais tipos de análise de dados são OLAP (On-Line Analytic Processing) e Data Mining. Escolha a alternativa CORRETA sobre Data Mining e OLAP.
Alternativas
Q3976958 Banco de Dados
Quando se inicia os trabalhos de aprendizado em bases de dados é comum identificar problemas na base de dados. Por isso, na etapa de pré- -processamento, os dados passam por recursos de limpeza, integração de bases de dados, redução na quantidade de atributos ou dados, transformação nos formatos dos dados ou discretização de alguns. Considerando esses recursos, indique a alternativa incorreta que os define.
Alternativas
Q2501776 Banco de Dados
Na mineração de texto, o processo utilizado para remover os prefixos e sufixos de palavras, de modo a permanecer somente a raiz delas, com a finalidade de melhorar o armazenamento, é conhecido como
Alternativas
Q2339721 Banco de Dados
A árvore de decisão é uma técnica utilizada em mineração de dados cuja abordagem para a criação de regras para utilização nos próximos eventos é a 
Alternativas
Q2023608 Banco de Dados

A respeito de business intelligence, julgue o próximo item.


Em data mining, a técnica de associação é baseada na probabilidade condicional, a qual avalia determinados valores que aparecem juntos nos mesmo eventos.  

Alternativas
Q2005974 Banco de Dados
Nas questões que avaliem conhecimentos de informática, a menos que seja explicitamente informado o contrário, considere que: todos os programas mencionados estejam em configuração-padrão, em português; o mouse esteja configurado para pessoas destras; expressões como clicarclique simples e clique duplo refiram-se a cliques com o botão esquerdo do mouse; e teclar corresponda à operação de pressionar uma tecla e, rapidamente, liberá-la, acionando-a apenas uma vez. Considere também que não haja restrições de proteção, de funcionamento e de uso em relação aos programas, arquivos, diretórios, recursos e equipamentos mencionados. 

No DataMining, a função de pré-processamento que consiste em conseguir, de alguma forma, mais informação que possa ser agregada aos registros existentes, para que estes forneçam mais informações para o processo de descoberta de conhecimento, é o(a) 
Alternativas
Q1993175 Banco de Dados
No contexto da implementação de tecnologias para data mining e apresentação de dados, a sigla ETL refere-se 
Alternativas
Q1985594 Banco de Dados
Em muitos problemas reais, os dados contêm classes majoritárias e minoritárias. Por exemplo, ao se analisar dados sobre fraudes em bancos, é mais provável que os conjuntos de dados contenham poucos dados de fraude e muitos de não fraude. Ao dividir o conjunto de dados em conjunto de treinamento e conjunto de teste para avaliar um modelo de classificação, qual técnica garante que o conjunto de teste tenha elementos da classe minoritária?
Alternativas
Q1970474 Banco de Dados
Considere que o Tribunal Regional do Trabalho utiliza o modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining). Em um certo momento, uma equipe de Analistas está discutindo as seguintes questões relativas a um projeto:
− Qual formato de data será utilizado: dd/mm/aaaa ou mm/dd/aaaa?
− Os dados advindos das diversas fontes, relativos a um mesmo conteúdo, são compatíveis entre si?
− Os campos binários serão formatados com True e False ou terão que ser convertidos para 1 e 0?
− Após as análises descritivas, a média, a mediana, a moda e a quantidade dos dados estão de acordo com as categorias definidas?
Com base nas questões apresentadas, a equipe está trabalhando na etapa do CRISP-DM denominada
Alternativas
Q1966257 Banco de Dados
Leia o fragmento a seguir.
“A tarefa de detecção de anomalias é um caso particular de problema de _____, onde a quantidade de objetos da classe alvo (anomalia) é muito inferior à quantidade de objetos da classe normal e, adicionalmente, o custo da não detecção de uma anomalia (_____) é normalmente muito maior do que identificar um objeto normal como uma anomalia (_____)”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada. 
Alternativas
Q1966256 Banco de Dados
Com relação ao algoritmo de K-Means, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Consiste em fixar k centroides de modo quadrático, sendo um para cada novo cluster.
( ) Associa cada indivíduo ao centroide do seu vizinho, obtido pelo cálculo da minimização da soma quadrática das distâncias entre os dados e os centroides mais próximos.
( ) Recalcula os centroides com base nos indivíduos classificados.

As afirmativas são, na ordem apresentada, respectivamente, 
Alternativas
Q1965840 Banco de Dados
Criada na década de 90, a expressão Data Mining serve para definirmos a área de estudo de dados focada na aquisição de conhecimento a partir destes dados. Essa área conta com o apoio de outras áreas de estudo, como por exemplo a estatística e a inteligência artificial. Marque a alternativa que indica, corretamente, o nome do tipo de problema que Data Mining é capaz de resolver e que é um caso especifico de problemas de classificação.  
Alternativas
Q1963307 Banco de Dados

Quais tipos de conhecimento podem ser descobertos empregando técnicas clássicas de mineração de dados?


1. Regras de Associação

2. Hierarquias de classificação

3. Padrões sequenciais ou de série temporal

4. Conhecimento implícito, emergente e não estruturado

5. Agrupamentos e segmentações


Assinale a alternativa que indica todas as afirmativas corretas.

Alternativas
Respostas
221: E
222: C
223: E
224: C
225: D
226: B
227: D
228: D
229: B
230: A
231: C
232: C
233: D
234: D
235: D
236: E
237: D
238: D
239: D
240: C