Questões de Concurso Comentadas sobre data mining em banco de dados

Foram encontradas 523 questões

Q2172384 Banco de Dados
__________ é um método de classificação binária que traça um hiperplano ótimo que maximiza a margem de separação entre duas classes de dados. A etapa principal do algoritmo é descobrir os vetores que são as instâncias equidistantes do hiperplano.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas
Q2172383 Banco de Dados
__________ é uma classe de métodos ensemble que utiliza classificadores de árvore de decisão. É uma combinação de preditores de árvores tal que cada árvore depende dos valores de um vetor aleatório amostrado independentemente e com a mesma distribuição para todas as árvores.
Assinale a alternativa que preenche corretamente a lacuna do trecho acima.
Alternativas
Q2172377 Banco de Dados
Analise as assertivas abaixo sobre o método de agrupamento k-means:
I. Dada uma coleção de objetos, cada um com n atributos, k-means é um método que, para I - um valor escolhido de k, identifica k grupos de objetos com base na proximidade dos objetos com relação ao centroide do grupo. O centro é determinado como a média do vetor n-dimensional de atributos de cada grupo.
II. Por ser um método supervisionado, o K-means ajuda a excluir a subjetividade das análises.
III. K-means é um método para definir agrupamentos. Uma vez que os agrupamentos e os seus centroides são identificados, é fácil classificar novos objetivos para um cluster baseado na distância do objeto do centroide mais próximo.
Quais estão corretas?
Alternativas
Q2172372 Banco de Dados
Relacione a Coluna 1 à Coluna 2, associando as categorias de aprendizado de máquina às suas características.
Coluna 1 1. Aprendizado Supervisionado. 2. Aprendizado Não Supervisionado. 3. Aprendizado Profundo. 
Coluna 2  ( ) O algoritmo recebe um conjunto de dados rotulados e aprende comparando a saída do modelo com a saída esperada, reajustando seus parâmetros até chegar em um limiar aceitável e pré-determinado a priori.
( ) Os algoritmos buscam encontrar padrões ou estruturas em conjuntos de dados não rotulados, por exemplo, gerando agrupamentos de dados.
( ) Conjunto de algoritmos que modelam abstrações de alto nível de dados usando grafos com várias camadas de processamento, compostas de várias transformações lineares e não lineares.
( ) Processo de aprendizado baseado em redes neurais com várias camadas (em geral, mais de cinco camadas): entrada, saída e oculta.
A ordem correta de preenchimento dos parênteses, de cima para baixo, é:

Alternativas
Q2172364 Banco de Dados
Qual é a etapa de modelagem da metodologia CRISP-DM na qual são tratados os valores nulos e pode ser necessário fazer fusão com outros dados? 
Alternativas
Q2133419 Banco de Dados

A respeito de data warehouse e data mining, julgue o próximo item.


Fatos, dimensões e medidas são elementos essenciais de um data warehouse.

Alternativas
Q2133418 Banco de Dados

A respeito de data warehouse e data mining, julgue o próximo item.


O data mining é um processo usado para extrair e analisar informações que revelam padrões ou tendências estratégicas do negócio.

Alternativas
Q2128641 Banco de Dados
Sabendo que existe, na organização em que trabalha, uma base de dados formada por uma grande tabela que contém apenas o id do cliente e colunas do tipo booleano indicando se um cliente possuía ou já tinha possuído cada produto da organização, um funcionário de TI resolveu dividir os clientes em grupos apenas com base nessa informação, utilizando aprendizado de máquina.
Para essa tarefa, o funcionário de TI deve utilizar o aprendizado de máquina
Alternativas
Q2096293 Banco de Dados
Suponha que um modelo de classificação binária foi treinado para distinguir e-mails de spam de e-mails legítimos. O modelo foi testado em um conjunto de dados de teste com 200 e-mails, sendo 100 e-mails de spam e 100 e-mails legítimos.
A matriz de confusão é dada por 80 verdadeiros positivos, 85 verdadeiros negativos, 15 falsos positivos (erro tipo 1) e 20 falsos negativos (erro tipo 2). 
Nessas condições, o F1-Score do modelo deve ser aproximadamente igual a 
Alternativas
Q2078035 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

No ciclo do CRISP-DM, a fase de implantação é a mais simples (jamais será um processo complexo), pois se resume à execução de scripts.

Alternativas
Q2078034 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O entendimento do negócio é a fase do ciclo do CRISP-DM que exige mais tempo em mineração de dados, pois estima-se que essa etapa, geralmente, leve entre 50 e 70% do tempo e do esforço de um projeto. 

Alternativas
Q2078033 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

Modelagem e avaliação são algumas das fases do ciclo do CRISP-DM. 

Alternativas
Q2078032 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

A única desvantagem que impede o uso em larga escala do CRISP-DM é o seu alto custo, uma vez que os usuários somente podem utilizá-lo após a aquisição da licença. 

Alternativas
Q2078031 Banco de Dados

No que diz respeito ao modelo de referência CRISP-DM (Cross Industry Standard Process for Data Mining), julgue o item.

O CRISP-DM é uma metodologia abrangente de mineração de dados e um modelo de processo que fornece, para os usuários de data mining (DM), um modelo completo para a realização de um projeto de DM. 

Alternativas
Q2066826 Banco de Dados
Sobre detecção de anomalias, analise as afirmativas a seguir.
I. São exemplos de detecção de anomalias: detecção de fraude, detecção de intrusão, monitoramento de sistemas de saúde, qualidade de um produto. II. São métodos que conseguem lidar com detecção de anomalias: algoritmos baseados em densidade, análise de agrupamento, redes neurais recorrentes, redes bayesianas e modelos de Markov escondidos. III. A distribuição normal é a distribuição mais comum dos dados considerados dentro de uma normalidade, porém, podemos obter normalidade também por meio de outros tipos de distribuição como a distribuição de Bernoulli, distribuição uniforme, distribuição binomial e distribuição de Minkowski. IV. A métrica de avaliação desses métodos pode ajudar na identificação de dados fora do padrão. Portanto, as métricas de precisão, sensibilidade e medida-F1 são exemplos de métricas utilizadas para detecção de anomalias.
Está correto o que se afirma em
Alternativas
Q3997128 Banco de Dados
A Mineração de Dados é comumente classificada pela sua capacidade em realizar determinadas tarefas. Qual das tarefas abaixo descreve a natureza de ocorrências futuras, de certos eventos, com base nos acontecimentos passados? 
Alternativas
Q3997127 Banco de Dados
A Mineração de Dados requer uma adequação prévia dos dados por meio de técnicas de pré-processamento. Algumas técnicas estão listadas abaixo:

(A) Agregação.
(B) Amostragem.
(C) Redução de Dimensionalidade.
(D) Discretização e Binarização.

Relacione os itens acima com os seus respectivos conceitos:

(1) É a técnica que diminui o número de atributos de um conjunto de dados, criando novos atributos que sejam uma combinação dos atributos antigos.
(2) É a combinação de dois ou mais objetos em um único.
(3) É comumente usada para selecionar um subconjunto dos objetos de dados a serem analisados.
(4) É aquela que transforma um atributo contínuo em um categorizado e transforma, tanto os atributos contínuos quanto os discretos, em um ou mais atributos binários.


Entre as alternativas abaixo, qual é a que apresenta a relação da técnica com o seu conceito de forma CORRETA?
Alternativas
Q3976958 Banco de Dados
Quando se inicia os trabalhos de aprendizado em bases de dados é comum identificar problemas na base de dados. Por isso, na etapa de pré- -processamento, os dados passam por recursos de limpeza, integração de bases de dados, redução na quantidade de atributos ou dados, transformação nos formatos dos dados ou discretização de alguns. Considerando esses recursos, indique a alternativa incorreta que os define.
Alternativas
Q2501776 Banco de Dados
Na mineração de texto, o processo utilizado para remover os prefixos e sufixos de palavras, de modo a permanecer somente a raiz delas, com a finalidade de melhorar o armazenamento, é conhecido como
Alternativas
Q2339721 Banco de Dados
A árvore de decisão é uma técnica utilizada em mineração de dados cuja abordagem para a criação de regras para utilização nos próximos eventos é a 
Alternativas
Respostas
181: B
182: B
183: C
184: B
185: B
186: C
187: C
188: B
189: C
190: E
191: E
192: C
193: E
194: C
195: D
196: B
197: D
198: B
199: A
200: C