Questões de Concurso Sobre data mining em banco de dados

Foram encontradas 568 questões

Q1902779 Banco de Dados

Com referência aos conceitos e técnicas de mineração de dados, julgue o item seguinte. 


Em um modelo para um aprendizado supervisionado dos dados no formato de uma árvore de decisão, um algoritmo de construção da árvore busca minimizar a informação necessária para classificar os dados nas partições da árvore.

Alternativas
Q1902778 Banco de Dados

Com referência aos conceitos e técnicas de mineração de dados, julgue o item seguinte. 


No aprendizado não supervisionado dos dados, usa-se uma amostra para treinamento, e os registros são colocados em agrupamentos semelhantes entre si quanto aos seus padrões.  

Alternativas
Q1902777 Banco de Dados

Com referência aos conceitos e técnicas de mineração de dados, julgue o item seguinte. 


Para encontrar regras de associação negativas de interesse, como a identificação de padrões nos dados de um arquivo, a hierarquia é uma técnica usada com base no conhecimento prévio sobre um conjunto de atributos do arquivo. 

Alternativas
Q1901929 Banco de Dados

A respeito de inteligência do negócio, julgue o item a seguir. 


Os conceitos de data warehouse (DW) e data mining (DM) são relacionados à inteligência de negócios; a principal diferença entre eles é que o DW atua na análise dos eventos do passado, enquanto o DM limita-se na predição dos eventos futuros. 

Alternativas
Q1895665 Banco de Dados

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue. 



Considere que, em uma análise de agrupamentos por meio de mistura de gaussianas, três distribuições normais com médias Imagem associada para resolução da questão  se referem, respectivamente, aos clusters 1, 2 e 3. Nessa situação, pelo modelo de mistura de gaussianas, o cluster 1 é constituído pelas observações mais próximas da média Imagem associada para resolução da questão

Alternativas
Q1895660 Banco de Dados
Os modelos ditos fracos, também chamados modelos de base, muitas vezes são combinados com o objetivo de se construir um modelo mais forte, no qual a variância e o viés atinjam equilíbrio satisfatório. Esse procedimento, denominado ensembles, é muito utilizado em ciência de dados e aprendizado de máquinas. Quanto às formas de ensembles, julgue o próximo item. 


O ensemble denominado bagging tem como foco principal a redução do viés e não da variância, treinando-se os modelos em sequência, tal que os erros dos primeiros modelos treinados são utilizados para o ajuste nos pesos matemáticos dos próximos modelos. 
Alternativas
Q1895657 Banco de Dados

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.

De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.



Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample (inputs). 

Alternativas
Q1892808 Banco de Dados
Em um problema de classificação é entregue ao cientista de dados um par de covariáveis, (x1 , x2 ), para cada uma das quatro observações a seguir: (6,4), (2,8), (10,6) e (5,2). A variável resposta observada nessa amostra foi “Sim”, “Não”, “Sim”, “Não”, respectivamente.
A partição que apresenta o menor erro de classificação quando feita na raiz (primeiro nível) de uma árvore de decisão é: 
Alternativas
Q1892807 Banco de Dados
Um analista do TCU recebe o conjunto de dados com covariáveis e a classe a que cada amostra pertence na tabela a seguir.
Imagem associada para resolução da questão

Esse analista gostaria de prever a classe dos pontos (1,1), (0,0) e (-1,2) usando o algoritmo de k-vizinhos mais próximos com k=3 e usando a distância euclidiana usual.
Suas classes previstas são, respectivamente:
Alternativas
Q1883838 Banco de Dados

Com relação a data warehouse e data mining, julgue o item subsequente.


A análise de data mining por padrão sequencial visa à identificação de fatos que geram outros fatos, sempre ocorrendo causa e consequência em momentos adjacentes.

Alternativas
Q1883836 Banco de Dados

Com relação a data warehouse e data mining, julgue o item subsequente.


A etapa de estratificação da técnica de árvore de decisão é responsável por determinar as regras para a designação dos casos identificados a uma categoria existente mais adequada no data mining. 

Alternativas
Q1879613 Banco de Dados
Em um processo de data mining, na construção de relações sob a forma de regras entre itens de uma base de dados transacional, é usada a técnica denominada
Alternativas
Q1879611 Banco de Dados
No CRISP-DM, a fase que se caracteriza pelas tarefas de limpar, construir, integrar e formatar os dados é a de
Alternativas
Q1877668 Banco de Dados
  Após ter sido privatizada, determinada empresa passou a utilizar novos sistemas administrativos, tais como: folha de pagamento, sistema de pessoal, sistemas de benefícios etc.; porém, constatou-se que os sistemas antigos não poderiam ser descontinuados em um pequeno espaço de tempo. Tais sistemas usavam tecnologias de armazenamento de dados antiquados e dados de baixa qualidade.

Acerca dessa situação hipotética e considerando aspectos diversos pertinentes à inteligência de negócios - business intelligence (BI) -, julgue os seguintes itens.
Na situação hipotética em tela, considerando as bases de dados antigas e novas, seria uma ótima prática a utilização dos conceitos de data warehouse e data mining para, por exemplo, automatizar a análise de currículos de acordo com as competências dos empregados.
Alternativas
Q2411826 Banco de Dados

Utilize a figura a seguir (Fig3), que representa uma sequência de comandos em SQL, para resolver as questões de número 54 e 55.


Fig3


create table cliente

{

seq VARCHAR2(6) not null,

nome VARCHAR2(50) not null,

cpf VARÇHAR2(11) not null,

data nasc date,

dependentes numeric(2),

estcivil VARCHAR2(1)

);


arter table cliente

ADD CONSTRAINT cliente pk PRIMARY KEY (cpf)

ADD CONSTRAINT seq un unique (seq) enable

ADD CONSTRAIKT est ck check (estcivil in ('C','S','D','V')) enable

ADD CONSTRAINT cpf ch check (REGEXP LIKE(cpf, '^[[digit: ]]{11}$')) enable;


Como se chama o processo de explorar grandes quantidades de dados à procura de anomalias, padrões e correlações consistentes, tais como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados?

Alternativas
Q1905909 Banco de Dados
Considerando os métodos de Mineração de Dados, analise a seguinte descrição: “constrói os denominados classificadores lineares, que separam o conjunto de dados por meio de um hiperplano, sendo considerado um dos mais efetivos para a tarefa de classificação.” Trata-se de: 
Alternativas
Q1864995 Banco de Dados
O enriquecimento de dados da etapa de pré-processamento e preparação do data mining tem como objetivo  
Alternativas
Q1863498 Banco de Dados
Em um projeto de data mining, a coleta do dado que será garimpado ocorre no processo de
Alternativas
Q1851824 Banco de Dados
Quanto a ferramentas de análise e mineração de texto, julgue o próximo item.
Mineração de texto refere-se ao processo de extração automática de informações relevantes, novas e interessantes. 
Alternativas
Q1851820 Banco de Dados
Julgue o item subsecutivo, a respeito de análise de agrupamentos (clusterização) e detecção de anomalias.
Uma anomalia em um conjunto de dados é sempre o valor resultante de um erro do sistema de coleta de dados.
Alternativas
Respostas
261: C
262: E
263: C
264: E
265: E
266: E
267: C
268: B
269: D
270: E
271: C
272: B
273: C
274: C
275: A
276: C
277: E
278: A
279: C
280: E