Questões de Concurso Sobre data mining em banco de dados

Foram encontradas 565 questões

Q4019761 Banco de Dados

Julgue o próximo item, a respeito de visualização e análise exploratória de dados, de linguagens e ferramentas de apoio à análise de dados e de técnicas e tarefas de mineração de dados. 


O boxplot (diagrama de caixa) é uma ferramenta de visualização que possibilita identificar a mediana, a dispersão dos dados e a presença de valores atípicos (outliers) em uma distribuição.

Alternativas
Q4019758 Banco de Dados

Acerca de modelagem dimensional, do CRISP-DM e do uso de banco de dados relacionais na análise de dados, julgue o item a seguir.


No modelo de referência CRISP-DM, a fase de preparação de dados ocorre estritamente após a conclusão da fase de modelagem, com o objetivo de formatar as saídas preditivas geradas.

Alternativas
Q4014212 Banco de Dados
No que se refere à classificação da mineração de dados, à mineração de texto, à modelagem preditiva e à visualização e análise exploratória de dados, julgue os item subsecutivo. 
Modelos de regressão linear são métodos estocásticos para modelagem da relação entre variáveis aleatórias e uma função polinomial. 
Alternativas
Q4014211 Banco de Dados
No que se refere à classificação da mineração de dados, à mineração de texto, à modelagem preditiva e à visualização e análise exploratória de dados, julgue os item subsecutivo. 
Em um processo de mineração de texto, a tokenização é o processo de dividir textos longos em palavras individuais, removendo-se espaços e pontuação, para fins de identificação da frequência de termos ou da estrutura de uma frase em um grande volume de documentos.
Alternativas
Q4014210 Banco de Dados
No que se refere à classificação da mineração de dados, à mineração de texto, à modelagem preditiva e à visualização e análise exploratória de dados, julgue os item subsecutivo. 
Enquanto um falso positivo é um erro do tipo 2, um falso negativo é um erro do tipo 1. 
Alternativas
Q4014208 Banco de Dados
Acerca de técnicas para pré-processamento de dados, CRISP-DM, análise de grupamento, detecção de anomalias e regras de associação, julgue o próximo item.
Uma anomalia é um valor discrepante, ou seja, um valor que se localiza significativamente distante dos valores considerados normais. 
Alternativas
Q4014207 Banco de Dados
Acerca de técnicas para pré-processamento de dados, CRISP-DM, análise de grupamento, detecção de anomalias e regras de associação, julgue o próximo item.
Na metodologia CRISP-DM, a preparação dos dados serve para limpá-los, tratando valores ausentes, outliers e inconsistências.
Alternativas
Q4014206 Banco de Dados
Acerca de técnicas para pré-processamento de dados, CRISP-DM, análise de grupamento, detecção de anomalias e regras de associação, julgue o próximo item.
Em mineração de dados, dado ruidoso é aquele cujo valor está fora do domínio do atributo.
Alternativas
Q4014205 Banco de Dados
Acerca de técnicas para pré-processamento de dados, CRISP-DM, análise de grupamento, detecção de anomalias e regras de associação, julgue o próximo item.
O k-means é um algoritmo iterativo de agrupamento baseado em centroides, isto é, ele divide um conjunto de dados em grupos semelhantes com base na distância entre seus centroides.
Alternativas
Q4014204 Banco de Dados
Acerca de técnicas para pré-processamento de dados, CRISP-DM, análise de grupamento, detecção de anomalias e regras de associação, julgue o próximo item.
No contexto de regras de associação, o conceito de confiança refere-se à expectativa de que um dado, grupo ou banco de dados atue da maneira esperada em dada situação.
Alternativas
Q4013973 Banco de Dados
No ciclo de vida CRISP-DM (Cross-Industry Standard Process for Data Mining), usado em Ciência de Dados, qual etapa trata da limpeza, tratamento e formatação dos dados:
Alternativas
Q4013972 Banco de Dados
A ciência de dados utiliza métodos e técnicas com o objetivo de extrair conhecimento e insights a partir de grandes volumes de dados. A análise de dados inicia-se com uma pergunta que pode ser classificada em diversos tipos. O tipo de pergunta que busca identificar se existem padrões, tendências ou relacionamentos em um conjunto de dados, sem a necessidade de uma hipótese prévia, é classificada como:
Alternativas
Q4009191 Banco de Dados
No contexto da Ciência de Dados, o conceito que está diretamente relacionado ao estabelecimento de políticas, processos, papéis e responsabilidades para garantir qualidade, segurança, conformidade e uso adequado dos dados ao longo de seu ciclo de vida é 
Alternativas
Q3968381 Banco de Dados
No processo de descoberta de conhecimento (KDD), a etapa de mineração de dados se caracteriza por
Alternativas
Q3956761 Banco de Dados
No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados (como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de
Alternativas
Q3951157 Banco de Dados
Ao executar o algoritmo Apriori, as seguintes regras associativas foram determinadas como relevantes:

{café, açúcar} => {leite} e {açúcar, trigo} => {leite}.

Considerando essas duas regras associativas relevantes, é verdade que
Alternativas
Q3880237 Banco de Dados
Matheus foi empossado recentemente pela ALEGO como analista e está se aprofundando nos estudos das redes neurais (RN). Ele sabe que as RN podem ter diversas formas de aprendizagem não supervisionada.

O tipo de aprendizado onde os neurônios de saída da rede disputam entre si para se tornarem ativos e somente um neurônio de saída é ativado em determinado instante se denomina:
Alternativas
Q3880236 Banco de Dados
O perceptron é um dos modelos de redes neurais artificiais mais simples e tradicionais. A figura a seguir ilustra o grafo arquitetural de um perceptron. Analise-a.

Q56.png (345×173)

Com relação as características do grafo, analise as afirmativas a seguir.

I. A rede possui várias camadas, sendo quatro camadas ocultas e três camadas de saída de dados.
II. A rede é do tipo totalmente conectada, isso significa que cada neurônio em qualquer camada está conectado a todos os outros neurônios da camada anterior.
III. O fluxo de sinais é unidirecional e progride na rede da esquerda para a direita e de camada em camada.

Está correto o que se afirma em
Alternativas
Q3880235 Banco de Dados
Árvores de decisão (AD) são classificadores muito utilizados em Ciência de Dados. Com relação as características da AD, analise as afirmativas a seguir.

I. É a representação de uma função que mapeia um vetor de valores de atributos para um único valor de saída.
II. Uma árvore de decisão chega à sua decisão realizando uma sequência de testes, começando por uma de suas raízes e seguindo o ramo apropriado até que uma folha seja alcançada.
III. Cada nó interno na árvore corresponde a um teste do valor de um dos atributos de entrada, os ramos a partir do nó são rotulados com os possíveis valores do atributo, e os nós folha especificam qual valor deve ser retornado pela função.

Está correto o que se afirma em
Alternativas
Q3880232 Banco de Dados
A regressão logística é um modelo muito popular na ciência de dados, ele é muito utilizado em diversos projetos da ALEGO. Com relação às características da regressão logística, analise as afirmativas a seguir.

I. É um modelo de regressão linear e dentro do contexto do aprendizado de máquina, a regressão logística pertence à família de modelos de aprendizado de máquina supervisionado.
II. Representa dois grupos de interesse como uma variável binária com valores 0 e 1, não importando qual o grupo é designado com os valores o versus 1, mas a designação de como dever ser observada interpretação dos coeficientes. 
III. A função logística é representada pelas seguintes fórmulas:
a) Logit(pi) = 1/(1+ ln(-pi))
b) exp(pi/(1-pi)) = β_0 + β _1*X_1 + … + β _k*K_k.
onde:
logit(pi) é a variável dependente ou de resposta, e x é a variável independente.

Está correto o que se afirma em
Alternativas
Respostas
1: C
2: E
3: E
4: C
5: E
6: C
7: C
8: E
9: C
10: E
11: C
12: B
13: A
14: D
15: B
16: A
17: C
18: E
19: A
20: C