Questões de Concurso
Sobre data mining em banco de dados
Foram encontradas 568 questões
Considere o conjunto de dados a seguir, obtido a partir de uma base de dados de transações ocorridas em uma padaria, em uma determinada faixa de tempo. Nesse conjunto, indica-se a ocorrência de um determinado produto em cada transação.

Em mineração de dados, a partir desse conjunto de dados, podem ser geradas regras de associação, as quais buscam conjuntos de itens frequentes que guardam entre si uma relação de causa e efeito. Essas regras são da forma X→Y, onde X é o antecedente da regra, e Y, seu consequente. A menção X,Y indica referência aos dois itens frequentes X e Y. Dois indicadores utilizados para averiguar a eficácia de regras de associação são o suporte e a confiança.
Qual das regras a seguir possui confiança mínima de
80%, dado um suporte mínimo de 30%?
Dois funcionários de uma empresa de crédito discutiam sobre quais algoritmos deveriam usar para ajudar a classificar seus clientes como bons ou maus pagadores. A empresa possui, para todos os empréstimos feitos no passado, um registro formado pelo conjunto de informações pessoais sobre o cliente e de como era composta a dívida inicial. Todos esses registros tinham classificações de bons ou maus pagadores, de acordo com o perfil de pagamento dos clientes. A partir desses dados, os funcionários querem construir um modelo, por meio de aprendizado de máquina, que classifique os novos clientes, que serão descritos por registros com o mesmo formato.
A melhor opção, nesse caso, é usar um algoritmo
Hipoteticamente, um Analista de Sistemas, trabalhando no Tribunal Superior do Trabalho − TST, se deparou com as seguintes questões:
1. Como o número de processos trabalhistas deste trimestre se compara com o número de processos de um ano atrás?
2. O que se pode prever para o próximo trimestre com relação ao número de processos trabalhistas?
3. Qual é a tendência do número de processos, medida pela variação percentual?
4. Quem é provável que faça acordo trabalhista nos próximos seis meses?
5. Quais são as características dos casos prováveis de acordos trabalhistas?
Considerando que o Tribunal utiliza o sistema gerenciador de banco de dados Oracle, para responder as perguntas, o Analista achou adequado o auxílio de dois recursos, cujas descrições encontram-se abaixo:
I. Fornece dados resumidos e gera cálculos ricos, adequado para ajudar a responder as questões 1, 2 e 3.
II. Descobre padrões ocultos em dados, operando em nível detalhado, adequado para ajudar a responder as questões 4 e 5.
Os recursos para resolver os problemas de análise de dados referentes às questões apresentadas, que são descritos em I e II são, correta e respectivamente,
Em relação à análise de agrupamentos (clusterização) em mineração de dados, julgue o item seguinte.
O método de clustering k-means objetiva particionar ‘n’
observações entre ‘k’ grupos; cada observação pertence ao
grupo mais próximo da média.
Julgue o seguinte item, que se refere a CRISP-DM (Cross-Industry Standard Process of Data Mining).
Durante a fase de entendimento do negócio, busca-se descrever
claramente o problema, fazer a identificação dos dados e
verificar se as variáveis relevantes para o projeto não são
interdependentes.
Os sistemas do tipo I e II são, correta e respectivamente,
Com relação a data mining e data warehouse, julgue o item que se segue.
Agrupar registros em grupos, de modo que os registros em um
grupo sejam semelhantes entre si e diferentes dos registros em
outros grupos é uma maneira de descrever conhecimento
descoberto durante processos de mineração de dados.
Com relação a data mining e data warehouse, julgue o item que se segue.
Comparados aos bancos de dados transacionais, os data
warehouses são mais voláteis porque, para que se mantenham
consistentes, são atualizados em tempo real a cada atualização
que ocorrer em qualquer uma das bases originais de dados que
o componham.
A respeito de banco de dados, julgue o próximo item.
Uma big data não engloba dados não estruturados, mas inclui um imenso volume de dados estruturados suportado por tecnologias como o DataMining e o DataWarehouse para a obtenção de conhecimento a partir da manipulação desses dados.Julgue o item subsecutivo, referente às tecnologias de bancos de dados.
Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.Julgue o item a seguir, em relação a data warehouse e data mining.
No contexto de data mining, o processo de descoberta de
conhecimento em base de dados consiste na extração não
trivial de conhecimento previamente desconhecido e
potencialmente útil.