Sobre data mining, é correto afirmar:
É importante notar que as palavras padrões, tendências ou dados brutos sempre estão relacionadas com MD.
Data mining é o prcesso de analisar, processar e transformar dados para analisá-los e descobrir padroes e tendencias. geralmente se valoriza o que é generico e se desconsidera o que for ocasional.
Na Economia, mais precisamente na Econometria, o processo de Data Mining deve sempre ser visto com certa ressalva. Se um modelo econométrico, que segundo a teoria econômica é descrito por Yi = B0 + B1X1i + B2X2i + ui, tiver acrescido a variável X3 por método de Data Mining simplesmente porque R² ou teste F apresentam melhoras, pode não ser razão suficiente. O Data Mining pode trazer relações espúrias em seus resultados.
(b) Errado. Eles funcionam de forma semiautomática, necessitando de interferência humana;
(c) Errado. Informações precisam ser pré-processadas e, não, simplificadas – nada de desconsiderar informações genéricas;
(d) Errado. Data Mining não é um banco de dados;
(e) Errado. Essa é uma falácia comum! Não é obrigatório utilizar um Data Warehouse, apesar de ser o mais comum.
Fonte: estratégia pdf
Tá, eu acertei, mas às vezes acho que as bancas em geral cobram muitos conceitos "ctrl+c, ctrl+v", retirados de contextos específicos. No item a, que é o correto, o trecho "entre as informações de uma empresa" evidencia isso. Ora, data mining obviamente pode ser implementado em qualquer entidade, então seu conceito não se limita ao ambiente empresarial. Não necessariamente se deve tratar de uma empresa. Questão de péssima qualidade.
GAB: A
Sobre o assunto:
Data Mining é o processo de explorar grande quantidade de dados para extração não-trivial de informação implícita desconhecida.
Data Mining é uso de teorias, métodos, processos e tecnologias para organizar uma grande quantidade de dados brutos para identificar padrões de comportamentos em determinados públicos.
Data Mining é a categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados.
Data Mining é o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de padrões, estatísticas e matemáticas.
Data Mining constitui em uma técnica para a exploração e análise de dados, visando descobrir padrões e regras, a princípio ocultos, importantes à aplicação.
Data Mining é o conjunto de ferramentas que permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa (fuzzy), dentre outras.
Data Mining é o conjunto de ferramentas e técnicas de mineração de dados que têm por objetivo buscar a classificação e o agrupamento (clusterização) de dados, bem como identificar padrões.
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre variáveis e novos subconjuntos de dados.
Data Mining consiste em explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar padrões, como regras de associação ou sequências temporais, para detectar relacionamentos entre estes.
Data Mining é o conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização.
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.
Data Mining é o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis. (PF).
Data Mining é um método computacional que permite extrair informações a partir de grande quantidade de dados.
Fonte: comentários colegas do qc.
A alternativa correta é a letra A, que define Data Mining como o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados. Isso é feito utilizando técnicas avançadas de reconhecimento de padrões, estatísticas e matemáticas. A grande quantidade de dados disponíveis nas empresas pode conter informações valiosas que não são aparentes a uma análise simples ou superficial. A mineração de dados procura automatizar o processo de descoberta dessas informações úteis.
Essa definição é acertada porque o Data Mining é, essencialmente, um processo exploratório que combina elementos de várias disciplinas, como inteligência artificial, aprendizado de máquina, estatística e sistemas de banco de dados, para analisar grandes conjuntos de dados e extrair informações úteis que podem ser utilizadas para tomada de decisão, previsões e melhorias de processo. As informações encontradas podem ser padrões de compra de clientes, tendências de mercado, correlações entre variáveis que não eram previamente consideradas etc.
As outras alternativas têm erros fundamentais ou concepções equivocadas sobre o que é e o que envolve o processo de Data Mining:
- Alternativa B: Está incorreta. Embora os algoritmos de Data Mining sejam avançados, a interação com analistas humanos é essencial, visto que eles são responsáveis por interpretar os padrões encontrados e determinar seu real valor prático.
- Alternativa C: É um mal-entendido, pois o processo de encontrar padrões pode envolver tanto a simplificação quanto a complexificação dos dados, dependendo do contexto e da natureza dos dados.
- Alternativa D: Confunde Data Mining com um banco de dados, quando, na verdade, é um conjunto de processos aplicados sobre os dados contidos em um banco de dados ou outro repositório.
- Alternativa E: Embora o Data Mining possa ser potencializado por um Data Warehouse, não é uma condição necessária. Dados podem ser minerados de diferentes fontes e nem sempre precisam estar em um estado perfeito de limpeza e organização.
Desse modo, fica evidente que a melhor resposta e a que mais se alinha ao conceito amplamente aceito de Data Mining é a alternativa letra A.