Acerca de Big Data, business intelligence e machine learning...
Acerca de Big Data, business intelligence e machine learning julgue o item a seguir.
Os métodos de aprendizado supervisionado são capazes de
identificar padrões em um conjunto de dados sem a
necessidade de receberem dados de treinamento rotulados.
Gab E
A questão inverteu os conceitos.
No APRENDIZADO SUPERVISIONADO há a interação humana, por meio do fornecimento de categorias de dados previamente definidas, de modo que o algoritmo irá classificar os dados novos inseridos de acordo com as classes de dados históricos fornecidas anteriormente.
Por sua vez, no APRENDIZADO NÃO SUPERVISIONADO, não há a supervisão ou interação humana, de modo que não há a inclusão de classes de dados previamente. Com isso, o algoritmo irá apenas analisar os dados novos inseridos, sendo realizada, por si só, a categorização dos dados, sem nenhuma interferência humana ao longo do processo.
Mais uma:
(CESPE - 2018 - IPHAN) Na busca de padrões no data mining, é comum a utilização do aprendizado não supervisionado, em que um agente externo apresenta ao algoritmo alguns conjuntos de padrões de entrada e seus correspondentes padrões de saída, comparando-se a resposta fornecida pelo algoritmo com a resposta esperada. (errado)
um bizu;
-se começar com A é não supervisionado
-se não começar com A é supervisionado
Tipos de técnica (Método de classificação para mineração de dados)
- Associação
➟ Não supervisionado
➟ Identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros.
Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos a servidores de dados também estão envolvidos em processos ligados a roubo de dados sigilosos
Análise de agrupamentos (Clusterização ou análise de aglomerações ou análise de partições)
➟ Não supervisionado
➟ Busca classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters
- Padrões sequenciais ou regressão
➟ Supervisionado
➟ Identificar sequências que ocorrem em determinados registros. Por exemplo: 32% de pessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova perícia médica ajuízam uma causa contra o INSS solicitando ressarcimento monetário
- Classificação
➟ Supervisionado
➟ As categorias são definidas antes da análise dos dados.
- Classificação envolve descrever os dados em função de algumas classes pré determinadas. É utilizado um conjunto de treinamento e envolve aprendizado supervisionado.
tmj
1. Aprendizado supervisionado
No aprendizado de máquina supervisionado, os algoritmos são treinados a partir de exemplos rotulados.
O programador humano insere dados mostrando o que é “certo” e o que é “errado”.
O sistema, então, aprende a fazer comparações e a resposta que ele for dar vai ser com base nos exemplos que ele recebeu.
2. Aprendizado não-supervisionado
Já no aprendizado não supervisionado, o sistema age totalmente por si só. A ele não são colocados exemplos rotulados para que ele possa fazer comparações.
O “certo” e o “errado” não são informados ao sistema, cabendo a ele fazer a identificação de padrões e características em comum dos dados que são inseridos.
3. Aprendizado semi-supervisionado
Nesse tipo de machine learning, o sistema consegue lidar com dados rotulados ou não-rotulados. Geralmente, essa modalidade é empregada quando o custo para rotular os dados é muito elevado.
4. Aprendizado por reforço
No aprendizado por reforço, utiliza-se a lógica da “tentativa e erro”. Dessa forma, o sistema aprende quais ações são as “melhores” a serem tomadas.
Ou seja, nessa modalidade, o ensinamento da máquina é feito com base na experiência. Ela, então, aprende com os próprios erros.
Os métodos de aprendizado supervisionado, como regressão linear, árvores de decisão e redes neurais, dependem da disponibilidade de dados rotulados para aprender e fazer previsões precisas. Esses algoritmos aprendem a relação entre as entradas e as saídas desejadas por meio dos exemplos fornecidos durante o treinamento. Sem os rótulos nos dados de treinamento, o modelo não possui referência para entender qual é a resposta correta para uma determinada entrada, tornando impossível identificar padrões ou fazer previsões precisas.
Gabarito: E - Errado
Para compreender a questão, é fundamental entender o que é o aprendizado supervisionado, um dos ramos do machine learning. No aprendizado supervisionado, um algoritmo é treinado em um conjunto de dados que já contém as respostas desejadas, chamadas de labels ou rótulos. Esse tipo de aprendizado é como um processo de aprendizagem onde o modelo, como um aluno, é guiado por um professor que fornece as respostas corretas durante o treinamento.
O treinamento envolve a apresentação de exemplos de dados que são rotulados de forma a permitir que o algoritmo faça a associação entre os dados de entrada e a saída desejada. Com o tempo, o modelo ajusta seus parâmetros internos para ser capaz de fazer previsões ou classificações precisas quando apresentado a novos dados, mas sempre dentro do contexto que foi treinado.
Dessa forma, a afirmação de que os métodos de aprendizado supervisionado são capazes de identificar padrões em um conjunto de dados sem a necessidade de receberem dados de treinamento rotulados é incorreta. Na verdade, o que define o aprendizado supervisionado é exatamente a necessidade de tais dados rotulados. Sem eles, o algoritmo não teria a "supervisão" que o nome sugere.
O contraste pode ser feito com o aprendizado não supervisionado, onde o algoritmo procura identificar padrões e estruturas em dados que não estão rotulados. A confusão entre os dois tipos pode ser uma armadilha comum em questões de concurso, então é crucial estar claro sobre as diferenças entre os métodos de aprendizado.
Portanto, a alternativa correta é E - Errado, já que, ao contrário do que sugere o enunciado, os métodos de aprendizado supervisionado requerem, sim, dados de treinamento rotulados.