Em relação ao aprendizado de máquina não supervisionado, ana...

Próximas questões
Com base no mesmo assunto
Q3952840 Noções de Informática
Em relação ao aprendizado de máquina não supervisionado, analise as afirmativas a seguir.

I. No algoritmo k-means, a atribuição de cada instância a um grupo é feita pela menor distância ao centroide, e os centroides são atualizados como a média das instâncias atribuídas a cada grupo, de forma iterativa até um critério de parada.
II. O coeficiente de silhouette é uma métrica de avaliação de agrupamento, baseada em a(i) (distância média da instância i ao seu grupo) e b(i) (menor distância média de i a um grupo vizinho), assumindo valores no intervalo [−1,1].
III. O algoritmo DBSCAN é um método de agrupamento baseado em centroides, no qual o número de grupos k é definido previamente.

É verdadeiro o que se afirma em
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: A

O que precisava saber: Era necessário reconhecer três pontos: no k-means, cada instância é atribuída ao centróide mais próximo e os centróides são recalculados pela média dos pontos do grupo; o coeficiente de silhouette avalia o agrupamento com base em a(i) e b(i), variando de -1 a 1; e o DBSCAN é um método baseado em densidade, não em centróides, sem exigir definição prévia de k.

Critério decisivo: As afirmativas I e II descrevem corretamente conceitos clássicos de clustering; a III está incorreta porque o DBSCAN não é baseado em centroides nem exige definição prévia de k.

Tema central: Aprendizado de máquina não supervisionado: agrupamento por k-means, coeficiente de silhouette e DBSCAN.
Análise das alternativas
A
Certa
A alternativa A está correta porque reúne exatamente as afirmativas verdadeiras. A I corresponde ao procedimento padrão do k-means: atribuição de cada instância ao centróide mais próximo e atualização dos centróides como média dos pontos do grupo, repetindo até convergência ou outro critério de parada. A II também está correta, pois o coeficiente de silhouette é uma métrica de validação de agrupamento baseada em a(i) e b(i), com valores no intervalo de -1 a 1. Já a III não pode ser aceita, porque a base afirma que o DBSCAN é baseado em densidade, não em centróides, e que os grupos emergem de parâmetros de densidade, sem k previamente fixado.
B
Errada
Incorreta. Embora a I esteja correta, a alternativa inclui a III, mas a base afirma que o DBSCAN não é um método baseado em centróides e não depende de número k previamente definido.
C
Errada
Incorreta. A II está correta, mas a alternativa erra ao excluir a I, que também corresponde à descrição padrão do funcionamento do k-means.
D
Errada
Incorreta. A alternativa se apoia apenas na III, mas essa afirmativa contraria diretamente a base ao caracterizar o DBSCAN como centrado em centróides e com k pré-definido.
E
Errada
Incorreta. A alternativa só seria válida se as três afirmativas fossem verdadeiras, mas a III é falsa porque descreve o DBSCAN com propriedades que pertencem ao k-means, não a um método baseado em densidade.
Pegadinha da questão
A confusão entre algoritmos de agrupamento: a III troca características do DBSCAN pelas do k-means, ao dizer que ele é baseado em centróides e exige k previamente definido. Outra armadilha é supor que todo método de clustering precisa de k.
Dica para questões semelhantes
  • Separe mentalmente algoritmo de formação de grupos e métrica de avaliação: k-means forma grupos por centróides; silhouette avalia a qualidade do agrupamento com a(i) e b(i).
  • Ao ver k-means, associe imediatamente duas etapas iterativas: atribuição ao centróide mais próximo e recálculo do centróide pela média dos pontos do grupo.
  • Ao ver DBSCAN, verifique se a descrição fala em densidade. Se mencionar centróides ou k previamente fixado, a caracterização está incompatível com a base.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Gabarito A

I. Verdadeira.

No algoritmo k-means, cada ponto é atribuído ao centroide mais próximo (geralmente via distância euclidiana), e os centroides são recalculados como a média dos pontos do grupo. Esse processo é repetido até convergir (critério de parada).

II. Verdadeira.

O coeficiente de silhouette usa:

  • a(i): distância média do ponto para os elementos do mesmo cluster;
  • b(i): menor distância média para pontos de outro cluster.
  • O valor varia de -1 a 1, indicando qualidade do agrupamento.

III. Falsa.

O DBSCAN não é baseado em centroides e não exige definição prévia de k. Ele é um algoritmo baseado em densidade, que agrupa pontos com base em regiões densas e identifica ruído.

Vamos na fe!

Retroceder Nunca Render-se Jamais !

Força e Fé !

Fortuna Audaces Sequitur ! 

III. O algoritmo DBSCAN é um método de agrupamento baseado em centroides, no qual o número de grupos k é definido previamente.

Trata-se do algorítimo K-NN(nearest neighboor)

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo