O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em ta...

Próximas questões
Com base no mesmo assunto
Q3158072 Algoritmos e Estrutura de Dados
O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em tarefas de análise preditiva. Analise as afirmativas a seguir relativas ao algoritmo k-NN.

I O algoritmo k-NN classifica os pontos com base nas distâncias entre eles e seus k vizinhos mais próximos.

II O valor de k deve ser escolhido aleatoriamente e não tem impacto no desempenho do modelo k-NN.

III O algoritmo k-NN é sensível à escala das variáveis de entrada e geralmente requer normalização dos dados antes de ser aplicado.

É correto o que se afirma em
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: D - I e III, apenas.

Tema central da questão: A questão aborda o algoritmo k-vizinhos mais próximos (k-NN), largamente utilizado em tarefas de classificação e regressão na área de aprendizado de máquina. O foco está em verificar o entendimento do funcionamento, das limitações e das boas práticas relacionadas ao algoritmo.

Resumo teórico: O k-NN é um algoritmo de aprendizado supervisionado que classifica um novo dado com base nos k exemplos mais próximos no conjunto de treinamento, considerando uma métrica de distância (como a Euclidiana). O valor de k é um parâmetro importante: valores muito baixos podem tornar o modelo sensível a ruídos (overfitting), enquanto valores muito altos podem gerar classificações genéricas (underfitting).

Além disso, o k-NN é sensível à escala das variáveis: se uma variável tem valores muito maiores que as outras, ela pode dominar o cálculo da distância, distorcendo os resultados. Por isso, é recomendada a normalização ou padronização dos dados antes de aplicar o algoritmo (Scikit-learn Documentation).

Análise das afirmativas:

I. Correta. O k-NN realmente classifica com base nos k vizinhos mais próximos medindo a distância entre os pontos.

II. Incorreta. O valor de k não deve ser escolhido aleatoriamente; ele influencia diretamente o desempenho do algoritmo. A escolha adequada de k é essencial para bons resultados.

III. Correta. O algoritmo é sensível à escala das variáveis, pois a distância pode ser distorcida se os dados tiverem amplitudes muito diferentes. Por isso, normalizar é prática recomendada.

Por que as alternativas incorretas estão erradas:

B (II, apenas): Afirmativa II está errada, pois a escolha de k impacta, sim, o desempenho.
C (I e II, apenas): Novamente, II está errada.
E (II e III, apenas): Afirmativa II está errada.
A (I, apenas): Embora I esteja correta, III também está.

Estratégia para interpretação: Fique atento a palavras como "aleatoriamente" e "não tem impacto", que costumam indicar erro, e lembre-se de associar o funcionamento de algoritmos com boas práticas, como normalização de dados.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

d-

In statistics, the k-nearest neighbors algorithm (k-NN) is a non-parametric supervised learning method.

The k-NN algorithm can also be generalized for regression. In k-NN regression, also known as nearest neighbor smoothing, the output is the property value for the object.

https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

KNN é um instância que recebe o label dependendo das instâncias vizinhas. é como ser julgado por associação: se tu é visto com marginais, pessoas deduzem que tu é marginal. se for visto saindo com intelectuais, pessoas acham q tu tb é intelectual.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo