O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em ta...
I O algoritmo k-NN classifica os pontos com base nas distâncias entre eles e seus k vizinhos mais próximos.
II O valor de k deve ser escolhido aleatoriamente e não tem impacto no desempenho do modelo k-NN.
III O algoritmo k-NN é sensível à escala das variáveis de entrada e geralmente requer normalização dos dados antes de ser aplicado.
É correto o que se afirma em
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: D - I e III, apenas.
Tema central da questão: A questão aborda o algoritmo k-vizinhos mais próximos (k-NN), largamente utilizado em tarefas de classificação e regressão na área de aprendizado de máquina. O foco está em verificar o entendimento do funcionamento, das limitações e das boas práticas relacionadas ao algoritmo.
Resumo teórico: O k-NN é um algoritmo de aprendizado supervisionado que classifica um novo dado com base nos k exemplos mais próximos no conjunto de treinamento, considerando uma métrica de distância (como a Euclidiana). O valor de k é um parâmetro importante: valores muito baixos podem tornar o modelo sensível a ruídos (overfitting), enquanto valores muito altos podem gerar classificações genéricas (underfitting).
Além disso, o k-NN é sensível à escala das variáveis: se uma variável tem valores muito maiores que as outras, ela pode dominar o cálculo da distância, distorcendo os resultados. Por isso, é recomendada a normalização ou padronização dos dados antes de aplicar o algoritmo (Scikit-learn Documentation).
Análise das afirmativas:
I. Correta. O k-NN realmente classifica com base nos k vizinhos mais próximos medindo a distância entre os pontos.
II. Incorreta. O valor de k não deve ser escolhido aleatoriamente; ele influencia diretamente o desempenho do algoritmo. A escolha adequada de k é essencial para bons resultados.
III. Correta. O algoritmo é sensível à escala das variáveis, pois a distância pode ser distorcida se os dados tiverem amplitudes muito diferentes. Por isso, normalizar é prática recomendada.
Por que as alternativas incorretas estão erradas:
B (II, apenas): Afirmativa II está errada, pois a escolha de k impacta, sim, o desempenho.
C (I e II, apenas): Novamente, II está errada.
E (II e III, apenas): Afirmativa II está errada.
A (I, apenas): Embora I esteja correta, III também está.
Estratégia para interpretação: Fique atento a palavras como "aleatoriamente" e "não tem impacto", que costumam indicar erro, e lembre-se de associar o funcionamento de algoritmos com boas práticas, como normalização de dados.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
d-
In statistics, the k-nearest neighbors algorithm (k-NN) is a non-parametric supervised learning method.
The k-NN algorithm can also be generalized for regression. In k-NN regression, also known as nearest neighbor smoothing, the output is the property value for the object.
https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
KNN é um instância que recebe o label dependendo das instâncias vizinhas. é como ser julgado por associação: se tu é visto com marginais, pessoas deduzem que tu é marginal. se for visto saindo com intelectuais, pessoas acham q tu tb é intelectual.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo