O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em tarefas
de análise preditiva. Analise as afirmativas a seguir relativas ao
algoritmo k-NN.
I O algoritmo k-NN classifica os pontos com base nas distâncias
entre eles e seus k vizinhos mais próximos.
II O valor de k deve ser escolhido aleatoriamente e não tem
impacto no desempenho do modelo k-NN.
III O algoritmo k-NN é sensível à escala das variáveis de entrada
e geralmente requer normalização dos dados antes de ser
aplicado.
É correto o que se afirma em

Question

O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em tarefas
de análise preditiva. Analise as afirmativas a seguir relativas ao
algoritmo k-NN.
I O algoritmo k-NN classifica os pontos com base nas distâncias
entre eles e seus k vizinhos mais próximos.
II O valor de k deve ser escolhido aleatoriamente e não tem
impacto no desempenho do modelo k-NN.
III O algoritmo k-NN é sensível à escala das variáveis de entrada
e geralmente requer normalização dos dados antes de ser
aplicado.
É correto o que se afirma em Alternativa A: I, apenas. Ou Alternativa B: II, apenas.  Ou Alternativa C: I e II, apenas. Ou Alternativa D: I e III, apenas. Ou Alternativa E: II e III, apenas.

Qconcursos · Accepted Answer

Alternativa [D] I e III, apenas. Alternativa correta: D - I e III, apenas.

Tema central da questão: A questão aborda o algoritmo k-vizinhos mais próximos (k-NN), largamente utilizado em tarefas de classificação e regressão na área de aprendizado de máquina. O foco está em verificar o entendimento do funcionamento, das limitações e das boas práticas relacionadas ao algoritmo.

Resumo teórico: O k-NN é um algoritmo de aprendizado supervisionado que classifica um novo dado com base nos k exemplos mais próximos no conjunto de treinamento, considerando uma métrica de distância (como a Euclidiana). O valor de k é um parâmetro importante: valores muito baixos podem tornar o modelo sensível a ruídos (overfitting), enquanto valores muito altos podem gerar classificações genéricas (underfitting).

Além disso, o k-NN é sensível à escala das variáveis: se uma variável tem valores muito maiores que as outras, ela pode dominar o cálculo da distância, distorcendo os resultados. Por isso, é recomendada a normalização ou padronização dos dados antes de aplicar o algoritmo (Scikit-learn Documentation).

Análise das afirmativas:

I. Correta. O k-NN realmente classifica com base nos k vizinhos mais próximos medindo a distância entre os pontos.

II. Incorreta. O valor de k não deve ser escolhido aleatoriamente; ele influencia diretamente o desempenho do algoritmo. A escolha adequada de k é essencial para bons resultados.

III. Correta. O algoritmo é sensível à escala das variáveis, pois a distância pode ser distorcida se os dados tiverem amplitudes muito diferentes. Por isso, normalizar é prática recomendada.

Por que as alternativas incorretas estão erradas:

B (II, apenas): Afirmativa II está errada, pois a escolha de k impacta, sim, o desempenho.
C (I e II, apenas): Novamente, II está errada.
E (II e III, apenas): Afirmativa II está errada.
A (I, apenas): Embora I esteja correta, III também está.

Estratégia para interpretação: Fique atento a palavras como "aleatoriamente" e "não tem impacto", que costumam indicar erro, e lembre-se de associar o funcionamento de algoritmos com boas práticas, como normalização de dados.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

🚀 Mais performance?

🚀 Mais performance?

O algoritmo k-vizinhos mais próximo (k-NN) é utilizado em ta...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas