Na etapa de transformação dos dados no processo de descobert...

Próximas questões
Com base no mesmo assunto
Q3951154 Noções de Informática
Na etapa de transformação dos dados no processo de descoberta de informação, a técnica que mapeia dados de alta cardinalidade em um espaço de dimensão inferior, de tal forma que a informação relevante para o problema de aprendizado seja preservada, é chamada de
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: A

Fundamento decisivo: O critério decisivo era o mapeamento de alta cardinalidade para menor dimensão com preservação da informação útil, o que aponta para embedding.

Tema central: Embedding de atributos
Análise das alternativas
A
Certa
Embedding é a técnica de representar dados ou categorias de alta cardinalidade em um vetor denso de menor dimensão, preservando informação relevante para o aprendizado. Isso corresponde ao enunciado.
B
Errada
Hashed Feature usa uma função hash para projetar atributos em um espaço de tamanho fixo. Embora lide com alta cardinalidade, não é a técnica conceitualmente definida no enunciado como representação vetorial densa em dimensão inferior que preserva informação relevante ao problema.
C
Errada
Feature Cross serve para combinar atributos e capturar interações entre variáveis. Isso é diferente de mapear dados de alta cardinalidade para um espaço de menor dimensão.
D
Errada
Reframing diz respeito à redefinição ou recontextualização do problema ou da modelagem. Não é técnica de representação de atributos em espaço vetorial reduzido.
E
Errada
Ensembles combinam múltiplos modelos para melhorar desempenho. O enunciado, porém, trata de transformação de dados, não de combinação de modelos.
Pegadinha da questão
A confusão mais provável era marcar Hashed Feature por também aparecer em contextos de alta cardinalidade. O ponto decisivo, porém, era a ideia de representação densa em menor dimensão preservando informação útil, característica de embedding.
Dica para questões semelhantes
  • Se o enunciado falar em representar categorias, tokens ou objetos de alta cardinalidade em vetores densos de menor dimensão, procure embedding.
  • Se a técnica apenas combina atributos para capturar interação, isso aponta para feature cross, não para redução de representação.
  • Se a alternativa estiver no nível de combinação de modelos, como ensembles, ela não responde a uma pergunta sobre transformação de dados.
  • Nem toda técnica que lida com alta cardinalidade é embedding; o núcleo é o mapeamento vetorial denso com preservação da informação relevante.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Gabarito A

Esta questão aborda técnicas de engenharia de atributos (feature engineering) e redução de dimensionalidade, focando em como lidamos com dados categóricos complexos.

  • A - Embedding (Correta): É uma técnica que converte variáveis categóricas de alta cardinalidade (como palavras em um vocabulário ou IDs de usuários) em vetores densos de números reais em um espaço de baixa dimensão. A principal vantagem é que o embedding é treinado para que itens semanticamente ou logicamente semelhantes fiquem próximos uns dos outros nesse novo espaço, preservando a informação relevante.
  • B - Hashed Feature: Embora também reduza a dimensionalidade ao mapear categorias para um número fixo de "baldes" (buckets) usando uma função de hash, ela não garante a preservação da informação relevante de forma semântica. É uma técnica mais rígida e pode causar colisões (duas categorias diferentes mapeadas para o mesmo valor).
  • C - Feature Cross: É a criação de um novo atributo a partir da combinação (multiplicação ou concatenação) de dois ou mais atributos existentes. Isso geralmente aumenta a dimensionalidade e a complexidade do modelo, em vez de reduzi-la.
  • D - Reframing: Refere-se à mudança na forma como o problema é encarado (ex: transformar um problema de regressão em um de classificação), não sendo uma técnica de mapeamento de dados para espaços inferiores.
  • E - Ensembles: É uma técnica de modelagem que combina as previsões de vários modelos (como Random Forest ou Gradient Boosting) para obter um resultado final mais robusto, não se tratando de uma etapa de transformação de dimensionalidade de atributos.

Retroceder Nunca Render-se Jamais !

Força e Fé !

Fortuna Audaces Sequitur ! 

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo