Na etapa de transformação dos dados no processo de descobert...
- Gabarito Comentado (1)
- Aulas (12)
- Comentários (1)
- Estatísticas
- Cadernos
- Criar anotações
- Notificar Erro
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: A
Fundamento decisivo: O critério decisivo era o mapeamento de alta cardinalidade para menor dimensão com preservação da informação útil, o que aponta para embedding.
- Se o enunciado falar em representar categorias, tokens ou objetos de alta cardinalidade em vetores densos de menor dimensão, procure embedding.
- Se a técnica apenas combina atributos para capturar interação, isso aponta para feature cross, não para redução de representação.
- Se a alternativa estiver no nível de combinação de modelos, como ensembles, ela não responde a uma pergunta sobre transformação de dados.
- Nem toda técnica que lida com alta cardinalidade é embedding; o núcleo é o mapeamento vetorial denso com preservação da informação relevante.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gabarito A
Esta questão aborda técnicas de engenharia de atributos (feature engineering) e redução de dimensionalidade, focando em como lidamos com dados categóricos complexos.
- A - Embedding (Correta): É uma técnica que converte variáveis categóricas de alta cardinalidade (como palavras em um vocabulário ou IDs de usuários) em vetores densos de números reais em um espaço de baixa dimensão. A principal vantagem é que o embedding é treinado para que itens semanticamente ou logicamente semelhantes fiquem próximos uns dos outros nesse novo espaço, preservando a informação relevante.
- B - Hashed Feature: Embora também reduza a dimensionalidade ao mapear categorias para um número fixo de "baldes" (buckets) usando uma função de hash, ela não garante a preservação da informação relevante de forma semântica. É uma técnica mais rígida e pode causar colisões (duas categorias diferentes mapeadas para o mesmo valor).
- C - Feature Cross: É a criação de um novo atributo a partir da combinação (multiplicação ou concatenação) de dois ou mais atributos existentes. Isso geralmente aumenta a dimensionalidade e a complexidade do modelo, em vez de reduzi-la.
- D - Reframing: Refere-se à mudança na forma como o problema é encarado (ex: transformar um problema de regressão em um de classificação), não sendo uma técnica de mapeamento de dados para espaços inferiores.
- E - Ensembles: É uma técnica de modelagem que combina as previsões de vários modelos (como Random Forest ou Gradient Boosting) para obter um resultado final mais robusto, não se tratando de uma etapa de transformação de dimensionalidade de atributos.
Retroceder Nunca Render-se Jamais !
Força e Fé !
Fortuna Audaces Sequitur !
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo