Árvores de decisão (AD) são classificadores muito utilizados...

Próximas questões
Com base no mesmo assunto
Q3880235 Banco de Dados
Árvores de decisão (AD) são classificadores muito utilizados em Ciência de Dados. Com relação as características da AD, analise as afirmativas a seguir.

I. É a representação de uma função que mapeia um vetor de valores de atributos para um único valor de saída.
II. Uma árvore de decisão chega à sua decisão realizando uma sequência de testes, começando por uma de suas raízes e seguindo o ramo apropriado até que uma folha seja alcançada.
III. Cada nó interno na árvore corresponde a um teste do valor de um dos atributos de entrada, os ramos a partir do nó são rotulados com os possíveis valores do atributo, e os nós folha especificam qual valor deve ser retornado pela função.

Está correto o que se afirma em
Alternativas

Comentários

Veja os comentários dos nossos alunos

II. Uma árvore de decisão chega à sua decisão realizando uma sequência de testes, começando por uma de suas raízes e seguindo o ramo apropriado até que uma folha seja alcançada.

A árvore tem apenas uma raíz...

Essa é uma daquelas "pegadinhas" cruéis de terminologia estrutural que bancas exigentes adoram utilizar para testar a atenção aos mínimos detalhes. É compreensível ter ficado em dúvida, pois a afirmativa II parece muito correta numa primeira leitura rápida.

Vamos analisar o erro exato e a lógica estrutural de cada afirmativa:

O Erro da Afirmativa II (A Pegadinha)

O erro da afirmativa II está em uma única palavra, no plural: "raízes".

A afirmativa diz: "...começando por uma de suas raízes...".

Em Ciência da Computação e Teoria dos Grafos, a estrutura de dados "Árvore" (Tree) tem como regra axiomática possuir estritamente uma única raiz (o nó inicial, no topo). Uma estrutura que possui múltiplas raízes não é uma árvore, é uma "floresta" (como no Random Forest) ou um grafo disjunto. O fluxo da árvore de decisão começa sempre na sua raiz única e vai descendo pelos ramos.

Por que a I está Correta?

Esta é a definição formal e matemática do algoritmo. O modelo recebe um array de dados, ou seja, um vetor de atributos estruturados (Ex: $X = [\text{idade}, \text{salário}, \text{estado\_civil}]$) e, após passar pelos testes lógicos, "cospe" uma única resposta final (Ex: $y = \text{Aprovado}$). Portanto, é, por definição matemática, uma função que mapeia um vetor de entradas para uma saída única.

Por que a III está Correta?

Esta é a anatomia clássica e perfeita de uma Árvore de Decisão:

  • Nó interno: É onde ocorre o teste (Ex: A idade é maior que 30?).
  • Ramos: São os caminhos gerados pelo teste (Ex: Um ramo para "Sim", outro para "Não").
  • Nó folha: É o fim da linha, onde não há mais divisão e o modelo entrega a predição final (Ex: "Risco Alto").

A banca usou uma estrutura 99% verdadeira na afirmativa II, mas violou uma regra matemática básica da estrutura de dados ao inferir que a árvore poderia ter mais de uma raiz. Por isso, apenas I e III estão corretas.

Gemini

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo