Árvores de decisão (AD) são classificadores muito utilizados...
I. É a representação de uma função que mapeia um vetor de valores de atributos para um único valor de saída.
II. Uma árvore de decisão chega à sua decisão realizando uma sequência de testes, começando por uma de suas raízes e seguindo o ramo apropriado até que uma folha seja alcançada.
III. Cada nó interno na árvore corresponde a um teste do valor de um dos atributos de entrada, os ramos a partir do nó são rotulados com os possíveis valores do atributo, e os nós folha especificam qual valor deve ser retornado pela função.
Está correto o que se afirma em
Comentários
Veja os comentários dos nossos alunos
II. Uma árvore de decisão chega à sua decisão realizando uma sequência de testes, começando por uma de suas raízes e seguindo o ramo apropriado até que uma folha seja alcançada.
A árvore tem apenas uma raíz...
Essa é uma daquelas "pegadinhas" cruéis de terminologia estrutural que bancas exigentes adoram utilizar para testar a atenção aos mínimos detalhes. É compreensível ter ficado em dúvida, pois a afirmativa II parece muito correta numa primeira leitura rápida.
Vamos analisar o erro exato e a lógica estrutural de cada afirmativa:
O Erro da Afirmativa II (A Pegadinha)
O erro da afirmativa II está em uma única palavra, no plural: "raízes".
A afirmativa diz: "...começando por uma de suas raízes...".
Em Ciência da Computação e Teoria dos Grafos, a estrutura de dados "Árvore" (Tree) tem como regra axiomática possuir estritamente uma única raiz (o nó inicial, no topo). Uma estrutura que possui múltiplas raízes não é uma árvore, é uma "floresta" (como no Random Forest) ou um grafo disjunto. O fluxo da árvore de decisão começa sempre na sua raiz única e vai descendo pelos ramos.
Por que a I está Correta?
Esta é a definição formal e matemática do algoritmo. O modelo recebe um array de dados, ou seja, um vetor de atributos estruturados (Ex: $X = [\text{idade}, \text{salário}, \text{estado\_civil}]$) e, após passar pelos testes lógicos, "cospe" uma única resposta final (Ex: $y = \text{Aprovado}$). Portanto, é, por definição matemática, uma função que mapeia um vetor de entradas para uma saída única.
Por que a III está Correta?
Esta é a anatomia clássica e perfeita de uma Árvore de Decisão:
- Nó interno: É onde ocorre o teste (Ex: A idade é maior que 30?).
- Ramos: São os caminhos gerados pelo teste (Ex: Um ramo para "Sim", outro para "Não").
- Nó folha: É o fim da linha, onde não há mais divisão e o modelo entrega a predição final (Ex: "Risco Alto").
A banca usou uma estrutura 99% verdadeira na afirmativa II, mas violou uma regra matemática básica da estrutura de dados ao inferir que a árvore poderia ter mais de uma raiz. Por isso, apenas I e III estão corretas.
Gemini
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo