A respeito dos diferentes tipos de algoritmos naive Bayes, ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
A alternativa correta é a D.
Vamos entender o porquê dessa resposta e revisar os conceitos envolvidos:
Alternativa D: No gaussian naive Bayes, assume-se que os valores contínuos associados a cada recurso são distribuídos de acordo com uma distribuição normal. Isso está correto, pois o Gaussian Naive Bayes é uma variação do algoritmo que lida especificamente com dados contínuos assumindo que eles seguem uma distribuição normal (ou gaussiana). Este modelo é amplamente usado quando os dados são numéricos.
Alternativa A: No multinomial naive Bayes, a média e a variância dos atributos não são estimadas para cada classe a partir dos dados de treinamento. Na verdade, o multinomial naive Bayes é usado principalmente para dados discretos, como contagens de palavras em texto, e não para atributos contínuos, onde a média e a variância seriam relevantes.
Alternativa B: O bernoulli naive Bayes não representa as frequências com as quais certos eventos foram gerados por uma distribuição normal. Em vez disso, ele é usado para dados binários, onde cada atributo pode ter um de dois valores (geralmente 0 ou 1), e é baseado na distribuição de Bernoulli, não na normal.
Alternativa C: Os feature vectors do bernoulli naive Bayes não são tipicamente contagens de eventos ou frequências, mas sim representações binárias que indicam a presença ou ausência de uma característica. Este modelo é adequado para dados categóricos binários, diferentemente do modelo multinomial que lida com contagens.
Em resumo, cada tipo de algoritmo naive Bayes está otimizado para diferentes tipos de dados: Gaussian para dados contínuos, Multinomial para contagens de palavras, e Bernoulli para dados binários. Entender essas diferenças é crucial para a correta aplicação em problemas de classificação.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gabarito D
Quando o assunto é tipos de Naive Bayes, sempre lembrar:
- Gaussiano/Gaussian: características/features/atributos contínuos com distribuição normal;
- Multinominal: características/features/atributos discretos, muito utilizado em problemas com texto;
- Bernoulli: é semelhante ao multinominal, mas as características/features/atributos são binários, normalmente utilizado em problemas para classificação booleanas ou de ausência/presença.
d-
Gaussian Naive Bayes:- assumes that the features follow a Gaussian (normal) distribution. It is suitable for continuous data.
multinomial Naive Bayes: for discrete data* , especially in text classification where the features are word counts or term frequencies.
Bernoulli Naive Bayes: Similar to Multinomial Naive Bayes, but it assumes that the features are binary (i.e., they indicate the presence or absence of a feature). for text classification
Discrete data refers to information that can only take on specific, separate values. Think of it like counting things. You can have whole numbers, like 1, 2, or 3, but you can't have fractions or decimals in this case.
Here are some examples of discrete data:
- Number of students in a classroom: You can have 20 students, 21 students, but not 20.5 students.
- Number of pets: You can have 1 dog, 2 cats, or 3 birds, but you can't have 2.3 pets.
- Shoe sizes: Shoe sizes are usually whole numbers or half sizes, but not something like 9.2.
In contrast, continuous data can take on any value within a range, like height or weight, where you can have 5.5 feet or 150.2 pounds.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo