A seleção amostral pode ser feita, em geral, por dois método...
A seleção amostral pode ser feita, em geral, por dois métodos. As amostras podem ser probabilísticas e não probabilísticas. No caso de amostras não probabilísticas há uma preocupação com a representatividade, mas sem garantias da aleatoriedade.
Sobre esse tipo de seleção, é correto afirmar que:
Gabarito: C
Distribuição hipergeométrica é uma distribuição de probabilidade discreta que descreve a probabilidade de k sucessos em n retiradas, sem reposição, de uma população de tamanho N que contém exatamente K sucessos, sendo cada retirada um sucesso ou um fracasso.
Probabilística: todos os elementos da população têm a mesma chance de serem escolhidos.
NÃO probabilística: os elementos da população NÃO têm a mesma chance de serem escolhidos.
Referência: https://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_hipergeom%C3%A9trica
A) ERRADA. Distribuição hipergeométrica é probabilística
B) ERRADA. Amostra probabilística é indicada para populações grandes.
C) CORRETA
D) ERRADA. Na seleção por conglomerados, os grupos são heterogêneos.
E) ERRADA. O erro está em "quantitativos".
Apenas uma correção ao comentário da Deborah: nos métodos probabilísticos, a distribuição de probabilidades de seleção dos indivíduos da população é conhecida, o que não significa que todos os indivíduos da população têm igual probabilidade de ser selecionado. Isso seria verdade no caso de amostras aleatórias. Vejam a questão Q987885.
a) a probabilidade de seleção t;
ERRADO: Não é possível afirmar que uma amostragem não probabilística segue uma distribuição específica.
b) a amostragem por julgamento é recomendada para os casos em que a
ERRADO: Em uma amostragem por julgamento os elementos da amostra são selecionados com base num julgamento do investigador. Por esse motivo não se permite generalizações para populações. Assim em uma população muito grande, o julgamento deverá ser feito em uma amostra muito grande, o que inviabilizaria o processo.
c) é frequentemente aplicada naqueles casos em que uma parte relevante da população está inacessível;
CORRETO: Deve-se considerar a utilização de amostragem probabilística sempre que as condições abaixo sejam cumpridas:
(1) Todos os elementos da minha população apresentam uma probabilidade maior que zero para ser selecionados na amostra.
(2) Conhecer precisamente a probabilidade para cada elemento, também chamado de probabilidade de inclusão
O segundo requisito é muito exigente. Todos os indivíduos que não podem ser selecionados em uma amostra normalmente são considerados como unidades fora de cobertura.
Por todas estas razões e por temas de custos, diversas vezes devemos recorrer a outras técnicas de amostragem, agrupadas dentro do que é conhecido como amostragem não probabilística.
d) a amostragem por cotas guarda semelhança com a seleção por conglomerados, em ;
ERRADO: A heterogeneidade do grupo é essencial para uma boa amostragem por conglomerados.
e) a amostragem em Bola de Neve se destaca entre os métodos não probabilísticos.
ERRADO: A amostragem em Bola de Neve se destaca entre os métodos não probabilísticos para levantamentos QUALITATIVOS.
AMOSTRAGEM ALEATÓRIA SIMPLES
A amostragem aleatória simples é a mais cobrada em provas de concursos. De forma bem resumida, podemos dizer que se trata da amostragem feita de forma que cada elemento da população tem a mesma chance de ser escolhido.
Por exemplo: queremos escolher algumas pessoas de uma empresa para realizar uma entrevista. Escrevemos os nomes de todos os funcionários em pedaços de papel de mesmo tamanho. Colocamos todos os nomes em um saco. Misturamos bem todos os papéis. Feito isto sorteamos 5 nomes. Este é um exemplo de amostragem aleatória simples.
Quando a população é descrita por uma variável contínua, não podemos mais falar em probabilidade de ocorrer um dado valor. Nesse caso, segundo William J Stevenson, em Estatística Aplicada à Administração, a amostra é aleatória se “a probabilidade de incluir na amostra qualquer intervalo de valores é igual à percentagem da população que está naquele intervalo”
AMOSTRAGEM ESTRATIFICADA
Há diversos outros tipos de amostragem. Na prática, muitas vezes a amostragem aleatória simples pode não ser a mais indicada. Mas, para concursos, é a mais importante.
Uma alternativa à amostragem aleatória é a amostragem estratificada. Nela, dividimos nossa população em extratos. Idealmente, cada extrato abriga elementos homogêneos.
Exemplo: estamos fazendo uma pesquisa sobre o perfil de consumo das pessoas de uma cidade. É possível que, para o tipo de produto a que se refere a pesquisa, seja interessante separar a população por idade. Dividimos nossa população em extratos. Um extrato para crianças, outro para jovens, outro para adultos e outro para idosos. Dentro de cada extrato fazemos uma amostragem aleatória.
Qual a vantagem disso? Se cada estrato for realmente homogêneo, a variabilidade dos dados, dentro de cada estrato, será pequena, o que permite que trabalhemos com amostras menores.
Vejamos um caso extremo. Que bom seria (para quem está fazendo a pesquisa) se todos os idosos do nosso estrato tivessem exatamente o mesmo perfil de consumo. Poderíamos tomar apenas um deles como a amostra (a amostra teria tamanho 1), de forma que conheceríamos muito bem o comportamento de todos eles.
Há duas formas de se realizar a amostragem por extratos.
Na primeira, fazemos uma alocação proporcional entre os extratos. Ou seja, os tamanhos das amostras a serem feitas em cada extrato são proporcionais ao tamanho do extrato. Assim, se 30% da população desta cidade é formado por crianças e nós iremos entrevistar ao todo 100 pessoas, seria interessante que 30 pessoas fossem crianças.
Um segundo modo se refere à alocação uniforme entre os extratos, tomando o mesmo número de elementos de cada extrato. Exemplo: vamos entrevistar 100 pessoas, divididas em 4 extratos (crianças, jovens, adultos e idosos). Tomamos 25 pessoas de cada extrato (números iguais, uniformes, para cada extrato, independente do tamanho de cada extrato).
Além da idade, outros critérios de formação de extratos poderiam ser: sexo, região geográfica, renda, profissão.
AMOSTRAGEM POR CONGLOMERADOS
Nesta amostragem nós dividimos novamente a população. Só que não nos preocupamos em separar a população em extratos com características semelhantes. Dividimos a população em conglomerados. Conglomerado são subconjuntos da população que, idealmente, são bastante heterogêneos, representando bem o que ocorre na população inteira.
Uma das grandes vantagens da amostragem por conglomerado é a redução de custos. Compõem o conglomerado elementos que estão fisicamente muito próximos. Por essa condição, embora fosse bem interessante que cada conglomerado tivesse elementos bem heterogêneos, isso acaba não ocorrendo.
Vejamos um exemplo, para ficar mais claro. O exemplo que segue foi retirado do livro “Estatística Geral e Aplicada” do Gilberto Martins. Desejamos selecionar uma amostra de chefes de família de uma cidade.
Suponha que, para o tipo de pesquisa, seria útil separar os chefes de família por idade. Até 30 anos; de 31 a 45; e de 45 em diante. Seria uma amostragem estratificada. Só que isso às vezes pode ser meio difícil. Às vezes não se tem, previamente, uma lista com todos os chefes de família (e suas respectivas idades). Às vezes até se tem parte dessa informação, mas pode ser que chefes de família de um mesmo estrato estejam muito espalhados na cidade, o que tornaria mais demorada (e cara) a amostragem.
Uma outra opção é a amostragem por conglomerado. Aqui entramos, de fato, no exemplo do livro do Martins. Podemos separar a cidade em quarteirões. Cada quarteirão é um conglomerado. Fazemos uma seleção dos conglomerados que serão pesquisados, por meio de uma amostra aleatória simples. Escolhidos os quarteirões, nos dirigimos a eles e entrevistamos todos os chefes de família que nele residem.
Seria ótimo se, em cada quarteirão, tivéssemos elementos bem heterogêneos, que representassem bem toda a população. Assim, precisaríamos de poucos quarteirões (poucos conglomerados) para ter uma boa noção do que ocorre na população.
Só que, pelo fato de os elementos de cada conglomerado estarem fisicamente ligados (todos os chefes de família de um quarteirão são vizinhos, moram perto uns dos outros), é difícil que os conglomerados sejam realmente heterogêneos. É bem possível que quarteirões formados por casas grandes tenham chefes de famílias com idade mais elevada, que já constituíram família, têm filhos, precisam de mais espaço. Pessoas que moram num mesmo quarteirão geralmente têm mesmo nível de renda, freqüentam os mesmos estabelecimentos (que ficam nas proximidades), etc, o que, dependendo da pesquisa, pode revelar elementos mais semelhantes (com tendência à homogeneidade) do que diferentes.
Para minimizar esse problema, é importante escolher um número maior de conglomerados.
AMOSTRAGEM SISTEMÁTICA
Caso os valores que se pretendam investigar não estejam em nenhuma ordem específica (relacionada com a variável pesquisada), é possível fazer a amostragem de forma “periódica”. Poderíamos, por exemplo, a cada dez itens da população, escolher um. Tomaríamos apenas o 10°, o 20°, o 30° e assim por diante.
Repare que o fato de os dados estarem ordenados não atrapalha na amostragem sistemática. O problema pode surgir quando há relação entre o critério de ordem dos dados e a variável estudada.
Vejamos um primeiro exemplo. Estamos estudando a altura de um certo grupo de pessoas. Poderíamos tomar uma lista de nomes em ordem alfabética e escolher um a cada 20 nomes. Esta é uma amostragem sistemática. Escolhidos os nomes, medimos as alturas das pessoas selecionadas. É razoável que a ordem alfabética não guarde qualquer relação com a altura da pessoa. A amostragem sistemática poderia ser feita sem problemas.
O problema que pode ocorrer na amostragem sistemática é os elementos estarem organizados segundo um critério que tenha relação com a variável pesquisada. Um exemplo interessante, tirado do livro “Estatística Aplicada à Administração”, do William J Stevenson, é o que segue. Imagine que queiramos pesquisar dados sobre imóveis de uma dada região. Vamos escolher os imóveis a serem pesquisados a partir da lista telefônica.
Caso a nossa lista telefônica traga as casas conforme sua ordem na rua, é possível que tenhamos um problema. É possível que casas de esquina (que nesta situação estariam igualmente espaçadas) tenham características diferentes das demais. Podem ser mais caras, terem um terreno maior, pagarem mais imposto, etc. Assim, pode ser que a amostragem sistemática resulte em tomarmos predominantemente casas de esquina, o que certamente vai trazer um erro na nossa conclusão sobre a distribuição dos dados para aquele bairro.
Neste caso, o problema foi que havia relação entre a variável pesquisada e a ordem segundo a qual estavam organizados os itens pesquisados.
AMOSTRAGEM POR JULGAMENTO
Todos os tipos de amostragem acima mencionados são ditos probabilísticos. Isto porque é possível determinarmos a probabilidade de cada elemento da população integrar a amostra. Com isso, é possível estimar o erro que cometemos quando usamos medidas calculadas na amostra para estimar as correspondentes medidas populacionais.
A amostragem não probabilística é aquela subjetiva, sem critérios objetivos. Trata–se da amostragem por julgamento. Neste caso, não é possível estimarmos os erros amostrais.
De forma geral, a amostragem por julgamento deve ser evitada. Há, contudo, situações em que ela é preferível à amostragem probabilística. Isto ocorre especialmente quando o tamanho da amostra é bem pequeno. Neste caso, a amostragem aleatória pode trazer resultados não representativos da população.
Um exemplo, extraído do livro “Estatística Aplicada à Administração”, do William J Stevenson, é o que segue.
Considere que uma cadeia de restaurantes quer experimentar uma nova técnica de serviço, empregando bandejas com aquecimento. Devido ao custo dos aparelhos, pode ser desejável que a experiência seja limitada a apenas dois restaurantes.
Neste caso, graças à experiência da equipe de administração dos restaurantes, é possível escolher dois restaurantes que já se sabe serem mais representativos do comportamento geral dos clientes.
AMOSTRAGEM POR CONVENIÊNCIA OU ACIDENTAL
Neste tipo de amostragem, o pesquisador toma os elementos que estejam mais facilmente acessíveis. Ele vai escolhendo, acidentalmente, elementos mais convenientes. Como exemplo temos aquelas pesquisas de opinião que são feitas frequentemente na Av. Paulista. Há aquele exército de pessoas com pranchetas na mão. Cada um deles vai acidentalmente selecionando sua "vítima". O pesquisador chega em quem ele acha que tem mais chance de parar para lhe ouvir e pergunta "posso fazer uma entrevista? é rapidinho"
AMOSTRAGEM POR QUOTAS OU PROPORCIONAL
Primeiro identificamos os grupos da população. Exemplo: determinada população tem 40% de homens e 60% de mulheres. Em seguida, será feita uma entrevista com 100 pessoas. O pesquisador então escolhe 40 homens e 60 mulheres, respeitando as proporções verificadas na população.
Veja que este tipo de amostragem é bastante similar à amostragem estratificada. A diferença crucial entre elas é a seguinte. Na amostragem estratificada, a seleção dos 40 homens e das 60 mulheres é feita aleatoriamente. Todos os homens têm igual chance de serem escolhidos, assim como todas as mulheres têm igual chance de serem escolhidas. Dentro de cada estrato a amostragem é aleatória. Por isso a amostragem estratificada é probabilística.
Já na amostragem por quotas, a escolha dos 40 homens e das 60 mulheres é feita por um método não probabilístico. Por exemplo, pode o pesquisador escolher os 40 homens por conveniência, bem como as 60 mulheres.
Amostragem
Tipo
Aleatória
probabilística
Estratificada
probabilística
Por conglomerados
probabilística
Sistemática
probabilística
Por julgamento
não probabilística
Por conveniência
não probabilística
Por quotas
não probabilística
Vamos analisar cada afirmação:
A) A probabilidade de seleção em amostras não probabilísticas não segue uma distribuição hipergeométrica, pois não há um processo probabilístico formal de seleção.
B) A amostragem por julgamento, um tipo de amostragem não probabilística, não é recomendada para casos em que a população em estudo é grande, pois pode introduzir vieses na seleção das unidades amostrais.
C) Amostragem não probabilística é frequentemente aplicada quando uma parte relevante da população está inacessível, mas isso não é uma característica exclusiva desse método. A inacessibilidade da população pode ser uma razão para utilizar amostragem não probabilística, mas não é uma condição necessária para sua aplicação.
D) A amostragem por cotas e a seleção por conglomerados são métodos distintos. Enquanto a amostragem por cotas envolve a seleção de indivíduos de subgrupos da população com base em características específicas até que as cotas pré-determinadas sejam atendidas, a seleção por conglomerados envolve a divisão da população em grupos (conglomerados) e a seleção de alguns desses grupos para a amostra.
E) A amostragem em Bola de Neve é um método de amostragem não probabilística onde os primeiros participantes da amostra são selecionados aleatoriamente e depois recrutam outros participantes conhecidos por eles, e assim por diante. Esse método é frequentemente utilizado em estudos qualitativos e em casos onde a população-alvo é difícil de ser alcançada. No entanto, não é o método mais comum em levantamentos quantitativos.
Portanto, a afirmação correta é:
C) é frequentemente aplicada naqueles casos em que uma parte relevante da população está inacessível.