Questões de Concurso
Foram encontradas 277.729 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Um pesquisador está analisando a relação entre duas variáveis:X (quantidade de certo fertilizante aplicado em uma produção) e (produtividade agrícola). Sabendo que o par (X, Y) segue, conjuntamente, uma distribuição normal bivariada, ele obteve a média condicional na forma E[Y|X = x] =500+30x para descrever a produtividade esperada com base na quantidade x desse tipo de fertilizante, além das informações apresentadas a seguir.
Com base nessas informações, julgue o item a seguir.
A variância de Y + X é igual a 2.525 (kg/hectare)2.
Um pesquisador está analisando a relação entre duas variáveis:X (quantidade de certo fertilizante aplicado em uma produção) e (produtividade agrícola). Sabendo que o par (X, Y) segue, conjuntamente, uma distribuição normal bivariada, ele obteve a média condicional na forma E[Y|X = x] =500+30x para descrever a produtividade esperada com base na quantidade x desse tipo de fertilizante, além das informações apresentadas a seguir.
Com base nessas informações, julgue o item a seguir.
O desvio padrão de E[Y|X] é igual a 150 kg por hectare.
Com relação a processos de banco de dados ETL (extração, transformação e carga), julgue o item subsequente.
Na extração incremental, apenas os dados alterados desde a última carga são extraídos, tornando o processo mais eficiente que a extração full, que recupera todos os dados da fonte.
Com relação a processos de banco de dados ETL (extração, transformação e carga), julgue o item subsequente.
Na modelagem de data warehouses, a abordagem top-down torna o processo ETL mais flexível e adaptável a mudanças nos requisitos de negócio, enquanto a abordagem bottom-up exige um ETL rígido e pouco adaptável a novas necessidades.
Com referência à matemática computacional e à ciência da computação aplicadas, julgue o item a seguir.
A notação Big O é utilizada para descrever o comportamento assintótico de um algoritmo, fornecendo um limite superior para o tempo de execução ou uso de memória em função do tamanho da entrada.
Acerca de inteligência artificial e machine learning, julgue o item que se segue.
O aprendizado não supervisionado se caracteriza pela utilização de dados previamente rotulados para treinar um modelo de machine learning, permitindo que ele aprenda padrões automaticamente a partir dos rótulos desses dados.
Considerando os métodos HTTP utilizados em APIs REST, julgue o próximo item, a respeito de integração de dados e mecanismos de interoperabilidade.
O método POST é seguro e idempotente, pois a execução de múltiplas requisições resulta no mesmo estado final dos dados.
Considerando os métodos HTTP utilizados em APIs REST, julgue o próximo item, a respeito de integração de dados e mecanismos de interoperabilidade.
O método DELETE não é idempotente, pois, a partir da segunda execução, pode gerar respostas inconsistentes do servidor.
Considerando os métodos HTTP utilizados em APIs REST, julgue o próximo item, a respeito de integração de dados e mecanismos de interoperabilidade.
Os métodos GET e HEAD são considerados seguros, pois sua execução não deve modificar os dados armazenados no servidor, embora possa gerar efeitos colaterais indiretos, como registros de logs.
Julgue o próximo item, a respeito de gestão e governança de dados.
O DMBoK (Data Management Body of Knowledge) é um framework que descreve as melhores práticas de gestão de dados, focando nas tecnologias de armazenamento e processamento de dados, sem considerar aspectos relacionados a governança, qualidade ou segurança dos dados.
Julgue o próximo item, a respeito de gestão e governança de dados.
Os metadados são fundamentais para a governança de dados, pois fornecem informações sobre a origem, a estrutura, o significado e a qualidade dos dados, contribuindo para a rastreabilidade, segurança, interoperabilidade e conformidade regulatória.
Julgue o próximo item, a respeito de gestão e governança de dados.
A Infraestrutura Nacional de Dados Espaciais (INDE) é um componente estratégico para a governança de dados espaciais no Brasil, pois define padrões e promove a integração, a interoperabilidade e o compartilhamento de dados geoespaciais entre órgãos públicos, setores privados e a sociedade.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
A métrica lift é usada para medir a dependência entre dois itens em uma regra de associação: se o lift de uma regra de associação entre dois itens A e B for maior que 1, então A e B obrigatoriamente aparecerão em conjunto mais frequentemente do que seria esperado se A e B fossem independentes.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
O K-means exige a definição do número de clusters como parâmetro de entrada e tem um desempenho eficiente em grandes conjuntos de dados, mas é sensível a outliers e só funciona bem para clusters esféricos e de densidade semelhante.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
O algoritmo Apriori gera primeiro todos os itemsets individuais (itens) e, em seguida, combina-os para gerar itemsets de tamanho maior. Já o algoritmo FP-growth constrói uma estrutura de dados compacta denominada FP-tree, permitindo a mineração de itemsets frequentes sem gerar candidatos. Quanto à eficiência, o Apriori é mais rápido que o FP-growth devido à simplicidade de sua abordagem.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
A PCA (análise de componentes principais) é uma técnica que transforma variáveis correlacionadas em componentes principais ortogonais, o que permite a redução da dimensionalidade dos dados; a seleção dos componentes principais é realizada com base na variância explicada por cada componente.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
O algoritmo Naive Bayes é inadequado para, por exemplo, a análise de dados de produção agrícola na previsão da qualidade de grãos de café, pois exige uma independência completa entre variáveis como pH do solo, umidade e temperatura, e não apresenta bons resultados quando essas variáveis são correlacionadas.
Em relação a BI (Business Intelligence) e visualização de dados, julgue o item que se segue.
Em uma arquitetura de BI típica, o data warehouse integra dados de várias fontes externas, realizando extração, transformação e carga (ETL) antes de eles serem disponibilizados para análise.
Em relação a BI (Business Intelligence) e visualização de dados, julgue o item que se segue.
Para um data warehouse com grande volume de dados históricos e consultas frequentes, o esquema estrela geralmente apresenta melhor desempenho que o esquema snowflake, pois minimiza a complexidade das junções entre tabelas.
Em relação a BI (Business Intelligence) e visualização de dados, julgue o item que se segue.
O gráfico de dispersão pode ser uma ferramenta útil para explorar a relação entre as variáveis, possibilitando uma análise visual inicial; no entanto, técnicas adicionais, como suavização por regressão local, transformação de variáveis ou o uso de gráficos alternativos (como histogramas bivariados), podem ser necessárias para revelar padrões mais claramente.