Foram encontradas 5.939 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Acerca de inteligência artificial e machine learning, julgue o item que se segue.
O aprendizado não supervisionado se caracteriza pela utilização de dados previamente rotulados para treinar um modelo de machine learning, permitindo que ele aprenda padrões automaticamente a partir dos rótulos desses dados.
Acerca de inteligência artificial e machine learning, julgue o item que se segue.
Para avaliar o desempenho de um classificador em problemas de classificação com classes significativamente desbalanceadas, a métrica acurácia é a mais adequada, pois considera a proporção de previsões corretas em relação ao total de amostras.
Acerca de inteligência artificial e machine learning, julgue o item que se segue.
Diferentemente do aprendizado supervisionado e não supervisionado, o aprendizado por reforço baseia-se em um agente que interage com um ambiente e recebe recompensas ou penalidades conforme suas ações, buscando maximizar um retorno cumulativo ao longo do tempo.
Considerando os métodos HTTP utilizados em APIs REST, julgue o próximo item, a respeito de integração de dados e mecanismos de interoperabilidade.
O método POST é seguro e idempotente, pois a execução de múltiplas requisições resulta no mesmo estado final dos dados.
Considerando os métodos HTTP utilizados em APIs REST, julgue o próximo item, a respeito de integração de dados e mecanismos de interoperabilidade.
O método DELETE não é idempotente, pois, a partir da segunda execução, pode gerar respostas inconsistentes do servidor.
Considerando os métodos HTTP utilizados em APIs REST, julgue o próximo item, a respeito de integração de dados e mecanismos de interoperabilidade.
Os métodos GET e HEAD são considerados seguros, pois sua execução não deve modificar os dados armazenados no servidor, embora possa gerar efeitos colaterais indiretos, como registros de logs.
Julgue o próximo item, a respeito de gestão e governança de dados.
O DMBoK (Data Management Body of Knowledge) é um framework que descreve as melhores práticas de gestão de dados, focando nas tecnologias de armazenamento e processamento de dados, sem considerar aspectos relacionados a governança, qualidade ou segurança dos dados.
Julgue o próximo item, a respeito de gestão e governança de dados.
Os metadados são fundamentais para a governança de dados, pois fornecem informações sobre a origem, a estrutura, o significado e a qualidade dos dados, contribuindo para a rastreabilidade, segurança, interoperabilidade e conformidade regulatória.
Julgue o próximo item, a respeito de gestão e governança de dados.
A Infraestrutura Nacional de Dados Espaciais (INDE) é um componente estratégico para a governança de dados espaciais no Brasil, pois define padrões e promove a integração, a interoperabilidade e o compartilhamento de dados geoespaciais entre órgãos públicos, setores privados e a sociedade.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
A métrica lift é usada para medir a dependência entre dois itens em uma regra de associação: se o lift de uma regra de associação entre dois itens A e B for maior que 1, então A e B obrigatoriamente aparecerão em conjunto mais frequentemente do que seria esperado se A e B fossem independentes.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
As árvores de decisão são uma técnica de aprendizado supervisionado que é adequada para analisar, por exemplo, a influência de fatores na qualidade da carne bovina em um sistema de produção, permitindo avaliar variáveis tais como alimentação, genética, manejo e peso ao abate e gerando regras interpretáveis, que auxiliam na tomada de decisão com base nessas características.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
O K-means exige a definição do número de clusters como parâmetro de entrada e tem um desempenho eficiente em grandes conjuntos de dados, mas é sensível a outliers e só funciona bem para clusters esféricos e de densidade semelhante.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
O algoritmo Apriori gera primeiro todos os itemsets individuais (itens) e, em seguida, combina-os para gerar itemsets de tamanho maior. Já o algoritmo FP-growth constrói uma estrutura de dados compacta denominada FP-tree, permitindo a mineração de itemsets frequentes sem gerar candidatos. Quanto à eficiência, o Apriori é mais rápido que o FP-growth devido à simplicidade de sua abordagem.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
A PCA (análise de componentes principais) é uma técnica que transforma variáveis correlacionadas em componentes principais ortogonais, o que permite a redução da dimensionalidade dos dados; a seleção dos componentes principais é realizada com base na variância explicada por cada componente.
Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir.
O algoritmo Naive Bayes é inadequado para, por exemplo, a análise de dados de produção agrícola na previsão da qualidade de grãos de café, pois exige uma independência completa entre variáveis como pH do solo, umidade e temperatura, e não apresenta bons resultados quando essas variáveis são correlacionadas.
Em relação a BI (Business Intelligence) e visualização de dados, julgue o item que se segue.
Em uma arquitetura de BI típica, o data warehouse integra dados de várias fontes externas, realizando extração, transformação e carga (ETL) antes de eles serem disponibilizados para análise.
Em relação a BI (Business Intelligence) e visualização de dados, julgue o item que se segue.
Para um data warehouse com grande volume de dados históricos e consultas frequentes, o esquema estrela geralmente apresenta melhor desempenho que o esquema snowflake, pois minimiza a complexidade das junções entre tabelas.
Em relação a BI (Business Intelligence) e visualização de dados, julgue o item que se segue.
O gráfico de dispersão pode ser uma ferramenta útil para explorar a relação entre as variáveis, possibilitando uma análise visual inicial; no entanto, técnicas adicionais, como suavização por regressão local, transformação de variáveis ou o uso de gráficos alternativos (como histogramas bivariados), podem ser necessárias para revelar padrões mais claramente.
Julgue o próximo item, a respeito de bancos de dados relacionais e não relacionais.
O modelo relacional, embora seja eficiente para operações de leitura e escrita simples, pode se tornar ineficiente em situações que exijam processamento de grandes volumes de dados semiestruturados, como logs ou eventos. Já o modelo orientado a documentos é mais flexível para consultas complexas que envolvam múltiplas junções entre documentos, oferecendo melhor desempenho em comparação ao modelo relacional.
Julgue o próximo item, a respeito de bancos de dados relacionais e não relacionais.
Bancos de dados NO-SQL são mais adequados para situações em que os dados tenham de ser altamente consistentes e transacionais, uma vez que sua estrutura flexível permite validações de integridade referencial e controles complexos de relacionamento entre os dados.