Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame
chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades
avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses
registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:
Incorreta. Gabarito oficial da banca:
Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X
teste
Parabéns! Você acertou!
Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X