No ecossistema Python, diversas bibliotecas são amplamente ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: Alternativa A
Tema central: A questão aborda o conhecimento sobre as principais bibliotecas Python utilizadas em ciência de dados, aprendizado de máquina e processamento de linguagem natural (PLN). Para acertar, o aluno precisa conhecer as funcionalidades mais relevantes dessas ferramentas, habilidade essencial para concursos na área de programação e dados.
Resumo teórico: Em ciência de dados, cada biblioteca Python tem um foco específico: processar textos, construir modelos de machine learning, manipular dados tabulares, ou criar visualizações. Saber diferenciar esses papéis ajuda a evitar confusões e erros comuns nos exames.
Justificativa da alternativa correta:
A) spaCy é dedicada ao Processamento de Linguagem Natural. Ela facilita tarefas como tokenização (quebrar o texto em palavras ou frases), lematização (reduzir palavras às formas básicas), reconhecimento de entidades nomeadas (identificar nomes próprios, datas, etc.) e oferece modelos pré-treinados para diferentes idiomas. Para confirmar, veja a documentação oficial: spaCy Documentation.
Análise das alternativas incorretas:
B) TensorFlow é voltado para aprendizado profundo, não para manipulação de DataFrames ou consultas SQL. Essas funções são da pandas e do SQLAlchemy.
C) Apache Arrow é criado para formato de dados em memória otimizado, não para construir redes neurais. Quem faz isso são frameworks como TensorFlow e PyTorch.
D) Scikit-learn (sklearn) é para modelagem preditiva (classificação, regressão, clustering), não para visualização de dados. Visualizações são com matplotlib, seaborn ou plotly.
E) PyTorch é amplamente usado para redes neurais e aprendizado de máquina, não apenas manipulação de arquivos. A alternativa traz uma descrição incorreta e limitante.
Estratégia: Ao ler questões desse tipo, associe as palavras-chave das alternativas ao uso principal da biblioteca. Evite confundir funções semelhantes e desconfie de alternativas que ampliam ou restringem de modo exagerado o papel da ferramenta.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
TensorFlow: biblioteca para deep learning e redes neurais.
Apache Arrow: plataforma para processamento de dados em memória de forma eficiente e interoperável entre diferentes sistemas.
Scikit-learn: principal biblioteca para algoritmos de machine learning clássicos (classificação, regressão, clusterização, etc.).
PyTorch: uma das bibliotecas mais importantes para deep learning e redes neurais.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo