Expressões regulares compreendem uma ferramenta de extrema ...

Próximas questões
Com base no mesmo assunto
Q3331188 Programação
Expressões regulares compreendem uma ferramenta de extrema importância para o processamento de arquivos de texto visando a detecção de padrões. Na bioinformática, expressões regulares são comumente utilizadas para detectar padrões de texto. A linguagem de programação python contém suas funcionalidades de expressão regular implementadas no módulo re. Considerando um arquivo texto contendo as sete linhas abaixo, a opção com o número de linhas distintas, que seriam selecionadas pela expressão regular ‘^ID\d+\.\d+$’, é:


ID34343.A ID34HN43.1 ID985433230 ID852495_23 _ID423243.1 ID2544343.97 ID1.1
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

```html

A alternativa correta é: E - duas linhas.

Expressões regulares são uma ferramenta essencial para o processamento de texto, permitindo a detecção e manipulação de padrões. Na linguagem Python, essas funcionalidades são implementadas no módulo re, que facilita a busca, substituição e divisão de strings com base em padrões.

A expressão regular fornecida na questão é ^ID\d+\.\d+$. Vamos entender o que cada parte dessa expressão significa:

  • ^ - Indica o início da linha.
  • ID - A linha deve começar com a string literal "ID".
  • \d+ - Representa uma ou mais ocorrências de dígitos.
  • \. - Representa um ponto literal. O ponto, por si só, é um caractere especial em expressões regulares e precisa ser escapado com uma barra invertida (\).
  • \d+ - Representa uma ou mais ocorrências de dígitos novamente.
  • $ - Indica o fim da linha.

Com base na expressão regular, buscamos linhas que:

  • Começam com "ID".
  • São seguidas por uma sequência de um ou mais dígitos.
  • Apresentam um ponto (.) logo após esses dígitos.
  • Terminam com um ou mais dígitos após o ponto.

Vamos verificar quais linhas do texto fornecido atendem a esses critérios:

  1. ID34343.A - Incorreto, pois termina com uma letra.
  2. ID34HN43.1 - Incorreto, devido à presença de letras entre os dígitos.
  3. ID985433230 - Incorreto, pois não contém um ponto seguido de dígitos.
  4. ID852495_23 - Incorreto, pois contém um sublinhado (_) em vez de um ponto.
  5. _ID423243.1 - Incorreto, pois não começa com "ID".
  6. ID2544343.97 - Correto, atende a todos os critérios.
  7. ID1.1 - Correto, atende a todos os critérios.

Portanto, apenas duas linhas (ID2544343.97 e ID1.1) satisfazem a expressão regular, justificando a alternativa E - duas linhas.

Vamos analisar as alternativas incorretas:

  • A - sete linhas: Todas as linhas não atendem aos critérios.
  • B - nenhuma linha: Identificamos duas linhas válidas.
  • C - cinco linhas: A quantidade de linhas válidas é menor.
  • D - seis linhas: Apenas duas linhas são válidas.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

```

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo