"Pesquisadores da Universidade do Estado da
Pensilvânia (Penn State), nos Estados Unidos,
investigaram até que ponto modelos de linguagem
natural como o ChatGPT, que usam inteligência artificial
para formular uma prosa realista e articulada em resposta
a perguntas de usuários, conseguem gerar conteúdo que
não se caracterize como plágio."Em relação ao trecho acima, transcrito do texto, é
CORRETO afirmar que

Question

Texto
O PLÁGIO ENCOBERTO EM TEXTOS DO CHATGPT
Fabrício Marques
(Fonte de pesquisa: FAPESP)
Estudos mostram como modelos de linguagem natural
podem ser fonte de má conduta acadêmica e indicam
formas de prevenir o problema    Pesquisadores da Universidade do Estado da
Pensilvânia (Penn State), nos Estados Unidos,
investigaram até que ponto modelos de linguagem
natural como o ChatGPT, que usam inteligência artificial
para formular uma prosa realista e articulada em resposta
a perguntas de usuários, conseguem gerar conteúdo que
não se caracterize como plágio. Isso porque esses
sistemas processam, memorizam e reproduzem
informações preexistentes, baseadas em gigantescos
volumes de dados disponíveis na internet, tais como
livros, artigos científicos, páginas da Wikipédia e notícias.    O grupo analisou 210 mil textos gerados pelo
programa GPT-2, da startup OpenAI, criadora do
ChatGPT, em busca de indícios de três diferentes tipos
de plágio: a transcrição literal, obtida copiando e colando
trechos; a paráfrase, que troca palavras por sinônimos a
fim de obter resultados ligeiramente diferentes; e o uso
de uma ideia elaborada por outra pessoa sem mencionar
sua autoria, mesmo que formulada de maneira diferente.    A conclusão do estudo foi de que todos os três
tipos de cópia estão presentes. E, quanto maior é o
conjunto de parâmetros usados para treinar os modelos,
mais frequentemente a má conduta foi registrada. A
análise utilizou dois tipos de modelos os pré-treinados,
baseados em um amplo espectro de dados, e os de
ajuste fino, aprimorados pela equipe da Penn State a fim
de concentrar e refinar a análise em um conjunto menor
de documentos científicos e jurídicos, artigos acadêmicos
relacionados à Covid-19 e solicitações de patentes. A
escolha desse tipo de conteúdo não foi ocasional
nesses textos, a prática de plágio é considerada muito
problemática e não costuma ser tolerada.    No material gerado pelos pré-treinados, a
ocorrência mais prevalente foi de transcrições literais,
enquanto nos de ajuste fino eram mais comuns
paráfrases e apropriação de ideias sem referência à fonte. "Constatamos que o plágio aparece com diferentes sabores", disse um dos autores do trabalho, Dongwon Lee, cientista da computação da Faculdade de
Tecnologia e Ciências da Informação da Penn State, de
acordo com o serviço de notícias Eurekalert. Os achados
serão divulgados com mais detalhes na Web Conference,
um evento da ACM que acontece entre 30 de abril e 4 de
maio na cidade de Austin, nos Estados Unidos.    O ChatGPT é um entre vários sistemas baseados
em inteligência artificial e ganhou grande notoriedade
porque foi disponibilizado para uso público. Desde
novembro, já foi testado por mais de 100 milhões de
pessoas e impressionou por sua capacidade de gerar
textos coerentes que mimetizam a escrita dos seres
humanos (ver Pesquisa FAPESP n° 325). Uma das
polêmicas que levantou envolveu justamente a originalidade de suas respostas e o receio de que se transforme em uma fonte de má conduta acadêmica.   "As pessoas perseguem grandes modelos de linguagem porque, quanto maior um modelo fica, mais suas habilidades aumentam", disse o autor principal do trabalho, Jooyoung Lee, estudante de doutorado na Faculdade de Ciências e Tecnologia da Informação da Penn State. Ferramentas de escrita de inteligência artificial conseguem criar respostas únicas e individualizadas a perguntas apresentadas por usuários, mesmo extraindo as informações de um banco de dados. Essa habilidade, contudo, não livra a ferramenta de ser uma fonte de plágio, mesmo em formatos mais difíceis de detectar. "Ensinamos os modelos a imitar a escrita humana, mas não os ensinamos a não plagiar", afirmou Lee.    Várias ferramentas estão sendo desenvolvidas para detectar conteúdo gerado por softwares de inteligência artificial. A própria OpenAI desenvolveu umprograma capaz de apontar textos feitos por robôs. Há outras do gênero na internet, como o Writer AI Content Detector e o Content at Scale. Como os sistemas de linguagem natural estão em desenvolvimento, também será necessário atualizar continuamente a tecnologia para rastrear sua produção.    Uma equipe da Escola de Engenharias e Ciências Aplicadas da mesma Penn State mostrou que é possível treinar as pessoas para identificar esses textos, sem precisar depender exclusivamente de programas detectores. Apresentado em fevereiro em um congresso da Associação para o Avanço da Inteligência Artificial realizado em Washington, Estados Unidos, o estudo liderado pelo cientista da computação Chris Callison-Burch mostrou que essas ferramentas já são muito eficientes em produzir prosa fluente e seguir as regras gramaticais. "Mas eles cometem tipos distintos de erros que podemos aprender a identificar", disse ao blog Penn Engineering Today o cientista da computação Liam Dugan, aluno de doutorado da Penn State e um dos autores do artigo.    O experimento utilizou um jogo disponível na internet, chamado Real or Fake Text (Texto real ou falso). O grupo apresentou aos participantes do estudo, todos eles alunos de graduação ou pós-graduação de um curso de inteligência artificial da Penn State, sentenças cujo início foi escrito por seres humanos, mas que, a partir de certo ponto, reproduziam respostas formuladas por modelos de linguagem. Os textos selecionados provinham de notícias publicadas na imprensa, discursos presidenciais, histórias de ficção e receitas culinárias. Os jogadores eram convidados a apontar em que ponto começava o trecho escrito por inteligência artificial e explicar por que apostavam naquela localização. Quando acertavam, eles recebiam pontos. As principais razões apontadas eram o surgimento de conteúdo irrelevante, de erros lógicos, de sentenças contraditórias, de frases muito genéricas e de problemas com a gramática. Foi mais fácil acertar nas receitas culinárias do que nas outras narrativas.    A pontuação dos participantes foi significativamente maior do que se as respostas fossem feitas ao acaso, mostrando que os textos gerados por robôs são detectáveis. Embora as habilidades dos jogadores variassem bastante, o desempenho deles melhorava com o uso do jogo em um sinal de aprendizado. "Cinco anos atrás, os modelos não conseguiam se concentrar no assunto ou produzir uma frase fluente", afirmou Dugan. "Agora, eles raramente cometem erros gramaticais. Nosso estudo identifica tipos
de erros cometidos por chatbots, mas é importante ter em
mente que eles continuarão a evoluir. As pessoas
deverão seguir treinando para reconhecer a diferença e
trabalhar com o software de detecção como um complemento".(Fonte: https://revistapesquisa.fapesp.br/o-plagio-encobertoem-textos-do-chatgpt/) "Pesquisadores da Universidade do Estado da
Pensilvânia (Penn State), nos Estados Unidos,
investigaram até que ponto modelos de linguagem
natural como o ChatGPT, que usam inteligência artificial
para formular uma prosa realista e articulada em resposta
a perguntas de usuários, conseguem gerar conteúdo que
não se caracterize como plágio."Em relação ao trecho acima, transcrito do texto, é
CORRETO afirmar que Alternativa A: existe uma oração com função adjetiva que caracteriza um termo anterior, "modelos de linguagem natural como o ChatGPT", e que por isso é classificada como apositiva. Ou Alternativa B: A ausência do artigo antes de "Pesquisadores da Universidade do Estado da Pensilvânia" não interfere na definição do número de pesquisadores envolvidos no
projeto, o que fica bastante claro no texto. Ou Alternativa C: existe uma afirmação pressuposta de que modelos de
linguagem natural como o ChatGPT conseguem gerar
conteúdo que não se caracterize como plágio. Essa
informação se mantém mesmo com a negação da oração
principal. Ou Alternativa D: "o ChatGPT" é apresentando como uma informação de modo, sinalizada pela presença da palavra de natureza adverbial "como". Ou Alternativa E: pela norma padrão da língua portuguesa, a palavra "para" pode ser substituída por "afim de" e possui o sentido de finalidade.

Qconcursos · Accepted Answer

Alternativa [C] existe uma afirmação pressuposta de que modelos de
linguagem natural como o ChatGPT conseguem gerar
conteúdo que não se caracterize como plágio. Essa
informação se mantém mesmo com a negação da oração
principal. Tema central da questão: Pressuposição linguística e funções morfossintáticas da palavra “como”, com foco em análise sintática e semântica de elementos de coesão e sentidos implícitos, conforme exigência de concursos para Professor de Língua Portuguesa.

Justificativa para a alternativa correta (C):

A alternativa C está correta por tratar do conceito de pressuposição, que consiste em informações implicitamente admitidas numa frase. No trecho: “investigaram até que ponto modelos de linguagem natural como o ChatGPT... conseguem gerar conteúdo que não se caracterize como plágio”, pressupõe-se que tais modelos conseguem gerar conteúdo não plagiado. Segundo Bechara e Cunha & Cintra, certos verbos e estruturas, como “até que ponto conseguem”, mantêm o pressuposto mesmo quando a oração principal é negada. Ou seja, caso negássemos (“não investigaram até que ponto...”), a ideia de que tais modelos conseguem gerar conteúdos originais permaneceria subentendida.

Análise das alternativas incorretas:

A) Incorreta. A oração “que usam inteligência artificial...” é oração subordinada adjetiva restritiva, não apositiva. Restritivas caracterizam o termo imediatamente anterior sem vírgula, já as apositivas explicam e vêm entre vírgulas (ver Bechara, “Moderna Gramática Portuguesa”).
B) Incorreta. Não se pode afirmar com segurança o número de “pesquisadores” apenas pela ausência de artigo; o texto tampouco esclarece esse ponto.
D) Incorreta. A palavra “como”, nesse contexto, não indica modo, mas introduz exemplo, funcionando como conjunção comparativa: “modelos de linguagem natural como o ChatGPT”. (Cunha & Cintra)
E) Incorreta. Não se pode substituir “para” por “afim de” nesse contexto. O correto seria “a fim de”, com sentido de finalidade, distinguindo-se de “afim”, adjetivo (gramáticas normativas).

Estratégia para questões semelhantes:
Atente-se a implícitos e sentidos pressupostos, interrogando se determinada informação permanece quando a oração é negada. Examine o valor semântico do “como”, distinguindo entre exemplo, comparação ou modo – iniciativa comum em pegadinhas. Consulte gramáticas confiáveis para identificar nuances de conjunções e orações adjetivas.

Bons estudos! Gostou do comentário? Deixe sua avaliação aqui embaixo!

🚀 Mais performance?

🚀 Mais performance?

"Pesquisadores da Universidade do Estado da Pensilvânia (Pe...

Gabarito comentado

Clique para visualizar este gabarito

Resumos relacionados

Fonologia: Conceitos Fundamentais e Dicas para Concursos

Questões de assuntos semelhantes

Provas relacionadas