Programa de computador identifica casos de duplicidade em artigos científicos publicados

Plagiar artigos científicos é uma prática que pode estar com os dias contados. Pelo menos se depender da novidade que vem do Centro Médico da Universidade do Sudoeste do Texas, nos Estados Unidos.

O grupo liderado pelo professor Harold Gardner desenvolveu um programa de computador que compara múltiplos documentos em bases de dados em busca de semelhanças no conteúdo. O software Etblast identifica a duplicação de palavras-chave e compara a proximidade e o encadeamento de palavras, entre outras variáveis.

A novidade oferece um método eficiente e rápido para conduzir buscas na literatura científica e permite aos editores de revistas identificar a ocorrência de práticas questionáveis de publicação. A ferramenta também é útil para pesquisadores que desejam verificar se e quando o tema do projeto em que estão trabalhando foi objeto de publicações anteriores, não apenas para ampliar o conhecimento, mas também para identificar possíveis colaboradores.

No desenvolvimento do Etblast, o grupo de Garner inicialmente usou o sistema para analisar mais de 62 mil textos publicados nos últimos 12 anos e disponíveis na base Medline, uma das principais na área médica. O software identificou que 0,04% dos textos com autores diferentes eram altamente semelhantes, em casos potenciais de plágio.

O número pode parecer significante, mas em uma base com 17 milhões de artigos representa cerca de 7 mil textos. O programa também identificou que 1,35% dos artigos com um ou mais autores iguais eram suficientemente semelhantes para serem considerados como publicações duplicadas dos mesmos dados, outra prática questionável. Os resultados foram descritos na edição de 15 de janeiro da revista Bioinformatics.

Na segunda fase do desenvolvimento, cujos resultados estão em comentário na edição de 24 de janeiro da Nature, o software foi aperfeiçoado e ganhou mais velocidade, tornando-se milhares de vezes mais rápido. Uma análise de 7 milhões de textos na Medline resultou em quase 70 mil artigos semelhantes.

“O plágio é a mais extrema e nefasta forma de publicação, mas submeter simultaneamente os mesmos resultados de pesquisas a diversos veículos ou repetir a publicação dos mesmos dados também podem ser considerados inaceitáveis em muitas circunstâncias”, disse Garner.

Mas o pesquisador lembra que, em relação a publicações repetidas, há algumas formas que podem ter valor para a comunidade científica. Um exemplo são atualizações dos progressos de estudos de longo prazo ou de análises longitudinais, que freqüentemente contêm reproduções literais de partes do texto original.

“Com nossa ferramenta, conseguimos identificar publicações semelhantes, mas nem o computador nem nós mesmos somos capazes de julgar se um artigo é um plágio. Essa tarefa cabe aos revisores, como os editores de publicações ou comitês de éticas das universidades, que são os grupos responsáveis para a determinação da legitimidade”, destacou Garner.

O pesquisador espera que o software possa ajudar a diminuir as práticas questionáveis na publicação científica. “À medida que ferramentas como o Etblast se tornarem mais conhecidas e usadas pelos editores e revisores durante o processo de submissão dos artigos, esperamos que o número de duplicações potenciais diminua consideravelmente”, disse.

O comentário A tale of two citations, de Mounir Errami e Harold Garner, pode ser lido por assinantes da Nature em www.nature.com.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.