Petition Closed
Petitioning Presidente do CNPq Hernan Chaimovich Guralnik and 1 other

Petição para a retirada dos captchas dos currículos da Plataforma Lattes

O Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), órgão do Ministério da Ciência, Tecnologia e Inovação (MCTI) para o incentivo à pesquisa no Brasil, teve a excelente iniciativa de criação de um banco de registros nacional de currículos de pesquisadores nos meados dos anos 1980. A primeira captação de dados foi realizada em papel mas com algumas etapas apoiadas por um sistema computacional. Ao final dos anos 1990 o CNPq, conjuntamente com universidades e empresas, desenvolveu a Plataforma Lattes visando à padronização dos dados já coletados, e também a uma forma mais ágil de registro dos currículos de pesquisadores no âmbito do MCTI.

Hoje, é inegável que o currículo Lattes é um padrão nacional e internacional que mantém um registro da vida pregressa e atual de estudantes, pesquisadores e acadêmicos no Brasil. A Plataforma Lattes, destaque no contexto internacional como um repositório curricular ímpar, contém atualmente mais de 4 milhões de currículos cadastrados e mais de 19 milhões de publicações registradas. Esta Plataforma transformou-se em um repositório único e precioso para a coleta de dados e para a análise de informações relacionadas à ciência brasileira, consolidando-se em um modelo que assegura ao CNPq confiabilidade nas evoluções implementadas nessa ferramenta.

Até 28 de abril de 2015 os currículos Lattes eram livremente disponibilizados para consulta e coleta de dados. Após essa data o CNPq adotou um sistema de verificação/validação que emprega o recurso do captcha para o acesso aos currículos. A adoção desse sistema, segundo o CNPq, deve-se à demanda de usuários para evitar a extração de informações e a sua publicação indevida por sites não autorizados (entenda-se como sites comerciais, já relatado na seguinte página).

Os dados nos currículos Lattes são informações públicas (a plataforma preserva as informações individuais) que muitas universidades, centros e institutos de pesquisa, professores e alunos têm utilizado para fins de pesquisa não-comercial. Em particular, todos os programas brasileiros de pós-graduação têm utilizado a Plataforma Lattes para coleta de dados e envio de relatórios de produção acadêmica à Plataforma Sucupira - nova ferramenta integradora dos dados e informações dos programas de pós-graduação do país, lançada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) em março de 2014 para ser a fonte de referência do Sistema Nacional de Pós-Graduação. Para exemplificar, em 2012, foram avaliados pela CAPES 3.342 programas de pós-graduação (entre doutorados e mestrados, acadêmicos ou profissionalizantes). Ao todo, foram consideradas informações sobre a produção bibliográfica de aproximadamente 72.802 professores doutores (permanentes, colaboradores ou visitantes). Com a adoção dos captchas, serão necessárias mais de 101 horas-homem somente para digitar os caracteres a fim de acessar uma única vez os mesmos 72.802 currículos (assumindo 5 segundos para inserir os caracteres exigidos). A leitura e coleta de dados certamente demanda ainda mais tempo. Se considerarmos 1 minuto para ler e extrair a informação bibliográfica de cada currículo, serão necessárias mais de 1.213 horas.

Os currículos Lattes são extensamente utilizados pela comunidade acadêmica. Se apenas 1% (i.e., 40 mil) dos currículos forem consultados diariamente, serão necessárias mais de 55 horas-homem para simplesmente digitar os caracteres para validar o acesso pelo captcha. O custo de energia e recursos que devem ser gastos por essas horas-extra têm um grande impacto que merece ser reavaliado pelo CNPq.

É importante frisar que o CNPq tem como política fornecer, para cada instituição, uma única conta para acesso aos dados consolidados de seu corpo de alunos, pesquisadores e professores, mas tal conta não é facilmente franqueada (como indicado no seguinte artigo da Revista FAPESP). Dentre as regras para acesso (pelo serviço web de extração de currículos) determinadas pelo CNPq, a instituição deve informar um endereço IP de onde partirão as requisições e somente esse IP tem permissão de extrair os currículos, além de que é indicado utilizar os dados relacionados apenas à própria instituição. Assim, trabalhos transversais, que exploram mais de uma instituição, não podem ser realizados.

Os captchas e a falta da livre disponibilização dos dados dos currículos Lattes, nos termos da Lei de Acesso à Informação (Nº 12.527), são um freio à promoção da Ciência Brasileira (já discutido na seguinte página). As informações curriculares são bloqueadas para acesso a motores de busca que indexam produções bibliográficas (como o Google Acadêmico e do Microsoft Academic Search). Nenhum currículo é acessado sem a validação pelo captcha. A promoção dos trabalhos dos pesquisadores registrados na Plataforma Lattes é restringida, perdendo-se assim uma oportunidade de incentivar sua visibilidade e aumentar as citações de trabalhos científicos brasileiros. Adicionalmente, possíveis avaliadores estrangeiros terão que submeter-se ao mesmo mecanismo de validação para acessar os currículos, restringindo também o impacto da ciência nacional no exterior. Os captchas desencorajam qualquer tipo de uso que considera dados da Plataforma Lattes, tais como avaliações, identificação de especialistas, agrupamentos de pesquisadores pelas coautoria, cruzamentos de informações, entre outras diversas análises propiciadas pela riqueza de dados dessa valiosa fonte. Outra questão importante a ser mencionada diz respeito à acessibilidade para pessoas com necessidades especiais. Os captchas são inconvenientes para pessoas com deficiência visual.

Muitos trabalhos acadêmicos têm se beneficiado da Plataforma Lattes por meio do uso de ferramentas de software-livre para a coleta de dados. O uso dos captchas nos currículos inviabiliza pesquisas acadêmicas que visam explorar e descobrir conhecimento científico nos dados nela registrados. Os pesquisadores de dados, como bibliometristas e cientometristas, ficam impossibilitados de efetivar trabalhos caracterizando e/ou evidenciando o crescimento da ciência nacional. Há muita ciência que pode ser feita da análise dos currículos, e essa ciência é fundamental para o melhor planejamento das instituições de ensino e pesquisa.

Esperamos que uma solução para a retirada dos captchas seja encontrada. Uma alternativa para a análise de dados da Plataforma Lattes pode ser oferecida por meio de um servidor computacional a partir do qual o conteúdo da plataforma, atualizado, por exemplo, uma vez por mês, permitiria o acesso de forma sistematica. Plataformas internacionais, como o Digital Bibliography & Library Project (DBPL), da Universidade de Trier, Alemanha, oferecem serviços livres para todos seus dados. Essa abordagem facilitaria o desenvolvimento de softwares que demandam consulta de grandes volumes de dados como ocorre na Plataforma Lattes.

Os dados da Plataforma Lattes são um patrimônio da Ciência Brasileira. O CNPq tem realizado um extraordinário papel ao implementar a Plataforma. 

Resumindo, a adoção de captcha nos currículos Lattes:

  • Gera um custo elevado, oneroso e desnecessário para a coleta de dados;
  • Constitui um freio à promoção da Ciência Brasileira;
  • Desencoraja a consulta de dados da Plataforma Lattes;
  • Diminui a visibilidade e o impacto da produção científica brasileira nos âmbitos nacional e internacional; e
  • Impossibilita estudos acadêmicos envolvendo mais de uma instituição, gerando prejuízo à Ciência Brasileira.

Com estes argumentos, os peticionários apelam ao CNPq para que retire os captchas dos currículos da Plataforma Lattes.

This petition was delivered to:
  • Presidente do CNPq
    Hernan Chaimovich Guralnik
  • Diretor de Gestão e TI do CNPq
    Luiz Alberto de Freitas Brandão


    Jesús Mena-Chalco started this petition with a single signature, and now has 3,354 supporters. Start a petition today to change something you care about.




    Can you help this campaign win?