Guia Rápido para Submissão Anônima de Código e Dados: é Fácil

Guia Rápido para Submissão Anônima de Código e Dados: é Fácil

Por Mirella M. Moro

Resumo. Muitos veículos de publicação exigem submissão anônima não apenas do texto, mas também de código e conjunto de dados utilizados. Porém, muitas pessoas não sabem que existem soluções online para garantir tal armazenamento de modo perene e anônimo para submissão. Este artigo apresenta um guia rápido das ferramentas mais comuns a seu dispor.

Em um artigo anterior (Moro, 2021), escrevi sobre submissão anônima de textos científicos, o qual recebeu uma sugestão de continuação: como submeter código e dados anonimamente (obrigada prof. Marcelo Finger!). Como boa apreciadora de ideias bacanas, resolvi organizar este conjunto de dicas específicas para anonimizar essa parte crucial de nosso trabalho.

Compartilhar Ciência é Preciso

Antes de tudo, é importante perceber a importância da tarefa não apenas para submissão anônima. Compartilhar código e dados é um passo essencial para garantir reprodutibilidade, transparência e replicabilidade de soluções computacionais. Mas não é só isso. Cada vez mais tem-se falado sobre ciência aberta para indicar a necessidade de disponibilizar publicamente qualquer artefato científico (Kidwell et al, 2016; Popkin, 2019). Em Ciência da Computação (e áreas similares), esses artefatos geralmente incluem código fonte e dados. Veja que compartilhar código pode ser simples como colocá-lo disponível em um repositório GitHub. Porém, compartilhar dados geralmente envolve outras questões como privacidade e proveniência, as quais você deve resolver antes de compartilhá-los.

Sugestões de como compartilhar código e dados aparecem em vários websites. Porém, é necessário enfatizar a principal mensagem de todos eles:

Existem sistemas online específicos para armazenamento de código e dados. Não forneça preprints, postprints e conjuntos de dados de sistemas não persistentes, como seu website pessoal (em seu servidor pessoal ou de sua instituição) ou armazenamento em nuvem comum (por exemplo, Dropbox e Google Drive). Todos esses sistemas são realmente voláteis e os dados eventualmente desaparecerão.

Ciência e pesquisa precisam de seu conhecimento produzido e de seus artefatos para sempre – e sim, qualquer conhecimento produzido é importante para a sociedade como um todo. É por isso que seus dados devem ser liberados sob uma licença adequada e permanecer em repositórios arquivados onde ninguém, nem mesmo você, pode excluí-los.

De qualquer forma, a opção mais simples que existe no momento de submissão do texto é adicionar uma frase no estilo: 

“Link para conjunto de dados e código é omitido para avaliação anônima.” 

Nesse caso, você e seu time assumem o compromisso de publicar dados e código na versão final do artigo. A vantagem é que você não precisa decidir onde serão publicados no momento da submissão. Mas é só uma maneira de postergar a decisão, certo? 

A seguir, estão as dicas mais gerais e uma seção específica para tecnologias atuais que permitem anonimizar código e dados, e toda a pesquisa realizada.

Dicas Gerais

Os cuidados para você e seu time garantirem que submissão anônima de código e conjunto de dados aplicam-se a todos os elementos que compõem código e dados. Ou seja, lembre-se de conferir essas dicas para arquivos principais e bibliotecas, bem como arquivos descritivos de metadados e leia-me (readme). 

  1. Omitir todas as informações sobre a autoria. Apagar ou esconder nomes próprios e de instituições, título do projeto de pesquisa e nome de sua agência de fomento com o número do projeto, links externos para páginas pessoais e institucionais, entre outras. Apagar ou esconder nomes que identificam contas, como por exemplo, o seu login do GitHub. Evite usar esses nomes como parte dos nomes dos arquivos e de bibliotecas também.
  2. Preservar anonimato em documentos externos. Essa é uma falha comum de passar despercebida: a equipe de autoria foca em manter todas as informações da submissão no anonimato mas esquece das informações externas que são referenciadas no seu código. 
  3. Preservar anonimato em printscreens, figuras e formulários. Ao realizar um printscreen da sua ferramenta ou do código, verifique as informações de autoria também, como por exemplo, o nome da ferramenta que é único e uma busca pelo mesmo leva facilmente à página do seu projeto. Imagens fazem parte da submissão e precisam necessariamente atender aos critérios de anonimato. Igualmente, às vezes é necessário apresentar as perguntas de formulários de avaliação e outros itens, sendo mais fácil adicionar o link para o mesmo no readme. O problema é que geralmente tal formulário inicia com as informações de autoria e do projeto. Nesse caso, talvez seja melhor colocar as perguntas no texto da submissão do artigo, ou em um arquivo texto separado (pode ser anexo), sem qualquer identificação da sua autoria.
  4. Finalmente, sempre aponte conflitos de interesse. Ao se cadastrar no veículo para o qual enviará sua submissão, preencha adequadamente a lista de conflitos da equipe de autoria. Veículos podem ter definições específicas de quem são pessoas em conflito, então informe-se. Tais conflitos são importantes também em submissão anônima para evitar que colegas de mesma instituição (ou país) que potencialmente conhecem seu trabalho o avalie.

Dicas sobre Ferramentas

Esta seção é dividida em três partes de acordo com o tipo de ferramenta para compartilhar código com dados, para compartilhar apenas dados, e para ciência aberta. 

A. Para Compartilhar Código com Dados

GitHub.com é provavelmente a maior plataforma de escrita colaborativa e compartilhamento de código, com mais de 56 milhões de pessoas envolvidas em mais de 100 milhões de repositórios. Uma solução simples é colocar seu código e dados (todos sem qualquer identificação, vide dicas 1 a 3) em um repositório anônimo. Para compartilhar o link de tal repositório, é necessário que o mesmo não seja indexado por mecanismos de busca, o que é possível no GitHub através da inclusão do seguinte comando no cabeçalho da página: <meta name=”robots” content=”noindex”>. Outra solução ainda mais simples é usar o Anonymous GitHub, veja a seguir. 

Anonymous.4open.science provê uma forma de tornar um repositório inteiro do GitHub anônimo. Ele torna anônimo o conteúdo do repositório incluindo: o nome da conta onde o repositório está armazenado, a organização e o próprio nome do repositório (senão seria fácil buscar por esses termos no GitHub), conteúdo e nome de arquivos de todas as extensões, e nomes dos diretórios. Além disso, também oculta os issues, pull requests e histórico. Assim, você pode ter certeza de que seu repositório permanece anônimo. Uma grande vantagem é que ele segue as mudanças em seu repositório e atualiza a versão anônima automaticamente. A utilização do website é realmente simples:

  1. Entre no website e preencha o URL do repositório Github.
  2. Complete a lista de termos que serão anônimos. O anonimato do conteúdo é feito substituindo todas as ocorrências de palavras em uma lista por “XXX”. A lista de palavras normalmente contém o nome da instituição, nomes da equipe de autoria, logins, nome do projeto, agências de fomento e afins. 
  3. Defina se deseja uma data de validade para seu repositório anônimo. Você pode mantê-lo para sempre, remover o repositório após uma data específica ou redirecionar o usuário para o repositório GitHub.

Ao final, uma url exclusiva é criada com o conteúdo do seu repositório, por exemplo, http://anonymous.4open.science/repository/840c8c57-3c32-451e-bf12-0e20be300389, a qual você pode adicionar no seu texto científico e pronto. 

B. Para Dados Abertos

Figshare.com é uma plataforma para arquivar dados abertos organizada por ativistas da ciência aberta. É um repositório para cientistas disponibilizarem seus resultados de pesquisa de maneira citável, compartilhável e detectável. Contas gratuitas podem (fevereiro de 2021): disponibilizar arquivos de qualquer tipo com até 5GB, num total de 20GB de espaço particular e ilimitado de espaço público; gerar um DOI para seu trabalho; acessar sua pesquisa de qualquer local; usar a API própria; compartilhar espaços com colegas e links privados. Depois de ajustar seus dados para compartilhar e criar sua conta na plataforma (a conta não precisa ser anônima), seguem os passos para compartilhar anonimamente:

  1. Inicie um envio na plataforma. 
  2. Preencha detalhes como título, autoria, categorias de envio, tipo de item, palavras-chave e descrição. Aqui, a autoria é a real, pois ela será anonimizada automaticamente. Porém, certifique-se de que o título e a descrição estão ocultos ou anônimos (campos serão visíveis depois).
  3. Gere um link privado e sem selecionar a opção Publish, conforme o exemplo da Figura 1, que tem esses dois aspectos marcados com as flechas vermelhas. Também não há necessidade de sinalizar as opções Apply embargo, Make file(s) confidential e Reserve Digital Object Identifier. 
    Figura 1. Exemplo de configuração na plataforma figshare.
  4. Depois de conferir novamente que a opção Publish não esteja marcada, é só salvar as alterações.
  5. O link gerado é o que deve ser inserido na submissão científica.
  6. Finalmente, o conjunto de dados fica disponível apenas para quem conhece a sua URL. Então, pode ser baixado e é visualizado com título, categoria e descrição. Os detalhes de autoria e seu login não são exibidos. O conjunto de dados não é indexado pelo figshare.

Importante 1: URLs privadas expiram após 12 meses e podem ser estendidas entrando em contato com o suporte. Isso é proposital para evitar o uso de URLs privadas como finais.

Importante 2: Toda vez que você salva uma submissão, uma nova versão é criada e também publicada. Não existe maneira fácil de “despublicar” uma submissão e suas versões. Tenha cautela.

Após a submissão do seu texto científico ter sido aceita (parabéns! ;-)), lembre-se de disponibilizar os dados publicamente, com os seguintes passos:

  1. Escolha a licença CC0 (equivalente a tornar os dados de domínio público) ou CC-BY 4.0 (exige atribuição na reutilização dos dados e permite qualquer tipo de reutilização). Observe que as versões anteriores da licença CC-BY não são adequadas para os dados.
  2. Marque a opção Publish e clique em Publish Item.
  3. Use o DOI que você acabou de receber para referenciar adequadamente seus dados abertos em seu artigo e pronto! Você criou seus dados e fez com que recebessem sua primeira citação. Ah, segue um exemplo fictício de como referenciá-lo:
Sobrenome, Nome. (2021): Título do seu conjunto de dados. figshare. Dataset. DOI: 10.6084/m9.figshare.1234567.v1.

Zenodo.org também é uma plataforma para arquivar dados abertos organizada por OpenAIRE e CERN. O projeto OpenAIRE está na vanguarda do acesso aberto e movimentos de dados abertos na Europa, e fornece um repositório abrangente para pesquisas financiadas pela Comunidade Europeia. O CERN, um parceiro OpenAIRE e pioneiro em código aberto, acesso aberto e dados abertos, fornece recursos para mantê-lo online desde maio de 2013. Para apoiar seu programa de pesquisa, o CERN desenvolveu ferramentas para gerenciamento de Big Data e recursos estendidos de Biblioteca Digital para Dados Abertos.

Porém, o Zenodo não tem funcionalidades específicas para submissão anônima como o figshare. Ou seja, a única maneira de tornar um envio compatível com submissão anônima é publicando efetivamente tudo como acesso aberto e ocultando todos os detalhes.

Importante: Seu conjunto de dados será anônimo e compatível com submissão anônima. Porém, o arquivo estará acessível publicamente e indexado no Zenodo.

 

Novamente, depois de ajustar seus dados para compartilhar e criar sua conta na plataforma (a conta não precisa ser anônima), seguem os passos para compartilhar anonimamente:

  1. Faça upload de seus dados.
  2. Preencha as várias informações sobre os dados, mas certifique-se de nunca revelar a sua identificação.
  3. A principal diferença para o figshare é agora: escreva Anonymous para o nome e sobrenome do/a autor/a. Ou seja, você está usando sua conta para enviar o item, mas os dados publicados mostrarão Anonymous como autoria e seu nome de login não será revelado.
  4. Escolha a licença CC-BY 4.0, que requer atribuição ao reutilizar os dados e permite qualquer tipo de reutilização.
  5. Selecione Open access no item Access right.
  6. Salve e publique o conjunto de dados.
  7. Use o DOI obtido para fazer referência ao conjunto de dados em sua submissão anônima.

Após a submissão do seu texto científico ter sido aceita (novamente, parabéns! ;-)), lembre-se de atualizar as informações agora de maneira mais completa, com os seguintes passos:

  1. Preencha as informações reais de autoria em vez da entrada Anonymous.
  2. Use o DOI para referenciar adequadamente seus dados abertos em seu artigo.
C. Para Ciência Aberta

Open Science Framework foi criado para ajudar cientistas a conduzir pesquisas com mais rigor, gerenciar e compartilhar seu trabalho de forma mais aberta. O framework envolve as seguintes tarefas principais.

  • Compartilhar dados, materiais ou código: torna seu trabalho abertamente visível para demais cientistas e convida à colaboração, permite que outras pessoas descubram e desenvolvam seu trabalho, e facilita a replicação.
  • Compartilhar artigo ou pré-impressão: permite divulgar um artigo ou pré-impressão no OSF, o que acelera a comunicação acadêmica, o feedback que pode melhorar o trabalho e a descoberta da pesquisa.
  • Cadastrar sua pesquisa: permite registrar com data e hora qualquer projeto OSF ou começar um pré-registro antes de seu estudo para aumentar a transparência e a qualidade de sua pesquisa.

Para submissão anônima, o framework oferece a possibilidade de compartilhar um link no modo leitura, da seguinte maneira.

  1. Primeiro, abra o projeto para o qual deseja criar um link de somente visualização.
  2. Clique no botão de reticências no canto superior direito e, a seguir, clique em Create view-only link no menu suspenso. Você será direcionado para a seção View-only links da página Settings.
  3. Clique no botão +Add para criar um link de somente visualização, o que abre uma janela suspensa.
    1. Digite um nome para o link no primeiro campo para ajudá-lo a identificar posteriormente (opcional).
    2. Para ocultar sua identidade de quem visualiza (parte mais importante da submissão anônima), marque a caixa ao lado de Anonymize. Isso removerá todos os nomes de quem contribuiu para o projeto e logs (opcional).
    3. Para estender o link de somente visualização para os componentes, marque as caixas ao lado dos respectivos componentes. Nota: Apenas aqueles com as caixas marcadas serão compartilhados com o link.
    4. Clique no botão Create.

Todos os seus links de somente visualização estão listados na seção View-only Links da página Settings. Nesta seção, você pode ver o link, o nome do link, componentes compartilhados, data de criação, quem criou o link e se o link é anônimo.

Para compartilhar o link, clique no ícone Copy à esquerda do link. O link será copiado para sua área de transferência, e pode ser colado no texto científico a ser submetido.

Finalmente

Este artigo tratou apenas de como compartilhar código e dados de maneira anônima. Porém, aproveite o embalo e se familiarize com Ciência Aberta. Por exemplo, confira o website da FAPESP e outras publicações sobre o assunto (Anagnostou & Taylor, 2020; Silva & Silveira, 2019).

Referências

ANAGNOSTOU, A. e TAYLOR, S.J.E. (2020) Can Open Science Change the World? Computer 53(10): 13-22. doi: 10.1109/MC.2020.3001466

KIDWELL, M.C., et al. (2016). Badges to Acknowledge Open Practices: A Simple, Low-Cost, Effective Method for Increasing Transparency. PLoS Biology 14(5): e1002456. doi:10.1371/journal.pbio.1002456

MORO, M. M. (2021). Guia Rápido para Submissão Anônima: proteja sua identidade corretamente. SBC Horizontes. ISSN: 2175-9235. Disponível em: http://horizontes.sbc.org.br/index.php/2021/01/ guia-rapido-para-submissao-anonima:-proteja-sua-identidade-corretamente  

POPKIN, G. (2019). Data sharing and how it can benefit your scientific career. Nature 569:445-447. doi: 10.1038/d41586-019-01506-x

SILVA, F.C.C. e SILVEIRA, L. (2019) O ecossistema da Ciência Aberta. Transinformação, v.31, e19000z. doi: 10.1590/2318-0889201931e190001

Sobre a Autora

Mirella M. Moro

Professora do DCC/UFMG. Conselheira da SBC. Integrante do Comitê Gestor do Programa Meninas Digitais. Coordenadora dos projetos Bytes & Elas, e BitGirls.

Lattes: https://lattes.cnpq.br/6408321790990372

Outros Contatos: https://linktr.ee/mirellammoro

 


Como citar esse artigo:
Moro, M. M., 2021. Guia Rápido para Submissão Anônima de Código e Dados: é Fácil. ISSN: 2175-9235. Disponível em: http://horizontes.sbc.org.br/index.php/2021/03/guia-rapido-para-submissao-anonima-de-codigo-e-dados:-e-facil/

Compartilhe: