Guia Rápido para Submissão Anônima de Código e Dados: é Fácil
Por Mirella M. Moro
Resumo. Muitos veículos de publicação exigem submissão anônima não apenas do texto, mas também de código e conjunto de dados utilizados. Porém, muitas pessoas não sabem que existem soluções online para garantir tal armazenamento de modo perene e anônimo para submissão. Este artigo apresenta um guia rápido das ferramentas mais comuns a seu dispor.
Em um artigo anterior (Moro, 2021), escrevi sobre submissão anônima de textos científicos, o qual recebeu uma sugestão de continuação: como submeter código e dados anonimamente (obrigada prof. Marcelo Finger!). Como boa apreciadora de ideias bacanas, resolvi organizar este conjunto de dicas específicas para anonimizar essa parte crucial de nosso trabalho.
Compartilhar Ciência é Preciso
Antes de tudo, é importante perceber a importância da tarefa não apenas para submissão anônima. Compartilhar código e dados é um passo essencial para garantir reprodutibilidade, transparência e replicabilidade de soluções computacionais. Mas não é só isso. Cada vez mais tem-se falado sobre ciência aberta para indicar a necessidade de disponibilizar publicamente qualquer artefato científico (Kidwell et al, 2016; Popkin, 2019). Em Ciência da Computação (e áreas similares), esses artefatos geralmente incluem código fonte e dados. Veja que compartilhar código pode ser simples como colocá-lo disponível em um repositório GitHub. Porém, compartilhar dados geralmente envolve outras questões como privacidade e proveniência, as quais você deve resolver antes de compartilhá-los.
Sugestões de como compartilhar código e dados aparecem em vários websites. Porém, é necessário enfatizar a principal mensagem de todos eles:
Existem sistemas online específicos para armazenamento de código e dados. Não forneça preprints, postprints e conjuntos de dados de sistemas não persistentes, como seu website pessoal (em seu servidor pessoal ou de sua instituição) ou armazenamento em nuvem comum (por exemplo, Dropbox e Google Drive). Todos esses sistemas são realmente voláteis e os dados eventualmente desaparecerão. |
Ciência e pesquisa precisam de seu conhecimento produzido e de seus artefatos para sempre – e sim, qualquer conhecimento produzido é importante para a sociedade como um todo. É por isso que seus dados devem ser liberados sob uma licença adequada e permanecer em repositórios arquivados onde ninguém, nem mesmo você, pode excluí-los.
De qualquer forma, a opção mais simples que existe no momento de submissão do texto é adicionar uma frase no estilo:
“Link para conjunto de dados e código é omitido para avaliação anônima.”
Nesse caso, você e seu time assumem o compromisso de publicar dados e código na versão final do artigo. A vantagem é que você não precisa decidir onde serão publicados no momento da submissão. Mas é só uma maneira de postergar a decisão, certo?
A seguir, estão as dicas mais gerais e uma seção específica para tecnologias atuais que permitem anonimizar código e dados, e toda a pesquisa realizada.
Dicas Gerais
Os cuidados para você e seu time garantirem que submissão anônima de código e conjunto de dados aplicam-se a todos os elementos que compõem código e dados. Ou seja, lembre-se de conferir essas dicas para arquivos principais e bibliotecas, bem como arquivos descritivos de metadados e leia-me (readme).
- Omitir todas as informações sobre a autoria. Apagar ou esconder nomes próprios e de instituições, título do projeto de pesquisa e nome de sua agência de fomento com o número do projeto, links externos para páginas pessoais e institucionais, entre outras. Apagar ou esconder nomes que identificam contas, como por exemplo, o seu login do GitHub. Evite usar esses nomes como parte dos nomes dos arquivos e de bibliotecas também.
- Preservar anonimato em documentos externos. Essa é uma falha comum de passar despercebida: a equipe de autoria foca em manter todas as informações da submissão no anonimato mas esquece das informações externas que são referenciadas no seu código.
- Preservar anonimato em printscreens, figuras e formulários. Ao realizar um printscreen da sua ferramenta ou do código, verifique as informações de autoria também, como por exemplo, o nome da ferramenta que é único e uma busca pelo mesmo leva facilmente à página do seu projeto. Imagens fazem parte da submissão e precisam necessariamente atender aos critérios de anonimato. Igualmente, às vezes é necessário apresentar as perguntas de formulários de avaliação e outros itens, sendo mais fácil adicionar o link para o mesmo no readme. O problema é que geralmente tal formulário inicia com as informações de autoria e do projeto. Nesse caso, talvez seja melhor colocar as perguntas no texto da submissão do artigo, ou em um arquivo texto separado (pode ser anexo), sem qualquer identificação da sua autoria.
- Finalmente, sempre aponte conflitos de interesse. Ao se cadastrar no veículo para o qual enviará sua submissão, preencha adequadamente a lista de conflitos da equipe de autoria. Veículos podem ter definições específicas de quem são pessoas em conflito, então informe-se. Tais conflitos são importantes também em submissão anônima para evitar que colegas de mesma instituição (ou país) que potencialmente conhecem seu trabalho o avalie.
Dicas sobre Ferramentas
Esta seção é dividida em três partes de acordo com o tipo de ferramenta para compartilhar código com dados, para compartilhar apenas dados, e para ciência aberta.
A. Para Compartilhar Código com Dados
GitHub.com é provavelmente a maior plataforma de escrita colaborativa e compartilhamento de código, com mais de 56 milhões de pessoas envolvidas em mais de 100 milhões de repositórios. Uma solução simples é colocar seu código e dados (todos sem qualquer identificação, vide dicas 1 a 3) em um repositório anônimo. Para compartilhar o link de tal repositório, é necessário que o mesmo não seja indexado por mecanismos de busca, o que é possível no GitHub através da inclusão do seguinte comando no cabeçalho da página: <meta name=”robots” content=”noindex”>. Outra solução ainda mais simples é usar o Anonymous GitHub, veja a seguir.
Anonymous.4open.science provê uma forma de tornar um repositório inteiro do GitHub anônimo. Ele torna anônimo o conteúdo do repositório incluindo: o nome da conta onde o repositório está armazenado, a organização e o próprio nome do repositório (senão seria fácil buscar por esses termos no GitHub), conteúdo e nome de arquivos de todas as extensões, e nomes dos diretórios. Além disso, também oculta os issues, pull requests e histórico. Assim, você pode ter certeza de que seu repositório permanece anônimo. Uma grande vantagem é que ele segue as mudanças em seu repositório e atualiza a versão anônima automaticamente. A utilização do website é realmente simples:
- Entre no website e preencha o URL do repositório Github.
- Complete a lista de termos que serão anônimos. O anonimato do conteúdo é feito substituindo todas as ocorrências de palavras em uma lista por “XXX”. A lista de palavras normalmente contém o nome da instituição, nomes da equipe de autoria, logins, nome do projeto, agências de fomento e afins.
- Defina se deseja uma data de validade para seu repositório anônimo. Você pode mantê-lo para sempre, remover o repositório após uma data específica ou redirecionar o usuário para o repositório GitHub.
Ao final, uma url exclusiva é criada com o conteúdo do seu repositório, por exemplo, http://anonymous.4open.science/repository/840c8c57-3c32-451e-bf12-0e20be300389, a qual você pode adicionar no seu texto científico e pronto.
B. Para Dados Abertos
Figshare.com é uma plataforma para arquivar dados abertos organizada por ativistas da ciência aberta. É um repositório para cientistas disponibilizarem seus resultados de pesquisa de maneira citável, compartilhável e detectável. Contas gratuitas podem (fevereiro de 2021): disponibilizar arquivos de qualquer tipo com até 5GB, num total de 20GB de espaço particular e ilimitado de espaço público; gerar um DOI para seu trabalho; acessar sua pesquisa de qualquer local; usar a API própria; compartilhar espaços com colegas e links privados. Depois de ajustar seus dados para compartilhar e criar sua conta na plataforma (a conta não precisa ser anônima), seguem os passos para compartilhar anonimamente:
- Inicie um envio na plataforma.
- Preencha detalhes como título, autoria, categorias de envio, tipo de item, palavras-chave e descrição. Aqui, a autoria é a real, pois ela será anonimizada automaticamente. Porém, certifique-se de que o título e a descrição estão ocultos ou anônimos (campos serão visíveis depois).
- Gere um link privado e sem selecionar a opção Publish, conforme o exemplo da Figura 1, que tem esses dois aspectos marcados com as flechas vermelhas. Também não há necessidade de sinalizar as opções Apply embargo, Make file(s) confidential e Reserve Digital Object Identifier.
- Depois de conferir novamente que a opção Publish não esteja marcada, é só salvar as alterações.
- O link gerado é o que deve ser inserido na submissão científica.
- Finalmente, o conjunto de dados fica disponível apenas para quem conhece a sua URL. Então, pode ser baixado e é visualizado com título, categoria e descrição. Os detalhes de autoria e seu login não são exibidos. O conjunto de dados não é indexado pelo figshare.
Importante 1: URLs privadas expiram após 12 meses e podem ser estendidas entrando em contato com o suporte. Isso é proposital para evitar o uso de URLs privadas como finais. Importante 2: Toda vez que você salva uma submissão, uma nova versão é criada e também publicada. Não existe maneira fácil de “despublicar” uma submissão e suas versões. Tenha cautela. |
Após a submissão do seu texto científico ter sido aceita (parabéns! ;-)), lembre-se de disponibilizar os dados publicamente, com os seguintes passos:
- Escolha a licença CC0 (equivalente a tornar os dados de domínio público) ou CC-BY 4.0 (exige atribuição na reutilização dos dados e permite qualquer tipo de reutilização). Observe que as versões anteriores da licença CC-BY não são adequadas para os dados.
- Marque a opção Publish e clique em Publish Item.
- Use o DOI que você acabou de receber para referenciar adequadamente seus dados abertos em seu artigo e pronto! Você criou seus dados e fez com que recebessem sua primeira citação. Ah, segue um exemplo fictício de como referenciá-lo:
Sobrenome, Nome. (2021): Título do seu conjunto de dados. figshare. Dataset. DOI: 10.6084/m9.figshare.1234567.v1.
Zenodo.org também é uma plataforma para arquivar dados abertos organizada por OpenAIRE e CERN. O projeto OpenAIRE está na vanguarda do acesso aberto e movimentos de dados abertos na Europa, e fornece um repositório abrangente para pesquisas financiadas pela Comunidade Europeia. O CERN, um parceiro OpenAIRE e pioneiro em código aberto, acesso aberto e dados abertos, fornece recursos para mantê-lo online desde maio de 2013. Para apoiar seu programa de pesquisa, o CERN desenvolveu ferramentas para gerenciamento de Big Data e recursos estendidos de Biblioteca Digital para Dados Abertos.
Porém, o Zenodo não tem funcionalidades específicas para submissão anônima como o figshare. Ou seja, a única maneira de tornar um envio compatível com submissão anônima é publicando efetivamente tudo como acesso aberto e ocultando todos os detalhes.
Importante: Seu conjunto de dados será anônimo e compatível com submissão anônima. Porém, o arquivo estará acessível publicamente e indexado no Zenodo. |
Novamente, depois de ajustar seus dados para compartilhar e criar sua conta na plataforma (a conta não precisa ser anônima), seguem os passos para compartilhar anonimamente:
- Faça upload de seus dados.
- Preencha as várias informações sobre os dados, mas certifique-se de nunca revelar a sua identificação.
- A principal diferença para o figshare é agora: escreva Anonymous para o nome e sobrenome do/a autor/a. Ou seja, você está usando sua conta para enviar o item, mas os dados publicados mostrarão Anonymous como autoria e seu nome de login não será revelado.
- Escolha a licença CC-BY 4.0, que requer atribuição ao reutilizar os dados e permite qualquer tipo de reutilização.
- Selecione Open access no item Access right.
- Salve e publique o conjunto de dados.
- Use o DOI obtido para fazer referência ao conjunto de dados em sua submissão anônima.
Após a submissão do seu texto científico ter sido aceita (novamente, parabéns! ;-)), lembre-se de atualizar as informações agora de maneira mais completa, com os seguintes passos:
- Preencha as informações reais de autoria em vez da entrada Anonymous.
- Use o DOI para referenciar adequadamente seus dados abertos em seu artigo.
C. Para Ciência Aberta
Open Science Framework foi criado para ajudar cientistas a conduzir pesquisas com mais rigor, gerenciar e compartilhar seu trabalho de forma mais aberta. O framework envolve as seguintes tarefas principais.
- Compartilhar dados, materiais ou código: torna seu trabalho abertamente visível para demais cientistas e convida à colaboração, permite que outras pessoas descubram e desenvolvam seu trabalho, e facilita a replicação.
- Compartilhar artigo ou pré-impressão: permite divulgar um artigo ou pré-impressão no OSF, o que acelera a comunicação acadêmica, o feedback que pode melhorar o trabalho e a descoberta da pesquisa.
- Cadastrar sua pesquisa: permite registrar com data e hora qualquer projeto OSF ou começar um pré-registro antes de seu estudo para aumentar a transparência e a qualidade de sua pesquisa.
Para submissão anônima, o framework oferece a possibilidade de compartilhar um link no modo leitura, da seguinte maneira.
- Primeiro, abra o projeto para o qual deseja criar um link de somente visualização.
- Clique no botão de reticências no canto superior direito e, a seguir, clique em Create view-only link no menu suspenso. Você será direcionado para a seção View-only links da página Settings.
- Clique no botão +Add para criar um link de somente visualização, o que abre uma janela suspensa.
- Digite um nome para o link no primeiro campo para ajudá-lo a identificar posteriormente (opcional).
- Para ocultar sua identidade de quem visualiza (parte mais importante da submissão anônima), marque a caixa ao lado de Anonymize. Isso removerá todos os nomes de quem contribuiu para o projeto e logs (opcional).
- Para estender o link de somente visualização para os componentes, marque as caixas ao lado dos respectivos componentes. Nota: Apenas aqueles com as caixas marcadas serão compartilhados com o link.
- Clique no botão Create.
Todos os seus links de somente visualização estão listados na seção View-only Links da página Settings. Nesta seção, você pode ver o link, o nome do link, componentes compartilhados, data de criação, quem criou o link e se o link é anônimo.
Para compartilhar o link, clique no ícone Copy à esquerda do link. O link será copiado para sua área de transferência, e pode ser colado no texto científico a ser submetido.
Finalmente
Este artigo tratou apenas de como compartilhar código e dados de maneira anônima. Porém, aproveite o embalo e se familiarize com Ciência Aberta. Por exemplo, confira o website da FAPESP e outras publicações sobre o assunto (Anagnostou & Taylor, 2020; Silva & Silveira, 2019).
Referências
ANAGNOSTOU, A. e TAYLOR, S.J.E. (2020) Can Open Science Change the World? Computer 53(10): 13-22. doi: 10.1109/MC.2020.3001466.
KIDWELL, M.C., et al. (2016). Badges to Acknowledge Open Practices: A Simple, Low-Cost, Effective Method for Increasing Transparency. PLoS Biology 14(5): e1002456. doi:10.1371/journal.pbio.1002456
MORO, M. M. (2021). Guia Rápido para Submissão Anônima: proteja sua identidade corretamente. SBC Horizontes. ISSN: 2175-9235. Disponível em: http://horizontes.sbc.org.br/index.php/2021/01/ guia-rapido-para-submissao-anonima:-proteja-sua-identidade-corretamente
POPKIN, G. (2019). Data sharing and how it can benefit your scientific career. Nature 569:445-447. doi: 10.1038/d41586-019-01506-x
SILVA, F.C.C. e SILVEIRA, L. (2019) O ecossistema da Ciência Aberta. Transinformação, v.31, e19000z. doi: 10.1590/2318-0889201931e190001
Sobre a Autora
Mirella M. Moro
Professora do DCC/UFMG. Conselheira da SBC. Integrante do Comitê Gestor do Programa Meninas Digitais. Coordenadora dos projetos Bytes & Elas, e BitGirls.
Lattes: https://lattes.cnpq.br/6408321790990372
Outros Contatos: https://linktr.ee/mirellammoro
Como citar esse artigo:
Moro, M. M., 2021. Guia Rápido para Submissão Anônima de Código e Dados: é Fácil. ISSN: 2175-9235. Disponível em: http://horizontes.sbc.org.br/index.php/2021/03/guia-rapido-para-submissao-anonima-de-codigo-e-dados:-e-facil/