Não estou muito inspirado para escrever em língua de pessoas hoje. O que eu tenho para dizer é que acabei de escrever em língua de máquinas um pequeno script que supre (parcialmente) uma necessidade que eu tenho há um bom tempo: um log de papers. (Vejam vocês, minha falta de vida social é de tal magnitude que eu passo uma parte razoável do meu tempo livre lendo papers.)
A idéia é simples: ao invés de mandar o Firefox abrir arquivos PDF e PS com o Evince (ou qualquer que seja o visualizador de sua preferência), você o instrui a abri-lo com esse script (lembre-se de dar permissão de execução ao arquivo (chmod +x /blabla/evince-log.sh)). O script então extrai o título e o abstract do texto do PDF/PS, rouba a URL de onde o arquivo foi baixado de dentro do downloads.sqlite do Firefox, e grava essas informações em um arquivo ~/evince-log.txt. Não é lá grande coisa, mas pelo menos é mais provável que daqui a um ano eu consiga encontrar os papers que eu li hoje quando eu precisar deles.
O script requer (no Debian) os pacotes sqlite3 (para ler o log de downloads do Firefox), poppler-tools (que contém o pdftotext) e ghostscript (que contém o ps2txt). Se você executar o script sem parâmetros, ele lhe dirá se algum desses programas estiver faltando.
Disclaimer: O "algoritmo" para extrair o título e o abstract são uma baita de uma faconice; o resultado é vagamente correto, mas suficiente para os meus propósitos por ora. Considere o "abstract" como uma amostra do início do paper para facilitar a identificação, e nada mais. Sugestões de melhorias são aceitas.
Feliz fuso novo para todos.
Copyright © 2010-2024 Vítor De Araújo
O conteúdo deste blog, a menos que de outra forma especificado, pode ser utilizado segundo os termos da licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International.
Powered by Blognir.