Elmord's Magic Valley

Software, lingüística e rock'n'roll. Às vezes em Português, sometimes in English.

Log de papers

2012-10-21 05:36 -0200. Tags: comp, prog, bash, em-portugues

Não estou muito inspirado para escrever em língua de pessoas hoje. O que eu tenho para dizer é que acabei de escrever em língua de máquinas um pequeno script que supre (parcialmente) uma necessidade que eu tenho há um bom tempo: um log de papers. (Vejam vocês, minha falta de vida social é de tal magnitude que eu passo uma parte razoável do meu tempo livre lendo papers.)

A idéia é simples: ao invés de mandar o Firefox abrir arquivos PDF e PS com o Evince (ou qualquer que seja o visualizador de sua preferência), você o instrui a abri-lo com esse script (lembre-se de dar permissão de execução ao arquivo (chmod +x /blabla/evince-log.sh)). O script então extrai o título e o abstract do texto do PDF/PS, rouba a URL de onde o arquivo foi baixado de dentro do downloads.sqlite do Firefox, e grava essas informações em um arquivo ~/evince-log.txt. Não é lá grande coisa, mas pelo menos é mais provável que daqui a um ano eu consiga encontrar os papers que eu li hoje quando eu precisar deles.

O script requer (no Debian) os pacotes sqlite3 (para ler o log de downloads do Firefox), poppler-tools (que contém o pdftotext) e ghostscript (que contém o ps2txt). Se você executar o script sem parâmetros, ele lhe dirá se algum desses programas estiver faltando.

Disclaimer: O "algoritmo" para extrair o título e o abstract são uma baita de uma faconice; o resultado é vagamente correto, mas suficiente para os meus propósitos por ora. Considere o "abstract" como uma amostra do início do paper para facilitar a identificação, e nada mais. Sugestões de melhorias são aceitas.

Feliz fuso novo para todos.

Comentários / Comments (0)

Deixe um comentário / Leave a comment

Main menu

Posts recentes

Comentários recentes

Tags

em-portugues (213) comp (138) prog (68) in-english (51) life (47) unix (35) pldesign (35) lang (32) random (28) about (27) mind (25) lisp (23) mundane (22) fenius (20) web (18) ramble (17) img (13) rant (12) hel (12) privacy (10) scheme (10) freedom (8) bash (7) copyright (7) music (7) academia (7) lash (7) esperanto (7) home (6) mestrado (6) shell (6) conlang (5) emacs (5) misc (5) latex (4) editor (4) book (4) php (4) worldly (4) politics (4) android (4) etymology (4) wrong (3) security (3) tour-de-scheme (3) kbd (3) c (3) film (3) network (3) cook (2) poem (2) physics (2) wm (2) treta (2) philosophy (2) comic (2) lows (2) llvm (2) perl (1) en-esperanto (1) audio (1) german (1) kindle (1) old-chinese (1) pointless (1) translation (1)

Elsewhere

Quod vide


Copyright © 2010-2020 Vítor De Araújo
O conteúdo deste blog, a menos que de outra forma especificado, pode ser utilizado segundo os termos da licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International.

Powered by Blognir.