windows - Få tekst fra pdf-dokument ved hjælp af script

Indlæg af Hanne Mølgaard Plasc

Problem



Hvordan får man tekst fra pdf-dokument ved hjælp af script? Jeg bruger Windows og lejlighedsvis Linux.

Bedste reference


Du skal have pdftohtml tilgængelig på de fleste Linux-distributioner. Som navnet antyder, kan det konvertere PDF til HTML. Konvertere HTML til almindelig tekst kan udføres på mange måder, for eksempel ved hjælp af lynx -dump file.html

Andre referencer 1


Du kan bruge på Linux pdftotext kommando (del af poppler). [4] [5]

Andre referencer 2


Hvis målet er at bruge musen til at hente tekst fra en PDF, skal du køre xpdf. Det ser ikke ud til at være opmærksom på sikkerhedsindstillingerne. Den version, jeg kører på min Mac, gør det i det mindste ikke.