abonnement Unibet Coolblue Bitvavo
pi_31989837
Hallo, ik probeer een tekst uit een pdf bestand te kopieren, maar dit wil maar niet lukken. Ik kan de tekst gewoon selecteren, en kopieren. Maar zodra ik het ergens in probeer te plakken krijg ik tekens zoals dit:

 !(>?f
 >^ ! ! ' XY '
\\^ ! ! ' XY '
?f
>V:'V?W
  W
 g

Weet iemand hoe dit kan, en vooral hoe ik dit op kan lossen?
  zaterdag 5 november 2005 @ 14:18:52 #2
66444 Lord_Vetinari
Si non confectus non reficiat
pi_31989876
Je kunt alleen uit een pdf kopieren als je Acrobat Professional hebt. Volgens mij kun je met Reader niks met teksten doen.
De pessimist ziet het duister in de tunnel
De optimist ziet het licht aan het eind van de tunnel
De realist ziet de trein komen
De machinist ziet drie idioten in het spoor staan....
pi_31990046
Met Foxit Reader (een gratis, lichte versie van Acrobat Reader) kan ik het in een pdf'je in ieder geval wel Kweenie of het aan die pdf of aan de reader ligt, maar valt te proberen
pi_31990055
is een beetje afhankelijk van hoe je het pdf genereerd.
ik denk het beveiligd is. je zult een tool moeten vinden om die pdf beveiliging er uit te halen en dan kan je het exporteren naar wat je mar wilt. suc6
pi_31990096
quote:
Op zaterdag 5 november 2005 14:18 schreef Lord_Vetinari het volgende:
Je kunt alleen uit een pdf kopieren als je Acrobat Professional hebt. Volgens mij kun je met Reader niks met teksten doen.
Ughbullshitbwuuugughugh
pi_31990303
Bullshit inderdaad, je kunt gewoon normaliter tekst copy/pasten terwijl je alleen Reader hebt. Gebruik het zowat dagelijks op m'n werk (te lui om Acrobat Professional te installeren ).

Misschien dat het beveiligd is nu, maar dat heb ik zelf nog nooit eerder gezien.
pi_31990341
Met foxit reader krijg ik er ook geen tekst uit, sterker nog, hij kopieerd helemaal niks. En het document is ook niet beveiligd, voor zover ik kan zien tenminste.
pi_31990371
In welk font denkt je programma dat het staat?
Plak het bijvoorbeeld eens naar notepad.
Verder zou het ook een soort unicode kunnen zijn.
pi_31990382
Kan je individuele woorden selecteren?
pi_31990481
Nee, bij individuele woorden heb ik hetzelfe probleem. Ik krijg dus alleen maar vierkantjes.
pi_31990540
Kun je de PDF niet ergens uploaden? Dan kunnen wij er even mee spelen .
pi_31990590
quote:
Op zaterdag 5 november 2005 14:42 schreef Rubert het volgende:
Nee, bij individuele woorden heb ik hetzelfe probleem. Ik krijg dus alleen maar vierkantjes.
Maar je kan de woorden zelf selecteren? Dat betekent dus dat de tekst niet in werkelijkheid een plaatje is.
pi_31990915
Ja dat kan wel ja, ik kan ze wel selecteren. Woorden, letters, zinnen. Alleen bij het kopieren gaat het dus fout.

Als PDF-producent staat er overigens GNU Ghostscript 7.06, weet niet of dit iets kan zijn?
Bij beveiliging staat verder dat inhoud kopieren is toegestaan. Denk dat het document gewoon nogal brak is opgebouwd.

Zal even kijken of ik straks even wat kan uploaden.
pi_31991234
Heb je al eens opnieuw opgestart?
Niet dat op de een of andere manier je clipboard vervuilt is geraakt. Maar goed, dat zou plakken in notepad ook gewoon moeten werken.

En zo niet dan weet ik het ook niet meer.
  zaterdag 5 november 2005 @ 15:10:55 #15
4283 nietzman
Geen zin meer.
pi_31991312
Dat is echt een beveiliging.

Kreeg het laatst op mijn werk ook eens niet voorelkaar met een beveiligde PDF van een RembrandBijbel. .

Heb er verder niet echt naar gezocht, maar voor mij was de snelste oplossing er plaatjes (Screenshots oid.) van te maken en die door een OCR applicatie te halen.
Ik ga naar huis.
pi_31992073
Inmiddels he bik het via acrobat proffesional geprobeerd, maar het lijkt er op dat bepaalde letter niet worden opgeslagen of zoiets. Heb het nu op bijna alle mogelijke manier proberen op te slaan, en als tekstfile lijkt het beste resultaat te hebben. Maar als uitoer komt bijvoorbeeld deze tekst er uit:

1Inleiding.
Wijenuvnhreom als gbrikrauaoo Pynnin.
hteaatewlkeuevndeBckramet Ege
eehnrfevijevnfwwebsiteenkut maeDzadleidingbeschijt hoeuop enoudigewzaaueoppelingknkn

Dus volgens mij slaat hij gewoon stukken tekst en letters over.
pi_31992358
Ik heb even een pagina van het bestand online gezet.

Dese is hiet te vinden: http://www.dekkeranthuriums.nl/test/Pagina5.pdf
pi_31993856
leuk document

heb ze geript met http://www.solidpdf.com/download.htm

http://home.planet.nl/~feer0011/Pagina5.doc
http://home.planet.nl/~feer0011/Pagina5.rtf

meer is niet van te maken

[ Bericht 36% gewijzigd door AlwaysConnected op 05-11-2005 17:01:00 ]
pi_31994226
Volgens mij is een gedeelte van de letters afbeelding ..
pi_32005208
Als je regel voor regel heel langzaam de text gaat selecteren, dan zie je dat er hele blokken op een wel vreemde volgorde geselecteerd worden.
De text bestaat dus uit losse letters en niet uit woorden of zinnen.
Vaak is dat inderdaad een gevolg van een onnodig complexe conversiestap, of een overijverige Postscript printerdriver. Deze laatste probeert dan te precies alles weer te geven en het zou me niets verbazen als in de brontext de letters op alfabetische volgorde een plaatsje krijgen op het papier.
Is helaas weinig anders aan te doen dan er een plaatje van te maken en deze met een ocr-programma te laten herkennen.
Mischien dat je OCR-pakket al wel PDF-files kan inlezen (Omnipage kan dat), maar grote kans dat die dan ook de opmaak probeert mee te nemen.
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')