Rubert | zaterdag 5 november 2005 @ 14:17 |
Hallo, ik probeer een tekst uit een pdf bestand te kopieren, maar dit wil maar niet lukken. Ik kan de tekst gewoon selecteren, en kopieren. Maar zodra ik het ergens in probeer te plakken krijg ik tekens zoals dit: !(>?f >^! !'XY' \\^! !'XY' ?f >V:'V?W W g Weet iemand hoe dit kan, en vooral hoe ik dit op kan lossen? | |
Lord_Vetinari | zaterdag 5 november 2005 @ 14:18 |
Je kunt alleen uit een pdf kopieren als je Acrobat Professional hebt. Volgens mij kun je met Reader niks met teksten doen. | |
McMarco | zaterdag 5 november 2005 @ 14:25 |
Met Foxit Reader (een gratis, lichte versie van Acrobat Reader) kan ik het in een pdf'je in ieder geval wel ![]() ![]() | |
AlwaysConnected | zaterdag 5 november 2005 @ 14:25 |
is een beetje afhankelijk van hoe je het pdf genereerd. ik denk het beveiligd is. je zult een tool moeten vinden om die pdf beveiliging er uit te halen en dan kan je het exporteren naar wat je mar wilt. suc6 | |
Vitalogy | zaterdag 5 november 2005 @ 14:27 |
quote:Ughbullshitbwuuugughugh | |
G-Mart | zaterdag 5 november 2005 @ 14:35 |
Bullshit inderdaad, je kunt gewoon normaliter tekst copy/pasten terwijl je alleen Reader hebt. Gebruik het zowat dagelijks op m'n werk (te lui om Acrobat Professional te installeren ![]() Misschien dat het beveiligd is nu, maar dat heb ik zelf nog nooit eerder gezien. | |
Rubert | zaterdag 5 november 2005 @ 14:36 |
Met foxit reader krijg ik er ook geen tekst uit, sterker nog, hij kopieerd helemaal niks. En het document is ook niet beveiligd, voor zover ik kan zien tenminste. | |
Fester | zaterdag 5 november 2005 @ 14:37 |
In welk font denkt je programma dat het staat? Plak het bijvoorbeeld eens naar notepad. Verder zou het ook een soort unicode kunnen zijn. | |
Vitalogy | zaterdag 5 november 2005 @ 14:38 |
Kan je individuele woorden selecteren? | |
Rubert | zaterdag 5 november 2005 @ 14:42 |
Nee, bij individuele woorden heb ik hetzelfe probleem. Ik krijg dus alleen maar vierkantjes. | |
G-Mart | zaterdag 5 november 2005 @ 14:44 |
Kun je de PDF niet ergens uploaden? Dan kunnen wij er even mee spelen ![]() | |
Vitalogy | zaterdag 5 november 2005 @ 14:46 |
quote:Maar je kan de woorden zelf selecteren? Dat betekent dus dat de tekst niet in werkelijkheid een plaatje is. | |
Rubert | zaterdag 5 november 2005 @ 14:58 |
Ja dat kan wel ja, ik kan ze wel selecteren. Woorden, letters, zinnen. Alleen bij het kopieren gaat het dus fout. Als PDF-producent staat er overigens GNU Ghostscript 7.06, weet niet of dit iets kan zijn? Bij beveiliging staat verder dat inhoud kopieren is toegestaan. Denk dat het document gewoon nogal brak is opgebouwd. Zal even kijken of ik straks even wat kan uploaden. | |
Vitalogy | zaterdag 5 november 2005 @ 15:08 |
Heb je al eens opnieuw opgestart? Niet dat op de een of andere manier je clipboard vervuilt is geraakt. Maar goed, dat zou plakken in notepad ook gewoon moeten werken. En zo niet dan weet ik het ook niet meer. | |
nietzman | zaterdag 5 november 2005 @ 15:10 |
Dat is echt een beveiliging. Kreeg het laatst op mijn werk ook eens niet voorelkaar met een beveiligde PDF van een RembrandBijbel. ![]() Heb er verder niet echt naar gezocht, maar voor mij was de snelste oplossing er plaatjes (Screenshots oid.) van te maken en die door een OCR applicatie te halen. | |
Rubert | zaterdag 5 november 2005 @ 15:41 |
Inmiddels he bik het via acrobat proffesional geprobeerd, maar het lijkt er op dat bepaalde letter niet worden opgeslagen of zoiets. Heb het nu op bijna alle mogelijke manier proberen op te slaan, en als tekstfile lijkt het beste resultaat te hebben. Maar als uitoer komt bijvoorbeeld deze tekst er uit: 1Inleiding. Wijenuvnhreom als gbrikrauaoo Pynnin. hteaatewlkeuevndeBckramet Ege eehnrfevijevnfwwebsiteenkut maeDzadleidingbeschijt hoeuop enoudigewzaaueoppelingknkn Dus volgens mij slaat hij gewoon stukken tekst en letters over. | |
Rubert | zaterdag 5 november 2005 @ 15:51 |
Ik heb even een pagina van het bestand online gezet. Dese is hiet te vinden: http://www.dekkeranthuriums.nl/test/Pagina5.pdf | |
AlwaysConnected | zaterdag 5 november 2005 @ 16:47 |
leuk document ![]() heb ze geript met http://www.solidpdf.com/download.htm http://home.planet.nl/~feer0011/Pagina5.doc http://home.planet.nl/~feer0011/Pagina5.rtf meer is niet van te maken [ Bericht 36% gewijzigd door AlwaysConnected op 05-11-2005 17:01:00 ] | |
G-Mart | zaterdag 5 november 2005 @ 17:00 |
Volgens mij is een gedeelte van de letters afbeelding .. | |
Fester | zaterdag 5 november 2005 @ 22:14 |
Als je regel voor regel heel langzaam de text gaat selecteren, dan zie je dat er hele blokken op een wel vreemde volgorde geselecteerd worden. De text bestaat dus uit losse letters en niet uit woorden of zinnen. Vaak is dat inderdaad een gevolg van een onnodig complexe conversiestap, of een overijverige Postscript printerdriver. Deze laatste probeert dan te precies alles weer te geven en het zou me niets verbazen als in de brontext de letters op alfabetische volgorde een plaatsje krijgen op het papier. Is helaas weinig anders aan te doen dan er een plaatje van te maken en deze met een ocr-programma te laten herkennen. Mischien dat je OCR-pakket al wel PDF-files kan inlezen (Omnipage kan dat), maar grote kans dat die dan ook de opmaak probeert mee te nemen. |