FOK!forum / Digital Corner / Cellen scheiden in Excel
Okselmaandag 14 februari 2011 @ 16:07
Hoi,

Heb een enorme PDF met adresgegevens. Deze wil ik in Excel hebben, zodat ik kan filteren. Als ik de functie Tekst naar kolommen gebruik gaat het niet goed, want er zitten meer spaties, en ze hebben ook geen vaste tekenlengte.

De data ziet er zo uit:

SDE1053763 A. Janssen Linden Agro B.V. De Geest 8 5439 NJ LINDEN

Moet dus zo opgesplitst worden:

Referentie Aanvragernaam Straataanvrager Huisnummer Postcode Plaatsnaam

In totaal 6 kolommen. Nu is elke Aanvragernaam uniek, en dus ook z'n unieke lengte. Kan dit?

Dit is de file:
http://www.filedropper.com/sde2010zon-pvgrootafgewezen01-10-20101

Is openbare info, dus mag het hier posten.

[ Bericht 17% gewijzigd door Oksel op 14-02-2011 16:25:10 ]
Hiddendoemaandag 14 februari 2011 @ 16:12
Nee.
ralfiemaandag 14 februari 2011 @ 16:13
De enige manier om dit foutloos en automatisch te doen (lijkt me) is door elke postcode op te zoeken om zo het aantal woorden waaruit de straatnaam bestaat te achterhalen. Ik ben bang dat dit zodanig ingewikkeld wordt dat je het toch allemaal met de hand moet aanpassen
DahBigKahunamaandag 14 februari 2011 @ 16:17
Dit gaat niet te doen zijn. Als je nou csv (comma separated values) had, dan wel. Dit is echter onmogelijk.
Dagoduckmaandag 14 februari 2011 @ 16:17
Cuijk, Noord Brabant.
snoekiesnoeksnoekmaandag 14 februari 2011 @ 16:21
quote:
1s.gif Op maandag 14 februari 2011 16:17 schreef DahBigKahuna het volgende:
Dit gaat niet te doen zijn. Als je nou csv (comma separated values) had, dan wel. Dit is echter onmogelijk.
Sorry?

Dit is prima mogelijk en vrij eenvoudig. Gewoon tekst naar .txt bestand en dat inlezen in Excel en via de wizard kolommen maken op basis van de spaties, kolommen samenvoegen en klaar.
Okselmaandag 14 februari 2011 @ 16:22
quote:
1s.gif Op maandag 14 februari 2011 16:21 schreef snoekiesnoeksnoek het volgende:

[..]

Sorry?

Dit is prima mogelijk en vrij eenvoudig. Gewoon tekst naar .txt bestand en dat inlezen in Excel en via de wizard kolommen maken op basis van de spaties, kolommen samenvoegen en klaar.
Probleem is dus dat er in de ene lijn 15 spaties zitten, in de andere maar 5. Dus die optie valt af.
Okselmaandag 14 februari 2011 @ 16:23
En op 1 of andere manier de PDF uit elkaar jorissen en daar de kolom uit halen? Ik ben al aan het zoeken, maar kan nog niet echt wat vinden.
snoekiesnoeksnoekmaandag 14 februari 2011 @ 16:24
quote:
1s.gif Op maandag 14 februari 2011 16:22 schreef Oksel het volgende:
Probleem is dus dat er in de ene lijn 15 spaties zitten, in de andere maar 5. Dus die optie valt af.
Er zit altijd een spatie tussen de velden toch?

Kan je niet een wat uitgebreider voorbeeld geven? Het klinkt echt eenvoudig als ik het zo lees en prima mogelijk. Anders kopieer je even een stuk eruit en pas je de gegevens aan zodat ze niet te herkennen zijn?
Okselmaandag 14 februari 2011 @ 16:25
Ik heb de PDF online gegooid.. :) is openbare informatie.
Yngwiemaandag 14 februari 2011 @ 16:26
Wat wellicht het makkelijkst is... importeren met spatie als scheidingstekens. Dan krijg je teveel kolommen, klopt, maar deze kun je samenvoegen in nieuwe kolommen.

In cel B1 staan na import A. en in C1 staat Janssen. Deze kun je in een nieuwe kolom samenvoegen met =(B1&" "&C1). Formule doorslepen naar beneden. Kolom kopieren en plakken speciaal (als waardes) en voila, een kolom met alle aanvragernamen. Zo kun je het ook met adres etc. doen.
Okselmaandag 14 februari 2011 @ 16:28
quote:
1s.gif Op maandag 14 februari 2011 16:26 schreef Yngwie het volgende:
Wat wellicht het makkelijkst is... importeren met spatie als scheidingstekens. Dan krijg je teveel kolommen, klopt, maar deze kun je samenvoegen in nieuwe kolommen.

In cel B1 staan na import A. en in C1 staat Janssen. Deze kun je in een nieuwe kolom samenvoegen met =(B1&" "&C1). Formule doorslepen naar beneden. Kolom kopieren en plakken speciaal (als waardes) en voila, een kolom met de aanvragernaam. Zo kun je het ook met adres etc. doen.
Nee, want als er A A Jansen staat, is het een andere tabel dan A Jansen.
snoekiesnoeksnoekmaandag 14 februari 2011 @ 16:29
ik heb het al voor elkaar :)
snoekiesnoeksnoekmaandag 14 februari 2011 @ 16:29
heb je geen adobe profesional? Daarin bestand openen, selecteren en dan rechtermuis en kies kopieeren als tabel en dan plakken in excel.

moet er nu vandoor, mocht je morgen nog niet geholpen zijn, dan upload ik wel een excel bestandje. Heb er nu helaas geen tijd voor.
Okselmaandag 14 februari 2011 @ 16:30
Cool. :) Met de HELE pdf? Want dat is het tweede probleem.. moet het dan pagina per pagina doen?

En nee, dat heb ik niet.
Okselmaandag 14 februari 2011 @ 16:30
Thanks iig voor het meedenken :)
snoekiesnoeksnoekmaandag 14 februari 2011 @ 21:18
ik ga morgen eens kijken, per pagina gaat prima, maar er zit wat in dat document dat ik niet zomaar kan blijven selecteren, maar exporteren kan wel in 1 keer.

Maar ik had een keuze uit 20 bestandsformaten, duik er morgen even in of dat makkelijker kan en als je pecht hebt moet je het per pagina doen, maar dan kan dat met adobe professional dus ook wel snel. Ik kan helaas niet voor je 170 pagina's 1 voor 1 doen, maar kan je dan wel uitleggen hoe je het zelf kan doen.

Maar misschien morgen goed nieuws door die export functie, ik kijk er naar voor je.
baaartdinsdag 15 februari 2011 @ 10:49
Zoek online even een PDF 2 Word converter. Heb er net ff een paar minuten naar gekeken maar sommige blijken last te hebben met 700 pagina's in 1x te doen. Meeste hebben ook freeware programma's die wat beter werken.

Het converteerd in ieder geval 100% correct naar tabellen die je daarna zo in excel kan zetten.
snoekiesnoeksnoekdinsdag 15 februari 2011 @ 11:54
online werkt het niet, je krijgt dan maar 1 pagina uit het bestand (al heb ik wat tools geprobeerd om van pdf naar excel te gaan in 1 stap). Dat probleem geeft Adobe Professional CS4 ook met de optie copy to table.

Ik probeer nog even wat, maar anders is het wel wat handwerk helaas. Als je met adobe prof. hem helemaal kopieert en in een tekstbestand plakt en inleest in excel heb je al wel een aardige basis.
snoekiesnoeksnoekdinsdag 15 februari 2011 @ 12:35
Nou, ik ben er even verder ingedoken, maar het gaat je wat werk kosten.

De beste resultaten behaal je met Adobe Acrobat Professional, je hebt dan 2 methoden:

1) Selecteer per pagina de tabel, rechtermuisklik erop en kiest Export to Table en plak die gegevens in Excel.

2) Knip het document in verschillende stukken met Adobe Profesional en sla vervolgens elk document op met de indeling Excel (.xml). Je krijgt nu elke pagina op 1 tabblad in Excel en vervolgens voeg je de tabbladen in Excel samen.

Beiden zijn mogelijk, schat dat het je 3 uurtjes werk kost onafhankelijk van de optie die je kiest.

Helaas krijg ik het niet voor elkaar om het document in 1 keer op te slaan, de pc trekt het niet op een gegeven moment gezien het aantal pagina's.
Deetchdinsdag 15 februari 2011 @ 13:08
Hier verder: [Excel] Het grote Excel vragen topic #25
snoekiesnoeksnoekdinsdag 15 februari 2011 @ 15:06
Het is geen excel vraag, maar een pdf conversie vraag... in het Excel topic kan men er niks mee ben ik bang. Ik ben vrij goed in Excel, maar als je het niet goed vanuit die pdf in Excel krijgt wordt het erg lastig...
Okseldinsdag 15 februari 2011 @ 15:45
Thanks Snoekie!

Tijd dus dat ik die software download..!? Ik ga er mee bezig. Iig erg bedankt voor je tijd en moeite.
snoekiesnoeksnoekdinsdag 15 februari 2011 @ 15:50
quote:
1s.gif Op dinsdag 15 februari 2011 15:45 schreef Oksel het volgende:
Thanks Snoekie!
Tijd dus dat ik die software download..!? Ik ga er mee bezig. Iig erg bedankt voor je tijd en moeite.
Ik zou even in de krochten van internet zoeken naar adobe professional en dan het document in 40 stukken ongeveer knippen en dan via bestand - opslaan het opslaan in Excel xml formaat en dan die tabbladen handmatig samenvoegen.

Dat is het minste werk. Ik heb helaas alleen op het werk adobe professional en het is teveel werk om hier even tussendoor te doen, je bent er helaas wel een uurtje of 3 max. mee bezig, maar dan heb je ook wat.
Okseldinsdag 15 februari 2011 @ 16:09
Hoe knip ik het in stukken? Elke keer pagina's los opslaan? Dus pagina 1tm40 opslaan, dan 41tm80?
snoekiesnoeksnoekdinsdag 15 februari 2011 @ 16:38
er zit een optie in adobe professional : pagina's verwijderen. Dat gebruik ik altijd. Dat is het snelst. Je kan ook stukken kopieeren naar een nieuw document, maar dat kost meer tijd.
Okselwoensdag 16 februari 2011 @ 11:07
Heb Acrobat Prof. binnen, vanavond er mee spelen.