abonnement Unibet Coolblue Bitvavo
pi_94179422
Ik heb een bestand waarvan alle series op één na uit maandelijkse data bestaat. Ik wil dus de kwartaaldata interpoleren naar maandelijkse data omdat het zonde is 2/3e van de andere data weg te gooien. Ik heb de beschikking over EViews 7 of Excel, weet iemand hoe ik dit aan kan pakken? Ik heb al wat gelezen over cubic spline interpolatie, maar ik krijg het met geen mogelijkheid voor elkaar in Excel en ook niet in EViews.

[ Bericht 14% gewijzigd door Bolkesteijn op 16-03-2011 13:53:43 ]
pi_94179685
Welkom in dit forum :)

Ik zou de kwartaaldata in excel even snel omrekenen naar maand door
kwartaal x - kwartaal y gedeeld door drie, en dan even snel verwijzen in een andere tabel (1 keer verwijzen en dan kan de rest van de reeks copy paist, en die plakken aan de maanddata tabel.

Maar geen idee hoeveel die data is. En ik ben niet van de theorie, maar van de praktijk :)
pi_94183583
Volgens mij, als je voor één kwartaal zowel de kwartaaldata als de maanddata voor 2 maanden van een kwartaal hebt, moet het in principe mogelijk zijn om daar de exacte data voor de ontbrekende maand uit te berekenen.

Kwestie van een beetje wiskunde en een programmeerkunstje.

Is dit in jouw geval geen optie?
quote:
1s.gif Op woensdag 16 maart 2011 07:31 schreef Dinosaur_Sr het volgende:
Welkom in dit forum :)
_O-
  woensdag 16 maart 2011 @ 12:41:43 #4
259770 iamcj
Niets is onmogelijk
pi_94187377
quote:
10s.gif Op woensdag 16 maart 2011 10:37 schreef Asfyxia het volgende:
Volgens mij, als je voor één kwartaal zowel de kwartaaldata als de maanddata voor 2 maanden van een kwartaal hebt, moet het in principe mogelijk zijn om daar de exacte data voor de ontbrekende maand uit te berekenen.

8)7
Wie bang is voor morgen, kan niet genieten van vandaag.
Religie is als taal, een basisbehoefte voor een maatschappij, iedereen spreekt zijn eigen dialect en even verder op begrijp je niet meer wat de ander zegt.
  woensdag 16 maart 2011 @ 12:43:45 #5
259770 iamcj
Niets is onmogelijk
pi_94187439
Wie bang is voor morgen, kan niet genieten van vandaag.
Religie is als taal, een basisbehoefte voor een maatschappij, iedereen spreekt zijn eigen dialect en even verder op begrijp je niet meer wat de ander zegt.
pi_94188120
quote:
1s.gif Op woensdag 16 maart 2011 12:41 schreef iamcj het volgende:

[..]

8)7
LOL verkeerd gelezen geloof ik. Mijn eerdere post lijkt hier inderdaad de plank mis te slaan.

Wat voor data is het eigenlijk precies? Dat maakt nogal uit. Cubic Spline is leuk voor instantane meetwaardes, maar niet voor gemiddelden over een bepaalde periode.
pi_94189925
quote:
1s.gif Op woensdag 16 maart 2011 13:02 schreef Asfyxia het volgende:
Wat voor data is het eigenlijk precies? Dat maakt nogal uit. Cubic Spline is leuk voor instantane meetwaardes, maar niet voor gemiddelden over een bepaalde periode.
Het gaat om data met 20 kwartalen van GDP van de EU-27 landen. Deze data is op zich wel over een langere periode verkrijgbaar maar van de andere data (doorvoergegevens van de Rotterdamse haven) heb ik maar 60 maanden.

Ik twijfel een beetje of cubic spline geschikt is want zoals je al opmerkt is dat inderdaad voor instantane meetwaarde en niet voor gemiddelden. Maar GDP is geen gemiddelde maar gewoon een optelsom over een kwartaal lijkt mij.

quote:
1s.gif Op woensdag 16 maart 2011 07:31 schreef Dinosaur_Sr het volgende:
Welkom in dit forum :)
Ja, je hebt gelijk. :@ Na april heb ik weer meer tijd. _O_

quote:
Ik zou de kwartaaldata in excel even snel omrekenen naar maand door
kwartaal x - kwartaal y gedeeld door drie, en dan even snel verwijzen in een andere tabel (1 keer verwijzen en dan kan de rest van de reeks copy paist, en die plakken aan de maanddata tabel.

Maar geen idee hoeveel die data is. En ik ben niet van de theorie, maar van de praktijk :)
Ik snap je methode niet helemaal. Je zegt GDP(t)-GDP(t-1) en dan delen door drie, maar dan krijg ik toch een veel te kleine waarde?
pi_94191704
quote:
14s.gif Op woensdag 16 maart 2011 13:52 schreef Bolkesteijn het volgende:

[..]

Het gaat om data met 20 kwartalen van GDP van de EU-27 landen. Deze data is op zich wel over een langere periode verkrijgbaar maar van de andere data (doorvoergegevens van de Rotterdamse haven) heb ik maar 60 maanden.

Ik twijfel een beetje of cubic spline geschikt is want zoals je al opmerkt is dat inderdaad voor instantane meetwaarde en niet voor gemiddelden. Maar GDP is geen gemiddelde maar gewoon een optelsom over een kwartaal lijkt mij.
GDP per kwartaal kun je zien als het gemiddelde GDP per maand maal 3. Of andersom: het gemiddelde GDP per maand is het GDP per kwartaal/3. Een geschaald gemiddelde dus. Bottom line: ik denk wederom niet dat een (simpele) cubic spline hier gaat werken.

Even beeldend gezegd: je moet een methode zien te vinden waarbij de oppervlakte van de gegenereerde, gladde grafiek voor de drie maanden gegarandeerd gelijk is aan het GDP over het hele kwartaal.

Wellicht zou een aangepaste (geschaalde) cubic spline hier kunnen werken, maar dat durf ik niet met zekerheid te zeggen. Bovendien is het maar de vraag of een gladde functie in dit geval (GDP) veel meerwaarde heeft t.o.v. de situatie waarbij je het GDP per maand gelijkstelt aan het GDP per kwartaal/3. :)
pi_94192185
quote:
1s.gif Op woensdag 16 maart 2011 14:37 schreef Asfyxia het volgende:
GDP per kwartaal kun je zien als het gemiddelde GDP per maand maal 3. Of andersom: het gemiddelde GDP per maand is het GDP per kwartaal/3. Een geschaald gemiddelde dus. Bottom line: ik denk wederom niet dat een (simpele) cubic spline hier gaat werken.
Ja, dat denk ik ook bij nader inzien. GDP is natuurlijk gewoon de som van de marktwaarde van alle goederen/diensten geproduceerd in een bepaalde periode.

quote:
Even beeldend gezegd: je moet een methode zien te vinden waarbij de oppervlakte van de gegenereerde, gladde grafiek voor de drie maanden gegarandeerd gelijk is aan het GDP over het hele kwartaal.
Ja, inderdaad, helder omschreven, zo had ik er nog niet naar gekeken.

quote:
Bovendien is het maar de vraag of een gladde functie in dit geval (GDP) veel meerwaarde heeft t.o.v. de situatie waarbij je het GDP per maand gelijkstelt aan het GDP per kwartaal/3. :)
Ik denk dat ik het hier maar bij hou, maar wat ik mij dan afvraag, als je simpel deelt door drie dan krijg je toch automatisch verkeerde coëfficiënten in de regressievergelijking bij het gebruik van OLS, want je weet van te voren als dat het maandelijkse GDP nooit 3 maanden achter elkaar gelijk is aan elkaar. Aangezien OLS de regressiecoefficient bepaald aan de hand van het minimaliseren van de som van de kwadratische afwijkingen ten opzichte van de geschatte regressievergelijking.

Is het niet beter om als je het kwartaalGDP/3 doet om dan, uitgaande van een stijgende trend maand 1 iets kleiner te maken, maand 2 precies gelijk aan kwartaalGDP/3 en maand 3 iets groter te maken? En het bij een dalende trend andersom te doen? En dan de mate van verschil tussen maand 1 en maand 3 afhankelijk te laten zijn van de richtingscoëfficiënt.

[ Bericht 3% gewijzigd door Bolkesteijn op 16-03-2011 15:02:02 ]
pi_94192911
quote:
7s.gif Op woensdag 16 maart 2011 14:51 schreef Bolkesteijn het volgende:
Ik denk dat ik het hier maar bij hou
Zou ik niet doen. ;)

Ik vermoed dat er vast wel een methode bestaat die betere resultaten oplevert bij wat jij allemaal voor ogen hebt.
quote:
maar wat ik mij dan afvraag, als je simpel deelt door drie dan krijg je toch automatisch verkeerde coëfficiënten in de regressievergelijking bij het gebruik van OLS, want je weet van te voren als dat het maandelijkse GDP nooit 3 maanden achter elkaar gelijk is aan elkaar.
Dat klopt. Maar GDP kan nogal grillig zijn toch? Dus je weet helaas ook (nog) niet wat het wel moet zijn of welke schatting zeer waarschijnlijk in de buurt komt van wat het zou moeten zijn.

Een betrouwbare schatting van het GDP per maand aan de hand van de data voor het GDP per kwartaal, zou je bijvoorbeeld kunnen maken met aanvullende externe informatie. Bijvoorbeeld met de (eventueel vertraagde) doorvoergegevens van de Rotterdamse haven. :P ;)
pi_94205538
quote:
14s.gif Op woensdag 16 maart 2011 13:52 schreef Bolkesteijn het volgende:

Ik snap je methode niet helemaal. Je zegt GDP(t)-GDP(t-1) en dan delen door drie, maar dan krijg ik toch een veel te kleine waarde?
misschien leg ik het onduidelijk uit. De uitkomst van delen door drie is de incrementele verandering van maand 0 naar maand 1 naar maand 2 naar maand 3
  woensdag 16 maart 2011 @ 20:16:03 #12
259770 iamcj
Niets is onmogelijk
pi_94208658
Ik zou ook gewoon lineair interpoleren. Je kunt toch niet achterhalen van het GDP geweest is. Er meer informatie van maken dan er is afhankelijke van de omliggende informatie, lijkt mij, met mijn boerenverstand, onzin.

Wat je kunt doen is de verschillende methoden vergelijken met maandelijkse data die je wel hebt.
Wie bang is voor morgen, kan niet genieten van vandaag.
Religie is als taal, een basisbehoefte voor een maatschappij, iedereen spreekt zijn eigen dialect en even verder op begrijp je niet meer wat de ander zegt.
pi_94225943
quote:
1s.gif Op donderdag 17 maart 2011 02:24 schreef Bolkesteijn het volgende:
Ik heb maandelijkse data van de Baltic Dry Index, Timecharter rates (huurprijs) van containerschepen en over doorvoer van goederen in de Rotterdamse haven. In kwartaal data heb ik het GDP met seizoenscorrectie van de EU-27 landen. Het betreft data van 60 maanden en 19 kwartalen, dus dat is al aan de krappe kant, daarom wil ik de kwartaaldata omzetten in maandelijkse data omdat ik anders bijna geen data meer over hou en er problemen ontstaan met de normaliteit (CLS gaat dan niet meer op).

Het gaat om een regressie (OLS) waarbij bijvoorbeeld de containerdoorvoer als afhankelijke variabele genomen wordt en waarbij de Timecharterrates en het GDP als onafhankelijke variabele gebruikt wordt.

Ik dacht ook nog, zou het, om seriecorrelatie te voorkomen niet beter zijn groei van het GDP te gebruiken in plaats van het GDP zelf?

Zie ook dit topic wat ik had gemaakt:
EViews: Kwartaaldata naar maandelijkse data
Hebben die data van de Baltic Dry Index en andere variabelen geen last van unit roots?

En het lijkt me inderdaad beter dat je de groei pakt (dat doe ik zelf ook in mijn thesis om van heteroscedastiscity/serie correlatie af te komen). Als je de OLS regressie test zonder GDP heb je dan ook last van autocorrelatie/heteroscedastiscity?

Wat je kunt proberen is op de 'normale' manier interpoleren. Het punt is alleen dat je continu 2 observaties mist en dus een percentage ruis in bouwt waar je wel degelijk rekening mee moet houden.

Wat je ook kunt doen is de maandelijkse data gebruiken voor GDP. Dat zal msschien voor minder ruis zorgen dan wanneer je gaat interpoleren. Dus voor de GDP advance,preliminary en final. Mocht je wel kiezen voor interpoleren kun je iig. beide testen en kijken of er een groot verschil tussen zit. Want feitelijk klopt het natuurlijk niet omdat je voor 3 maanden lang dezelfde data set gebruikt maar een andere methode toepast om het 'uiteindelijke' nummer te berekenen.
People once tried to make Chuck Norris toilet paper. He said no because Chuck Norris takes crap from NOBODY!!!!
Megan Fox makes my balls look like vannilla ice cream.
pi_94226003
quote:
1s.gif Op donderdag 17 maart 2011 02:44 schreef sitting_elfling het volgende:
Hebben die data van de Baltic Dry Index en andere variabelen geen last van unit roots?

En het lijkt me inderdaad beter dat je de groei pakt (dat doe ik zelf ook in mijn thesis om van heteroscedastiscity/serie correlatie af te komen). Als je de OLS regressie test zonder GDP heb je dan ook last van autocorrelatie/heteroscedastiscity?
Ik ben nu met wat anders bezig, dus ik zal daar morgen naar kijken. Morgen ga ik er met mijn groepsgenoot mee aan de slag. maar aangezien ik geacht wordt het statistisch meesterbrein te zijn ( :') ) ben ik me een beetje aan het voorbereiden.

quote:
Wat je kunt proberen is op de 'normale' manier interpoleren. Het punt is alleen dat je continu 2 observaties mist en dus een percentage ruis in bouwt waar je wel degelijk rekening mee moet houden.
Wat bedoel je precies met de 'normale' manier van interpoleren? Gewoon lineair interpoleren? Het doel van het interpoleren is juist dat ik geen data meer mis, zodat ik genoeg observaties over hou om op de CLS mee te kunnen liften dus wat bedoel je precies met het continu missen van 2 observaties?.

quote:
Wat je ook kunt doen is de maandelijkse data gebruiken voor GDP. Dat zal msschien voor minder ruis zorgen dan wanneer je gaat interpoleren. Dus voor de GDP advance,preliminary en final. Mocht je wel kiezen voor interpoleren kun je iig. beide testen en kijken of er een groot verschil tussen zit.
Maandelijkse data van het GDP is helaas niet beschikbaar, daarnaast mogen we geen andere data zoeken, we moeten de data die door de docent verstrekt is gebruiken. Ik heb al gezien dat hij de orginele data iets heeft aangepast, dus het stiekem doen zit er helaas ook niet in. ;) Een vergelijkende test tussen een situatie met interpolatie en zonder zal dus helaas niet lukken.
pi_94226071
quote:
1s.gif Op donderdag 17 maart 2011 02:55 schreef Bolkesteijn het volgende:

[..]

Ik ben nu met wat anders bezig, dus ik zal daar morgen naar kijken. Morgen ga ik er met mijn groepsgenoot mee aan de slag. maar aangezien ik geacht wordt het statistisch meesterbrein te zijn ( :') ) ben ik me een beetje aan het voorbereiden.
Testen voor dit soort zaken is een paar klikken in Eviews. Dat is echt niet zo lastig. Maar ik neem aan dat je sowieso je data even door de unit root (adf) test haalt. Mochten ze geïntegreerd zijn van een andere order is OLS regressie natuurlijk een beetje 'iffy' :P

quote:
Wat bedoel je precies met de 'normale' manier van interpoleren? Gewoon lineair interpoleren? Het doel van het interpoleren is juist dat ik geen data meer mis, zodat ik genoeg observaties over hou om op de CLS mee te kunnen liften dus wat bedoel je precies met het continu missen van 2 observaties?.
Dat komt omdat onze vorige professor van een vak een hekel had aan interpoleren. Je hebt immers data nummer T+2, maar niet T+1 en ook geen T. En ik zat eerder te denken aan monotone cubic interpolation wat toch nog enige vorm van lineariteit behoudt. Je zou in wezen dus de monotone/cubic spline en lineaire vorm van interpoleren met elkaar kunnen vergelijken.

De snelste methode om de kwartaal data converteren is via Matlab. Dat is relatief snel gedaan. Snel even een uitleg opgezocht, deze komt goed in de buurt.

Via Excel moet het volgens mij ook wel lukken, alleen hebben die niet van die geavanceerde methodes zoals bij Matlab. Eviews7 heeft ook ingebouwde interpoleer mogelijkheden maar daar heb ik nog nooit eerder naar gekeken.
People once tried to make Chuck Norris toilet paper. He said no because Chuck Norris takes crap from NOBODY!!!!
Megan Fox makes my balls look like vannilla ice cream.
pi_94226133
Dan ga ik morgen met Matlab aan de slag, want de interpoleerfunctie van EViews die ik had gevonden was toch een beetje een black box, dat staat nogal knullig als je de gebruikte methode verder niet kunt toelichten. Bedankt voor de hulp. :)
pi_94226150
quote:
14s.gif Op donderdag 17 maart 2011 03:25 schreef Bolkesteijn het volgende:
Dan ga ik morgen met Matlab aan de slag, want de interpoleerfunctie van EViews die ik had gevonden was toch een beetje een black box, dat staat nogal knullig als je de gebruikte methode verder niet kunt toelichten. Bedankt voor de hulp. :)
Succes. Met Matlab heb je het zo gefixed iig. Het was een ander verhaal als je gelimiteerd bent aan alleen Eviews. (Dat is bij ons in sommige gevallen de case :P)

Interessant onderzoek btw ;)
People once tried to make Chuck Norris toilet paper. He said no because Chuck Norris takes crap from NOBODY!!!!
Megan Fox makes my balls look like vannilla ice cream.
pi_94226168
Ze hebben Matlab op de uni.
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')