Bolkesteijn | woensdag 16 maart 2011 @ 05:48 |
Ik heb een bestand waarvan alle series op één na uit maandelijkse data bestaat. Ik wil dus de kwartaaldata interpoleren naar maandelijkse data omdat het zonde is 2/3e van de andere data weg te gooien. Ik heb de beschikking over EViews 7 of Excel, weet iemand hoe ik dit aan kan pakken? Ik heb al wat gelezen over cubic spline interpolatie, maar ik krijg het met geen mogelijkheid voor elkaar in Excel en ook niet in EViews. [ Bericht 14% gewijzigd door Bolkesteijn op 16-03-2011 13:53:43 ] | |
Dinosaur_Sr | woensdag 16 maart 2011 @ 07:31 |
Welkom in dit forum ![]() Ik zou de kwartaaldata in excel even snel omrekenen naar maand door kwartaal x - kwartaal y gedeeld door drie, en dan even snel verwijzen in een andere tabel (1 keer verwijzen en dan kan de rest van de reeks copy paist, en die plakken aan de maanddata tabel. Maar geen idee hoeveel die data is. En ik ben niet van de theorie, maar van de praktijk ![]() | |
Asfyxia | woensdag 16 maart 2011 @ 10:37 |
Volgens mij, als je voor één kwartaal zowel de kwartaaldata als de maanddata voor 2 maanden van een kwartaal hebt, moet het in principe mogelijk zijn om daar de exacte data voor de ontbrekende maand uit te berekenen. Kwestie van een beetje wiskunde en een programmeerkunstje. Is dit in jouw geval geen optie?
![]() | |
iamcj | woensdag 16 maart 2011 @ 12:41 |
![]() | |
iamcj | woensdag 16 maart 2011 @ 12:43 |
http://www.xlxtrfun.com/XlXtrFun/XlXtrFun.htm | |
Asfyxia | woensdag 16 maart 2011 @ 13:02 |
LOL verkeerd gelezen geloof ik. Mijn eerdere post lijkt hier inderdaad de plank mis te slaan. Wat voor data is het eigenlijk precies? Dat maakt nogal uit. Cubic Spline is leuk voor instantane meetwaardes, maar niet voor gemiddelden over een bepaalde periode. | |
Bolkesteijn | woensdag 16 maart 2011 @ 13:52 |
Het gaat om data met 20 kwartalen van GDP van de EU-27 landen. Deze data is op zich wel over een langere periode verkrijgbaar maar van de andere data (doorvoergegevens van de Rotterdamse haven) heb ik maar 60 maanden. Ik twijfel een beetje of cubic spline geschikt is want zoals je al opmerkt is dat inderdaad voor instantane meetwaarde en niet voor gemiddelden. Maar GDP is geen gemiddelde maar gewoon een optelsom over een kwartaal lijkt mij. Ja, je hebt gelijk. ![]() ![]() Ik snap je methode niet helemaal. Je zegt GDP(t)-GDP(t-1) en dan delen door drie, maar dan krijg ik toch een veel te kleine waarde? | |
Asfyxia | woensdag 16 maart 2011 @ 14:37 |
GDP per kwartaal kun je zien als het gemiddelde GDP per maand maal 3. Of andersom: het gemiddelde GDP per maand is het GDP per kwartaal/3. Een geschaald gemiddelde dus. Bottom line: ik denk wederom niet dat een (simpele) cubic spline hier gaat werken. Even beeldend gezegd: je moet een methode zien te vinden waarbij de oppervlakte van de gegenereerde, gladde grafiek voor de drie maanden gegarandeerd gelijk is aan het GDP over het hele kwartaal. Wellicht zou een aangepaste (geschaalde) cubic spline hier kunnen werken, maar dat durf ik niet met zekerheid te zeggen. Bovendien is het maar de vraag of een gladde functie in dit geval (GDP) veel meerwaarde heeft t.o.v. de situatie waarbij je het GDP per maand gelijkstelt aan het GDP per kwartaal/3. ![]() | |
Bolkesteijn | woensdag 16 maart 2011 @ 14:51 |
Ja, dat denk ik ook bij nader inzien. GDP is natuurlijk gewoon de som van de marktwaarde van alle goederen/diensten geproduceerd in een bepaalde periode. Ja, inderdaad, helder omschreven, zo had ik er nog niet naar gekeken. Ik denk dat ik het hier maar bij hou, maar wat ik mij dan afvraag, als je simpel deelt door drie dan krijg je toch automatisch verkeerde coëfficiënten in de regressievergelijking bij het gebruik van OLS, want je weet van te voren als dat het maandelijkse GDP nooit 3 maanden achter elkaar gelijk is aan elkaar. Aangezien OLS de regressiecoefficient bepaald aan de hand van het minimaliseren van de som van de kwadratische afwijkingen ten opzichte van de geschatte regressievergelijking. Is het niet beter om als je het kwartaalGDP/3 doet om dan, uitgaande van een stijgende trend maand 1 iets kleiner te maken, maand 2 precies gelijk aan kwartaalGDP/3 en maand 3 iets groter te maken? En het bij een dalende trend andersom te doen? En dan de mate van verschil tussen maand 1 en maand 3 afhankelijk te laten zijn van de richtingscoëfficiënt. [ Bericht 3% gewijzigd door Bolkesteijn op 16-03-2011 15:02:02 ] | |
Asfyxia | woensdag 16 maart 2011 @ 15:08 |
Zou ik niet doen. ![]() Ik vermoed dat er vast wel een methode bestaat die betere resultaten oplevert bij wat jij allemaal voor ogen hebt. Dat klopt. Maar GDP kan nogal grillig zijn toch? Dus je weet helaas ook (nog) niet wat het wel moet zijn of welke schatting zeer waarschijnlijk in de buurt komt van wat het zou moeten zijn. Een betrouwbare schatting van het GDP per maand aan de hand van de data voor het GDP per kwartaal, zou je bijvoorbeeld kunnen maken met aanvullende externe informatie. Bijvoorbeeld met de (eventueel vertraagde) doorvoergegevens van de Rotterdamse haven. ![]() ![]() | |
Dinosaur_Sr | woensdag 16 maart 2011 @ 19:29 |
misschien leg ik het onduidelijk uit. De uitkomst van delen door drie is de incrementele verandering van maand 0 naar maand 1 naar maand 2 naar maand 3 | |
iamcj | woensdag 16 maart 2011 @ 20:16 |
Ik zou ook gewoon lineair interpoleren. Je kunt toch niet achterhalen van het GDP geweest is. Er meer informatie van maken dan er is afhankelijke van de omliggende informatie, lijkt mij, met mijn boerenverstand, onzin. Wat je kunt doen is de verschillende methoden vergelijken met maandelijkse data die je wel hebt. | |
sitting_elfling | donderdag 17 maart 2011 @ 02:48 |
Hebben die data van de Baltic Dry Index en andere variabelen geen last van unit roots? En het lijkt me inderdaad beter dat je de groei pakt (dat doe ik zelf ook in mijn thesis om van heteroscedastiscity/serie correlatie af te komen). Als je de OLS regressie test zonder GDP heb je dan ook last van autocorrelatie/heteroscedastiscity? Wat je kunt proberen is op de 'normale' manier interpoleren. Het punt is alleen dat je continu 2 observaties mist en dus een percentage ruis in bouwt waar je wel degelijk rekening mee moet houden. Wat je ook kunt doen is de maandelijkse data gebruiken voor GDP. Dat zal msschien voor minder ruis zorgen dan wanneer je gaat interpoleren. Dus voor de GDP advance,preliminary en final. Mocht je wel kiezen voor interpoleren kun je iig. beide testen en kijken of er een groot verschil tussen zit. Want feitelijk klopt het natuurlijk niet omdat je voor 3 maanden lang dezelfde data set gebruikt maar een andere methode toepast om het 'uiteindelijke' nummer te berekenen. | |
Bolkesteijn | donderdag 17 maart 2011 @ 02:55 |
Ik ben nu met wat anders bezig, dus ik zal daar morgen naar kijken. Morgen ga ik er met mijn groepsgenoot mee aan de slag. maar aangezien ik geacht wordt het statistisch meesterbrein te zijn ( ![]() Wat bedoel je precies met de 'normale' manier van interpoleren? Gewoon lineair interpoleren? Het doel van het interpoleren is juist dat ik geen data meer mis, zodat ik genoeg observaties over hou om op de CLS mee te kunnen liften dus wat bedoel je precies met het continu missen van 2 observaties?. Maandelijkse data van het GDP is helaas niet beschikbaar, daarnaast mogen we geen andere data zoeken, we moeten de data die door de docent verstrekt is gebruiken. Ik heb al gezien dat hij de orginele data iets heeft aangepast, dus het stiekem doen zit er helaas ook niet in. ![]() | |
sitting_elfling | donderdag 17 maart 2011 @ 03:10 |
Testen voor dit soort zaken is een paar klikken in Eviews. Dat is echt niet zo lastig. Maar ik neem aan dat je sowieso je data even door de unit root (adf) test haalt. Mochten ze geïntegreerd zijn van een andere order is OLS regressie natuurlijk een beetje 'iffy' ![]() Dat komt omdat onze vorige professor van een vak een hekel had aan interpoleren. Je hebt immers data nummer T+2, maar niet T+1 en ook geen T. En ik zat eerder te denken aan monotone cubic interpolation wat toch nog enige vorm van lineariteit behoudt. Je zou in wezen dus de monotone/cubic spline en lineaire vorm van interpoleren met elkaar kunnen vergelijken. De snelste methode om de kwartaal data converteren is via Matlab. Dat is relatief snel gedaan. Snel even een uitleg opgezocht, deze komt goed in de buurt. Via Excel moet het volgens mij ook wel lukken, alleen hebben die niet van die geavanceerde methodes zoals bij Matlab. Eviews7 heeft ook ingebouwde interpoleer mogelijkheden maar daar heb ik nog nooit eerder naar gekeken. | |
Bolkesteijn | donderdag 17 maart 2011 @ 03:25 |
Dan ga ik morgen met Matlab aan de slag, want de interpoleerfunctie van EViews die ik had gevonden was toch een beetje een black box, dat staat nogal knullig als je de gebruikte methode verder niet kunt toelichten. Bedankt voor de hulp. ![]() | |
sitting_elfling | donderdag 17 maart 2011 @ 03:28 |
Succes. Met Matlab heb je het zo gefixed iig. Het was een ander verhaal als je gelimiteerd bent aan alleen Eviews. (Dat is bij ons in sommige gevallen de case ![]() Interessant onderzoek btw ![]() | |
Bolkesteijn | donderdag 17 maart 2011 @ 03:36 |
Ze hebben Matlab op de uni. |