quote:
Laten we eens uitgaan van een rij {u
n}, n∈
N0 met louter reële termen die aan een homogene lineaire tweede orde recursie met constante en reële coëfficiënten voldoet, en wel
(1) a·u
n + b·u
n−1 + c·u
n−2 = 0
Hierbij moeten we a ≠ 0 en tevens c ≠ 0 veronderstellen, aangezien we anders geen tweede orde recursie hebben.
Zoals bekend kunnen we in beginsel gesloten uitdrukkingen vinden voor de algemene term u
n van rijen die aan het recursievoorschrift (1) voldoen door op zoek te gaan naar meetkundige rijen die aan dit voorschrift voldoen. Hebben we een meetkundige rij {u
n} met als eerste term u
0 en reden λ, dan is
(2) u
n = u
0·λ
nSubstitutie van (2) in geeft voor n > 1
(3) u
0·λ
n−2(aλ
2 + bλ + c) = 0
Nu is het duidelijk dat u
n = 0, i.e. een rij die uit louter nullen bestaat, een triviale oplossing is van het recursievoorschrift (1) en dat we daarom op grond van (2) zowel u
0 ≠ 0 als λ ≠ 0 moeten veronderstellen om andere oplossingen naast deze triviale oplossing te vinden. Maar dan kan uitsluitend aan (3) worden voldaan als de uitdrukking tussen haakjes gelijk is aan nul, dus
(4) aλ
2 + bλ + c = 0
Dit is de zogeheten karakteristieke vergelijking van het recursievoorschrift (1). We noemen het polynoom
(5) P(λ) = aλ
2 + bλ + c
ook het karakteristieke polynoom van het recursievoorschrift (1). Nu is (4) een vierkantsvergelijking in λ, en zoals bekend wordt de aard van de nulpunten van P(λ) en daarmee van de oplossingen van (4) bepaald door de discriminant
(6) D = b
2 − 4ac
van dit polynoom. We onderscheiden nu drie mogelijkheden.
1. D > 0. Nu heeft P(λ) twee verschillende reële nulpunten λ
1 en λ
2 en zijn de meetkundige rijen gedefinieerd door u
n = u
0·λ
1n en u
n = u
0·λ
2n twee (lineair onafhankelijke) oplossingen van (1). En omdat elke lineaire combinatie {c
n} met c
n = α·a
n + β·b
n van twee rijen {a
n} en {b
n} die voldoen aan (1) ook weer voldoet aan (1) krijgen we als algemene oplossing van het recursievoorschrift
(7) u
n = α·λ
1n+ β·λ
2nwaarin α en β willekeurige (reële) constanten zijn. Het is eenvoudig na te gaan dat (7) ook inderdaad de
volledige oplossing geeft van het recursievoorschrift (1). Een rij die voldoet aan een tweede orde recursie ligt volledig vast als twee opeenvolgende termen van de rij zijn gegeven. Welnu, substitutie in (7) van twee opeenvolgende termen van een specifieke rij die aan (1) voldoet levert een stelsel van twee lineaire vergelijkingen in α en β en dit stelsel bezit een unieke oplossing aangezien uit c ≠ 0 in (1) volgt dat λ
1 ≠ 0 en tevens λ
2 ≠ 0, terwijl uit D ≠ 0 volgt dat λ
1 ≠ λ
2, zodat de determinant van het stelsel ongelijk is aan nul.
2. D < 0. Nu heeft P(λ) twee toegevoegd complexe nulpunten λ
1 en λ
2 maar de situatie verschilt niet wezenlijk van die voor D > 0. Ook nu geldt dat (7) de algemene oplossing geeft van het recursievoorschrift (1), en ook nu levert substitutie in (7) van twee opeenvolgende termen van een specifieke rij een stelsel van twee lineaire vergelijkingen in α en β met een unieke oplossing. Echter, niet alleen λ
1 en λ
2 maar ook α en β zijn nu in het algemeen (toegevoegd) complex, zodat het niet mogelijk is een gesloten algebraïsche uitdrukking voor de algemene term van de recursieve rij te geven zonder gebruik van complexe getallen, en dat terwijl alle termen van de rij
zelf wel degelijk reëel zijn. Maar, zoals ik wel eens heb laten
zien, is het in dit geval altijd mogelijk een goniometrische uitdrukking te geven voor algemene term van de rij zonder gebruik van complexe getallen.
3. D = 0. Nu heeft P(λ) één reëel nulpunt met multipliciteit 2, dat ik aan zal geven met λ
0. Aangezien λ
0 voldoet aan (4) is het duidelijk dat
(8) u
n = α·λ
0nmet een willekeurige α in ieder geval een oplossing is van het recursievoorschrift (1). Maar het is evenzeer duidelijk dat (8) nu niet de volledige oplossing kan zijn van (1) omdat we bij het recursievoorschrift (1) de waarden van u
0 en u
1 steeds vrij kunnen kiezen, terwijl (8) alleen een oplossing biedt als u
1 = λ
0u
0.
Een elegante methode om toch de volledige oplossing van (1) te verkrijgen als D = 0 berust op het gebruik van differentiaalrekening. Daarvoor hebben we de volgende
stelling nodig:
Als een niet-constant polynoom P(x) een nulpunt x = x
0 heeft met een multipliciteit m > 1, dan is P
(i)(x
0) = 0 voor i = 1 .. (m − 1) terwijl P
(m)(x
0) ≠ 0.
Het bewijs van deze stelling gaat het eenvoudigst als we eerst even twee lemmata bewijzen.
Lemma 1. Als een niet-constant polynoom P(x) een enkelvoudig nulpunt x = x
0 heeft, dan is P'(x
0) ≠ 0.
Bewijs: volgens de factorstelling volgt uit P(x
0) = 0 dat P(x) een factor (x − x
0) bevat zodat P(x) = (x −x
0)·Q(x). Aangezien x = x
0 een enkelvoudig nulpunt is van P(x) kan het polynoom Q(x) geen verdere factoren (x − x
0) bevatten zodat, wederom volgens de factorstelling, Q(x
0) ≠ 0. De afgeleide van P(x) = (x −x
0)·Q(x) is P'(x) = Q(x) + (x − x
0)·Q'(x) zodat P'(x
0) = Q(x
0) + 0·Q'(x
0) = Q(x
0) ≠ 0, QED.
Lemma 2. Als een niet-constant polynoom P(x) een nulpunt x = x
0 heeft met een multipliciteit m > 1 dan heeft de afgeleide P'(x) een nulpunt x = x
0 met een multipliciteit (m − 1).
Bewijs: aangezien P(x) een nulpunt x = x
0 heeft met multipliciteit m > 1 is P(x) = (x − x
0)
m·Q(x) waarbij het polynoom Q(x) geen verdere factoren (x − x
0) bevat zodat volgens de factorstelling Q(x
0) ≠ 0. De afgeleide van P(x) = (x − x
0)
m·Q(x) is P'(x) = m·(x − x
0)
m−1·Q(x) + (x − x
0)
m·Q'(x) waarvoor we kunnen schrijven P'(x) = (x − x
0)
m−1·(m·Q(x) + (x − x
0)·Q'(x)). Voor x = x
0 is de factor (m·Q(x) + (x − x
0)·Q'(x)) gelijk aan m·Q(x
0) ≠ 0 zodat (m·Q(x) + (x − x
0)·Q'(x)) volgens de factorstelling geen factor (x − x
0) bevat en de multipliciteit van het nulpunt x = x
0 van P'(x) dus gelijk is aan (m − 1), QED.
Het bewijs van bovenstaande stelling is nu uiteraard eenvoudig: heeft een niet-constant polynoom P(x) een nulpunt x = x
0 met multipliciteit m > 1, dan geeft (herhaalde) toepassing van lemma 2 dat P
(i)(x) voor i = 1 .. (m − 1) een nulpunt x = x
0 heeft met een multipliciteit (m − i), zodat P
(m−1)(x) een enkelvoudig nulpunt x = x
0 heeft. En volgens lemma 1 is dan P
(m)(x
0) ≠ 0, QED.
Goed, nu de volledige oplossing van (1) als D = 0. Vermenigvuldigen we beide leden van (5) met λ
n−2, dan hebben we voor n > 1
(9) a·λ
n + b·λ
n−1 + c·λ
n−2 = λ
n−2·P(λ)
Differentiëren naar λ geeft nu
(10) a·n·λ
n−1 + b·(n−1)·λ
n−2 + c·(n−2)·λ
n−3 = (n−2)·λ
n−3·P(λ) + λ
n−2·P'(λ)
En beide leden vermenigvuldigen met λ geeft dan
(11) a·n·λ
n + b·(n−1)·λ
n−1 + c·(n−2)·λ
n−2 = (n−2)·λ
n−2·P(λ) + λ
n−1·P'(λ)
Nu is λ = λ
0 een nulpunt van P(λ) met multipliciteit 2, zodat niet alleen P(λ
0) = 0 maar tevens P'(λ
0) = 0. Substutie van λ = λ
0 in (11) geeft dus
(12) a·n·λ
0n + b·(n−1)·λ
0n−1 + c·(n−2)·λ
0n−2 = 0
zodat we kunnen concluderen dat u
n = n·λ
0n aan het recursievoorschrift (1) voldoet. Eerder vonden we al dat u
n = λ
0n voldoet, zodat ook elke lineaire combinatie van deze oplossingen aan het recursievoorschrift voldoet en we dus krijgen
(13) u
n = (α + β·n)·λ
0nHet is weer gemakkelijk na te gaan dat deze oplossing inderdaad volledig is. Substitutie in (13) van twee opeenvolgende termen van een specifieke rij die aan (1) voldoet levert een stelsel van twee lineaire vergelijkingen in α en β en dit stelsel bezit een unieke oplossing aangezien uit c ≠ 0 in (1) volgt dat λ
0 ≠ 0 zodat de determinant van het stelsel ongelijk is aan nul.
Het aardige van deze methode is dat deze eenvoudig is te generaliseren naar homogene lineaire recursies met constante coëfficiënten van hogere ordes. Heeft het karakteristieke polynoom P(λ) van zo'n hogere orde recursie van orde N namelijk een meervoudig nulpunt λ = λ
0 met multipliciteit m, dan kun je door P(λ) te vermenigvuldigen met λ
n−N en daarna telkens om beurten te differentiëren en weer te vermenigvuldigen met λ gemakkelijk laten zien dat naast u
n = λ
0n ook u
n = n
i·λ
0n voor i = 1 .. (m − 1) een oplossing geeft van de recursie. Zo geeft elk meervoudig nulpunt met een multipliciteit m dus precies m lineair onafhankelijke oplossingen.
Wil je niet gebruik maken van differentiaalrekening, dan is er in ieder geval voor tweede orde recursies waarbij de discriminant van de karakteristieke vergelijking gelijk is aan nul ook een goed bruikbare elementaire methode die bekend staat als de variatie van de constante. Het idee hierbij is dat je uitgaat van (8) maar dat je veronderstelt dat α niet constant is maar een functie van n. Dat wil dus zeggen dat je een rij {α
n} zoekt zodanig dat
(14) u
n = α
n·λ
0neen oplossing is van de recursie (1). Welnu, invullen van (14) in (1) geeft voor n > 1
(15) λ
0n−2(a·α
n·λ
02 + b·α
n−1·λ
0 + c·α
n−2) = 0
en aangezien λ
0 ≠ 0 geeft dit
(16) a·α
n·λ
02 + b·α
n−1·λ
0 + c·α
n−2 = 0
Nu weten we echter ook dat λ
0 = −b/2a (en dus b ≠ 0 aangezien λ
0 ≠ 0). Substitutie hiervan in (16) en gebruik maken van D = b
2 − 4ac = 0 (en dus 4ac = b
2) levert dan na wat herleiding
(17) α
n − α
n−1 = α
n−1 − α
n−2In woorden: het verschil tussen elk tweetal opeenvolgende termen van de rij {α
n} is constant. De rij {α
n} is dus een willekeurige
rekenkundige rij, en de algemene gedaante van α
n is dus
(18) α
n = α + n·β
waarbij α en β willekeurige constanten zijn. Substitutie van (18) in (14) geeft nu
(19) u
n = (α + n·β)·λ
0nen dit stemt geheel overeen met de eerder gevonden algemene oplossing (13).
That's all.