[PHP/(My)SQL] voor dummies #115

FOK!mycroftheld zaterdag 26 april 2014 @ 18:07:29 #91

bondage

Ingewikkeld

Ik heb de twee query's getest met het volgende resultaat (uiteraard SQL_NO_CACHE toegevoegd):

Jouw query:

Weergave van records 100 - 99 ( 100 totaal, query duurde 0.8366 sec)

1
2
3
4

id     select_type     table     type     possible_keys     key     key_len     ref     rows     Extra
1     SIMPLE     search_user_post     ref     topicid,tijdstip,auteur,year     auteur     4     const     12009     Using where; Using temporary; Using filesort
1     SIMPLE     friend_post     ref     topicid,auteur     topicid     4     fokstats.search_user_post.topicid     100     Using where
1     SIMPLE     u     eq_ref     PRIMARY     PRIMARY     4     fokstats.friend_post.auteur     1

Mijn query:

Weergave van records 100 - 99 ( 100 totaal, query duurde 4.1594 sec)

1
2
3
4
5
6

id     select_type     table     type     possible_keys     key     key_len     ref     rows     Extra
1     PRIMARY     <derived2>     ALL     NULL    NULL    NULL    NULL    2919     Using temporary; Using filesort
2     DERIVED     <derived3>     ALL     NULL    NULL    NULL    NULL    110     Using temporary; Using filesort
2     DERIVED     fok_post     ref     topicid,auteur     topicid     4     t.topicid     100     Using where
2     DERIVED     fok_user     eq_ref     PRIMARY     PRIMARY     4     fokstats.fok_post.auteur     1
3     DERIVED     fok_post     ref     tijdstip,auteur,year     auteur     4         12008     Using where; Using temporary

Die van jou is een stuk sneller. Ik ga even testen over langere periodes. Als dit goed werkt kan ik dit beter gebruiken dan de PHP oplossing.

[ Bericht 7% gewijzigd door bondage op 26-04-2014 18:18:21 ]

FOK!stats | Mycroft | DTS!stats

maandag 28 april 2014 @ 09:40:11 #92

Sitethief

Fulltime Flapdrol

Is het niet sowieso handiger om zoveel mogelijk het ophalen van de juiste data door een database engine te laten doen ipv dat ik PHP na te gaan bootsen? De database engine zal hierin bijna altijd sneller zijn, tenzij je 10 subqueries ofzo gebruikt.

Stroek: Sitethief, die is heel groot en sterk :Y.
Faat: *zucht* zoals gewoonlijk hoor Sitethief weer in de bocht >:)

FOK!mycroftheld maandag 28 april 2014 @ 10:27:50 #93

bondage

Ingewikkeld

quote:
Op maandag 28 april 2014 09:40 schreef Sitethief het volgende:
Is het niet sowieso handiger om zoveel mogelijk het ophalen van de juiste data door een database engine te laten doen ipv dat ik PHP na te gaan bootsen? De database engine zal hierin bijna altijd sneller zijn, tenzij je 10 subqueries ofzo gebruikt.

De rest van de stats worden gegenereerd door Sphinx, echter heeft Sphinx niet de mogelijkheid om op meerdere velden te groeperen. Als ik dit volledig in Sphinx zou kunnen doen zou het een stuk sneller gaan.

Maar ik realiseer me nu dat ik dit beter op kan lossen dmv een query ipv de data door php te laten verwerken.

Een andere optie is een betere server aanschaffen, daar heb ik echter op dit moment geen geld voor

FOK!stats | Mycroft | DTS!stats

maandag 28 april 2014 @ 19:09:55 #94

Light

quote:
Op maandag 28 april 2014 10:27 schreef bondage het volgende:

[..]

De rest van de stats worden gegenereerd door Sphinx, echter heeft Sphinx niet de mogelijkheid om op meerdere velden te groeperen. Als ik dit volledig in Sphinx zou kunnen doen zou het een stuk sneller gaan.

Maar ik realiseer me nu dat ik dit beter op kan lossen dmv een query ipv de data door php te laten verwerken.

Een andere optie is een betere server aanschaffen, daar heb ik echter op dit moment geen geld voor

Voer je die query uit op een 'eigen' server? Als in een database-server die je zelf beheert en waar je indexen kunt aanpassen? Dan moet er nog wel wat snelheidswinst te behalen zijn.

fokstok.nl

FOK!mycroftheld maandag 28 april 2014 @ 22:54:08 #95

bondage

Ingewikkeld

quote:
Op maandag 28 april 2014 19:09 schreef Light het volgende:

[..]

Voer je die query uit op een 'eigen' server? Als in een database-server die je zelf beheert en waar je indexen kunt aanpassen? Dan moet er nog wel wat snelheidswinst te behalen zijn.

Jup, is mijn eigen server. Dit zijn de velden en indexen die ik momenteel heb:

FOK!stats | Mycroft | DTS!stats

maandag 28 april 2014 @ 22:59:10 #96

Light

quote:
Op maandag 28 april 2014 22:54 schreef bondage het volgende:

[..]

Jup, is mijn eigen server. Dit zijn de velden en indexen die ik momenteel heb:

[ afbeelding ]

[ afbeelding ]

Hmm... year heeft een kardinaliteit van 1. Heb je alleen posts uit 2014 in de database staan?

fokstok.nl

FOK!mycroftheld maandag 28 april 2014 @ 23:01:43 #97

bondage

Ingewikkeld

quote:
Op maandag 28 april 2014 22:59 schreef Light het volgende:

[..]

Hmm... year heeft een kardinaliteit van 1. Heb je alleen posts uit 2014 in de database staan?

Dat viel mij ook al op idd. Er staat 6 jaar aan data in die tabel.

Is het overigens erg dat id een int(15) is? Ik heb deze database ooit van iemand overgenomen en hier niet bij stilgestaan, ik weet echter dat een gewone int niet tot 15 gaat.

FOK!stats | Mycroft | DTS!stats

maandag 28 april 2014 @ 23:13:37 #98

Light

quote:
Op maandag 28 april 2014 23:01 schreef bondage het volgende:

[..]

Dat viel mij ook al op idd. Er staat 6 jaar aan data in die tabel.

Mooi

Dan zou ik de index "auteur" wijzigen en er "year" als tweede kolom aan toevoegen. Een index mag namelijk meer dan 1 kolom bevatten

(Je zou ook nog in plaats van "year" de kolom "tijdstip" kunnen toevoegen, maar ik vermoed dat het verschil vrij klein is terwijl de index veel groter kan worden.)

quote:
Is het overigens erg dat id een int(15) is? Ik heb deze database ooit van iemand overgenomen en hier niet bij stilgestaan, ik weet echter dat een gewone int niet tot 15 gaat.

Nee, dat getal maakt alleen uit als je zerofill gebruikt. En dat wil je niet (want voorloopnullen toevoegen hoort de database niet te doen).

fokstok.nl

FOK!mycroftheld maandag 28 april 2014 @ 23:19:13 #99

bondage

Ingewikkeld

quote:
Op maandag 28 april 2014 23:13 schreef Light het volgende:

[..]

Mooi Dan zou ik de index "auteur" wijzigen en er "year" als tweede kolom aan toevoegen. Een index mag namelijk meer dan 1 kolom bevatten

(Je zou ook nog in plaats van "year" de kolom "tijdstip" kunnen toevoegen, maar ik vermoed dat het verschil vrij klein is terwijl de index veel groter kan worden.)

[..]

Nee, dat getal maakt alleen uit als je zerofill gebruikt. En dat wil je niet (want voorloopnullen toevoegen hoort de database niet te doen).

Dank, ik ga die twee indices even combineren en de query dan nogmaals testen. Ik gebruik geen zerofill dus dat is dan geen probleem gelukkig.

Wat is eigenlijk het voordeel van het combineren van die twee?

FOK!stats | Mycroft | DTS!stats

dinsdag 29 april 2014 @ 09:59:27 #100

KomtTijd...

Volgens mij kun je year beter helemaal uit de query halen en gewoon zorgen dat je tijdstippen nooit meerdere jaren overspannen.

zcflevo.nl

FOK!mycroftheld dinsdag 29 april 2014 @ 10:08:05 #101

bondage

Ingewikkeld

quote:
Op dinsdag 29 april 2014 09:59 schreef KomtTijd... het volgende:
Volgens mij kun je year beter helemaal uit de query halen en gewoon zorgen dat je tijdstippen nooit meerdere jaren overspannen.

Als ik year uit de query haal en vervolgens dit jaar uitdraai duurt de query een stuk langer dan met year erin. Blijkbaar heeft de index voor dat veld wel effect. Ik had het primair toegevoegd voor het indexeringsproces omdat er per jaar een losse Sphinx index wordt gemaakt, op deze manier hoeft niet steeds alle data opnieuw verwerkt te worden. Dmv het year veld en bijbehorende index is ook die query een stuk sneller.

FOK!stats | Mycroft | DTS!stats

dinsdag 29 april 2014 @ 21:23:17 #102

Light

quote:
Op dinsdag 29 april 2014 09:59 schreef KomtTijd... het volgende:
Volgens mij kun je year beter helemaal uit de query halen en gewoon zorgen dat je tijdstippen nooit meerdere jaren overspannen.

Dan wil je wel heel zeker weten dat er een index op (auteur, tijdstip) wordt gebruikt. En ik weet niet hoe goed MySQL omgaat met een index die als range wordt gebruikt (BETWEEN) in combinatie met een andere index. Hoe beperkter het resultaat van een index is, hoe beter.

fokstok.nl

dinsdag 29 april 2014 @ 21:27:42 #103

Light

quote:
Op maandag 28 april 2014 23:19 schreef bondage het volgende:

[..]

Dank, ik ga die twee indices even combineren en de query dan nogmaals testen. Ik gebruik geen zerofill dus dat is dan geen probleem gelukkig.

Wat is eigenlijk het voordeel van het combineren van die twee?

Je maakt het MySQL op die manier makkelijker om twee kolommen te gebruiken in een index, waardoor de resultaatset kleiner wordt. En dat helpt weer om de snelheid omhoog te krijgen

MySQL wordt ook wel beter in het combineren van twee losse indexen, maar dat levert volgens mij nog niet hetzelfde resultaat op.

Overigens is een index op (auteur, year) ook nog steeds te gebruiken als index op auteur maar het is niet te gebruiken als index op year. Als je die ook los nodig hebt, moet je daar dus een aparte index voor maken / houden.

fokstok.nl

FOK!mycroftheld dinsdag 29 april 2014 @ 21:31:54 #104

bondage

Ingewikkeld

quote:
Op dinsdag 29 april 2014 21:27 schreef Light het volgende:

[..]

Je maakt het MySQL op die manier makkelijker om twee kolommen te gebruiken in een index, waardoor de resultaatset kleiner wordt. En dat helpt weer om de snelheid omhoog te krijgen MySQL wordt ook wel beter in het combineren van twee losse indexen, maar dat levert volgens mij nog niet hetzelfde resultaat op.

Overigens is een index op (auteur, year) ook nog steeds te gebruiken als index op auteur maar het is niet te gebruiken als index op year. Als je die ook los nodig hebt, moet je daar dus een aparte index voor maken / houden.

Duidelijk.

En de year index heb ik inderdaad nodig aangezien die ook in de query van de Sphinx indexer wordt gebruikt. Ik ga nu de bestaande index op auteur verwijderen en van year en auteur een gecombineerde index maken. De losse year index laat ik gewoon staan. Ik post straks de resultaten incl. de output van EXPLAIN. Het aanpassen van de index gaat wel ff duren aangezien het om een erg grote tabel gaat.

Edit: ik kan blijkbaar de bestaande auteur index gewoon wijzigen. Heb year toegevoegd, de server is nu ff bezig.

FOK!stats | Mycroft | DTS!stats

FOK!mycroftheld dinsdag 29 april 2014 @ 22:53:26 #105

bondage

Ingewikkeld

Het duurde even maar de index is klaar. Dit is wat ik nu heb:

Ik ga morgen ff testen, nu ff geen tijd meer voor aangezien ik zo naar bed ga. Moet morgen weer vroeg op.

FOK!stats | Mycroft | DTS!stats

woensdag 30 april 2014 @ 15:01:22 #106

slacker_nl

Sicko pur sang

Omdat ik soms zo loop te miepen over tests:

In theory there is no difference between theory and practice. In practice there is.

woensdag 30 april 2014 @ 15:30:49 #107

Sitethief

Fulltime Flapdrol

quote:
Op woensdag 30 april 2014 15:01 schreef slacker_nl het volgende:
Omdat ik soms zo loop te miepen over tests:

[ afbeelding ]

Wat moet dit voorstellen

Stroek: Sitethief, die is heel groot en sterk :Y.
Faat: *zucht* zoals gewoonlijk hoor Sitethief weer in de bocht >:)

woensdag 30 april 2014 @ 17:53:19 #108

slacker_nl

Sicko pur sang

quote:
Op woensdag 30 april 2014 15:30 schreef Sitethief het volgende:

[..]

Wat moet dit voorstellen

100% code coverage! (dit laat Devel::Cover zien en aangezien er weinig perl mensjes zijn ging ik de PHP mensjes spammen

)

[ Bericht 17% gewijzigd door slacker_nl op 30-04-2014 17:58:32 ]

In theory there is no difference between theory and practice. In practice there is.

woensdag 30 april 2014 @ 18:42:37 #109

Light

quote:
Op woensdag 30 april 2014 17:53 schreef slacker_nl het volgende:

[..]

100% code coverage! (dit laat Devel::Cover zien en aangezien er weinig perl mensjes zijn ging ik de PHP mensjes spammen )

Ziet er wel leuk uit, die statistieken

Maar wat is er zo bijzonder aan die test met als time 85.9? Die duurt wel erg lang.

fokstok.nl

woensdag 30 april 2014 @ 20:59:52 #110

slacker_nl

Sicko pur sang

quote:
Op woensdag 30 april 2014 18:42 schreef Light het volgende:

[..]

Ziet er wel leuk uit, die statistieken
Maar wat is er zo bijzonder aan die test met als time 85.9? Die duurt wel erg lang.

Dat is 000-package.t, daarin worden de volgende zaken getest:
1) MANIFEST file ok
2) Modules compilen ok
3) POD (documentatie) syntax ok
4) POD coverage ok (dus doc je ook al je functies)
5) Compilen je scripts ok

Die duren wat langer, echt niet zo spannend allemaal. Dat zijn eigenlijk release-only tests.

In theory there is no difference between theory and practice. In practice there is.

woensdag 30 april 2014 @ 21:31:49 #111

Light

quote:
Op woensdag 30 april 2014 20:59 schreef slacker_nl het volgende:

[..]

Dat is 000-package.t, daarin worden de volgende zaken getest:
1) MANIFEST file ok
2) Modules compilen ok
3) POD (documentatie) syntax ok
4) POD coverage ok (dus doc je ook al je functies)
5) Compilen je scripts ok

Die duren wat langer, echt niet zo spannend allemaal. Dat zijn eigenlijk release-only tests.

Dan snap ik wel dat die tests ook lang duren (in ieder geval in verhouding).

fokstok.nl

FOK!mycroftheld woensdag 30 april 2014 @ 22:15:48 #112

bondage

Ingewikkeld

Hmm, de query is met deze nieuwe index trager geworden. Hij duurde eerst 0,83 seconden, nu 3,46. Ik heb exact dezelfde parameters gebruikt als de vorige keer toen de indices nog niet gecombineerd waren.

Dit is de explain:

Ik heb de query van Light gebruikt aangezien die sowieso al sneller was dan die van mij.

1
2
3
4
5
6
7
8
9
10
11
12
13

SELECT count(DISTINCT friend_post.topicid) cnt, u.naam
FROM fok_user u
INNER JOIN fok_post search_user_post
ON search_user_post.auteur = 128465
AND search_user_post.tijdstip BETWEEN UNIX_TIMESTAMP('2014-04-01 00:00:01') AND UNIX_TIMESTAMP('2014-04-26 23:59:59')
AND search_user_post.year = 2014
INNER JOIN fok_post friend_post
ON friend_post.auteur = u.id
AND friend_post.auteur != 128465
AND friend_post.topicid = search_user_post.topicid
GROUP BY u.naam
ORDER BY cnt DESC
LIMIT 100;

FORCE INDEX gebruiken misschien?

FOK!stats | Mycroft | DTS!stats

woensdag 30 april 2014 @ 22:35:08 #113

Light

quote:
Op woensdag 30 april 2014 22:15 schreef bondage het volgende:
Hmm, de query is met deze nieuwe index trager geworden. Hij duurde eerst 0,83 seconden, nu 3,46. Ik heb exact dezelfde parameters gebruikt als de vorige keer toen de indices nog niet gecombineerd waren.

Dit is de explain:
[ afbeelding ]

Ik heb de query van Light gebruikt aangezien die sowieso al sneller was dan die van mij.
[ code verwijderd ]

FORCE INDEX gebruiken misschien?

Hmm... da's wel onverwacht... het (geschatte) aantal rijen voor de eerste query gaat van 12.000 naar 2.400 en toch is de query veel trager...

fokstok.nl

FOK!mycroftheld woensdag 30 april 2014 @ 22:36:02 #114

bondage

Ingewikkeld

quote:
Op woensdag 30 april 2014 22:35 schreef Light het volgende:

[..]

Hmm... da's wel onverwacht... het (geschatte) aantal rijen voor de eerste query gaat van 12.000 naar 2.400 en toch is de query veel trager...

Jup, ik snap er ook niets van

Ik ga voor de zekerheid toch ff FORCE INDEX proberen.

FOK!stats | Mycroft | DTS!stats

woensdag 30 april 2014 @ 22:37:20 #115

Light

quote:
Op woensdag 30 april 2014 22:36 schreef bondage het volgende:

[..]

Jup, ik snap er ook niets van Ik ga voor de zekerheid toch ff FORCE INDEX proberen.

Ik kan me niet voorstellen dat dat helpt, omdat de juiste index al wordt gebruikt.

fokstok.nl

FOK!mycroftheld woensdag 30 april 2014 @ 23:15:39 #116

bondage

Ingewikkeld

quote:
Op woensdag 30 april 2014 22:37 schreef Light het volgende:

[..]

Ik kan me niet voorstellen dat dat helpt, omdat de juiste index al wordt gebruikt.

Zou een gecombineerde index op topic_id en auteur misschien een optie zijn?

FOK!stats | Mycroft | DTS!stats

vrijdag 2 mei 2014 @ 21:50:05 #117

Light

quote:
Op woensdag 30 april 2014 23:15 schreef bondage het volgende:

[..]

Zou een gecombineerde index op topic_id en auteur misschien een optie zijn?

Dat lijkt me niet nuttig, in ieder geval niet in die volgorde.

fokstok.nl

FOK!mycroftheld maandag 5 mei 2014 @ 16:08:01 #118

bondage

Ingewikkeld

Heeft de table collation invloed op de gegevens die in de velden staat? Stel dat de table collation op latin1_swedish_ci staat maar de velden in de tabel op utf8_unicode_ci, heeft dit dan gevolgen?

De documentatie zegt hier het volgende over:

quote:
The table character set and collation are used as default values for column definitions if the column character set and collation are not specified in individual column definitions. The table character set and collation are MySQL extensions; there are no such things in standard SQL.

Dit doet mij vermoeden dat het alleen om een standaardwaarde gaat en dit verder geen invloed heeft op de data in de tabel.

FOK!stats | Mycroft | DTS!stats

maandag 5 mei 2014 @ 16:43:50 #119

wipes66

nvmd

..///

maandag 5 mei 2014 @ 22:06:33 #120

TwenteFC

Oh god, heb een boek gekocht over Test driven development, gaat het dan toch nog gebeuren?

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» digital corner

» development

» digital corner

» development