Litpho | donderdag 23 januari 2003 @ 20:43 |
Vervolg op Hoe sla je 3 jaar Fok! op op je harde schijf? Ik haal met Oracle een inlees- en verwerksnelheid van 200 topics (5684920 bytes) in 98 seconden, maar aangezien er al een aantal goede oplossingen worden gegeven met behulp van oa PHP/MySQL ga ik mijn (incompatible) oplossing niet verder uitwerken. | |
Roonaan | donderdag 23 januari 2003 @ 20:45 |
wbt dat lijstje. kben nergens mee bezig ![]() | |
thetruth | donderdag 23 januari 2003 @ 20:52 |
lol | |
MeAndMyself | donderdag 23 januari 2003 @ 21:05 |
kijk ff in t oude topic..er is iemand die zich aanbiedt ![]() | |
Litpho | donderdag 23 januari 2003 @ 21:10 |
quote:Klopt. Er zijn zelfs meerdere mensen mee bezig. Ik had ook toegezegd er even naar te kijken, ben daar vervolgens gisteren door oa de verkiezingen niet aan toegekomen en heb dat dus vandaag gedaan. Aangezien er al heel aardige oplossingen naar voren kwamen, laat ik de eer van het solliciteren naar de functie van Arcee toch even voorbij gaan. | |
mabit | donderdag 23 januari 2003 @ 21:28 |
maar ik heb nog geen enekele reactie van een rooie gezien...:? | |
Litpho | donderdag 23 januari 2003 @ 21:30 |
quote:Tijn had contact met ze opgenomen, dus ik verwacht eerlijk gezegd dat hij vanzelf wel ergens in dit topic komt opduiken (voordat we met een man of 10 een onbedoelde DDoS-attack uitvoeren op FoK! ![]() | |
mabit | donderdag 23 januari 2003 @ 21:33 |
quote:ik geloof dat die al aardig bezig zijn, maar op zich moet dat geen probleem zijn, t.net haalt ook gemakkelijk 20 pageviews per seconde dus dan moet dit toch ook niet zon probleem opleveren?!! | |
Litpho | donderdag 23 januari 2003 @ 21:34 |
quote:Dat verwacht ik ook niet, maar toch is het wel zo beleefd om even te overleggen met de crew over het laten runnen van een crawler, laat staan een stuk of tien tegelijk. Het levert toch een hogere belasting dan dat die users normaal zouden leveren. | |
KonnieKipke | donderdag 23 januari 2003 @ 22:47 |
wat ik niet begrijp is het volgende: /usr/bin/perl -w use strict; use LWP::Simple; for (@Messages) sub Parse_Msg In welk bestand laat ie de uitvoer nou? [Dit bericht is gewijzigd door KonnieKipke op 23-01-2003 22:59] | |
Hadrian | vrijdag 24 januari 2003 @ 02:00 |
quote:Return value, dus als je die functie aanroept, krijg je dat als waarde terug. Kan je mee doen wat je wil, verderparsen, naar stdout sturen of wat dan ook ![]() | |
Tijn | vrijdag 24 januari 2003 @ 02:09 |
quote:Ik heb alle admins gemaild over de kwestie, maar heb tot op heden nog niks gehoord. Tot die tijd zou ik nog niet al te veel online zetten en wil ik mn eigen computer ook nog niet als database ter beschikking stellen, maar uiteraard is een ieder wel vrij, zo lijkt me, om wat testscripts te proberen etc ![]() | |
K3 | vrijdag 24 januari 2003 @ 02:20 |
quote:Waarom zou je niets on line mogen zetten? Afgezien van copyright zie ik geen problemen aangezien het verkeer van je eigen datalimiet afgaat. Ik heb inmiddels zo'n 240.000 topics binnen (tel uit het aantal reacties) en loopt de database ook al vol. Ik vraag me nu eigenlijk af welke exotische vraagstukken er straks komen om op te queryen ![]() ![]() | |
Tijn | vrijdag 24 januari 2003 @ 02:37 |
quote:Oh van mij mag je best wat online zetten, maar tis natuurlijk niet netjes om alvast een uitgebreid lijstjes topic te openen (al dat niet met url) terwijl de vraag of er wel toestemming gegeven is nog loopt ![]() | |
K3 | vrijdag 24 januari 2003 @ 02:42 |
quote:Ik had niet begrepen dat er toestemming voor nodig was. En aangezien alles online staat, lijkt me dat een beetje voorbarig om te vragen (ik zie online als openbaar, dus vrij om je eigen statistieken op los te laten). Komt er nog bij de vraag van Yvonne wie er toch graag stat wil gaan maken, dan lijkt het me geen probleem (toch?). | |
Tijn | vrijdag 24 januari 2003 @ 02:43 |
quote:Ik verwacht ook geen problemen, tis gewoon alleen netjes, that's all ![]() | |
Chandler | vrijdag 24 januari 2003 @ 06:43 |
quote:moet je voor het leegtrekken niet eerst iets regelen met de FOK admins, want het is niet ff nix, kost veel bandwidth ed.. | |
dolle_hond | vrijdag 24 januari 2003 @ 09:38 |
Arcee deed het voorheen ook zonder bezwaren van Danny ![]() | |
scoutboy | vrijdag 24 januari 2003 @ 09:38 |
Eigenlijk zouden we het inderdaad moeten vragen maar ik heb ondertussen iemand in ons dorp zo goed gevonden om voor mijn te gaan downloaden ![]() | |
K3 | vrijdag 24 januari 2003 @ 10:56 |
Ik denk dat het ook niet erg is als als een paar mensen het spul wegtrekken. Erger wordt het als het enkele tientallen betreft. Vannacht waren mijn logs volgelopen, en is het importeren in de DB bij topic 181xxx blijven hangen, maar alle overtollige zooi is weggegooid, en nu is-ie weer lekker bezig (er staan nu al meer dan 8 miljoen reacties in de DB). Ik ben nu bezig met een script om de active topics bij te houden, zodat de database up to date blijft (zal wel iets worden dat nachtelijk gedraaid wordt). | |
dolle_hond | vrijdag 24 januari 2003 @ 12:10 |
quote:Arcee maakte lijstjes met: dat is wat ik zo uit mijn hoofd nog weet. | |
Tijn | vrijdag 24 januari 2003 @ 12:42 |
quote:Idd, en met welke smileys elke user het meest gebruikte, welke smileys per forum het meest werden gebruikt, welke smileys over heel fok het meest werden gebruikt. Oh en natuurlijk lijstjes van topposters per subforum. En lijstjes van mensen die het vaakst een topic om zeep hielpen (als laatste postte). | |
KonnieKipke | vrijdag 24 januari 2003 @ 13:04 |
quote:K3, zou jij eens je scriptje willen posten dat je gebruikt om al die topics te rippen en daarna in je database te stoppen. Ik heb gister wat met wget geprutst, maar dat bouwt de oorspronkelijk html files vrolijk op. Alvast bedankt. | |
K3 | vrijdag 24 januari 2003 @ 14:27 |
quote:Ik gebruik daar eigenlijk twee scriptjes voor. Eentje slaat alle topics op op de HD als <nummer>.html (Gewoon een lus definiëren die begint bij 0 en eindigt bij 250000 en in die lus met wget de boel naar binnen trekken). Het andere scriptje gaat vervolgens langs die opgeslagen topics om te parsen en in de database te stoppen. Hoe dat scriptje werkt wil ik wel vertellen, maar ik ga geen lappen script posten. Mijn progress: | |
scoutboy | vrijdag 24 januari 2003 @ 14:33 |
quote:Mijn status: Heb op het moment 0 t/m 50.000 in een DB zitten (en i.d.d. op schijf als <nummer>.html Heb ook allemaal nie zoveel tijd... | |
Litpho | vrijdag 24 januari 2003 @ 14:33 |
quote:Ik niet dus. Het lijkt me vrij zinloos om, op het moment dat de meerderheid de voorkeur geeft aan mySQL, mijn persoonlijke voorkeur van Oracle verder te ontwikkelen. Ik heb een testje gedraaid met een paar honderd topics, en ga wel weer verder als daar vraag naar blijkt te zijn. | |
DigiJasper | vrijdag 24 januari 2003 @ 16:35 |
Wat is nou het doel van deze topics ![]() | |
Litpho | vrijdag 24 januari 2003 @ 16:40 |
quote:Iedereen die dat wil de kans geven om te bewijzen dat hij/zij Arcee's hobby zou kunnen overnemen en daar non-constructief over op kunnen scheppen. Lijkt me afdoende. ![]() | |
KonnieKipke | vrijdag 24 januari 2003 @ 17:25 |
quote:*shame* Nu is mijn perl kennis niet zo goed dat ik een dergelijk scriptje zo bouw. Kan jij mijn kennis vergroten door het te verklappen ![]() Kan me wel voorstellen dat het eruit ziet als $url = 'http://forum.fok.nl/showtopic.php/1'; exec 'wget -nd -r -K -p $url'; $newurl = 'http://forum.fok.nl/showtopic.php/1+1' en dan een loop [Dit bericht is gewijzigd door KonnieKipke op 24-01-2003 17:32] | |
Chandler | vrijdag 24 januari 2003 @ 22:53 |
Hoe ik het zou doen... 1. eerst een user database maken want anders heb je nix | |
Tijn | vrijdag 24 januari 2003 @ 22:55 |
Kheb vandaag met Jorma gesproken (admin) en die had er nog even geen standpunt over. Hij zou er binnenkort met Danny over gaan praten. Wel was 'em iig een groot aantal views in het Slowchat Archief opgevallen ![]() | |
Roonaan | zaterdag 25 januari 2003 @ 01:46 |
zeg K3 waar laat jij de titels van de topics dan als ik vragen mag ![]() | |
Chandler | zaterdag 25 januari 2003 @ 07:37 |
Het is echter toch zo simpel, Roonaan kan als hij wilt alles zelf ombouwen en in een database gooien netzoals hij dat deed toen met die layouts ![]() ![]() | |
DJKoster | zaterdag 25 januari 2003 @ 08:00 |
Helaas moeten het aantal slotjes per mod nog handmatig gebeuren.. ![]() Of niet? FB (januari tot 24/1/03 02:41) code: ![]() | |
HighLander | zaterdag 25 januari 2003 @ 13:12 |
quote:Dat was meer een skin die hij eroverheen legde dacht ik toch? met realtime ophalen van de data van 1 enkel topic wat geviewed werd. Niets wat te maken had met een mirror-db. dacht ik. | |
K3 | zaterdag 25 januari 2003 @ 13:25 |
quote:Had ik die niet in de query staan? Ik heb momenteel drie tabellen; reacties, topics en forums. In de reactietabel staan de reactie-eigen zaken als inhoud, datum, username etc. In de topics-tabel de topic-eigen zaken, dus ook de titel. Voor het gemak houd ik daar ook het aantal views en reacties bij voor sneller queryen. Ik heb de hele boel van Fok! er nu instaan en loop nu tegen een heel ander probleem aan: Mijn K6-je op 400 MHz trekt mijn eerste query niet zo lekker (is meer dan een uur bezig om erachter te komen in welk forum ik het meest heb gepost, soort van top tien van fora dus, met postaantal erbij.). Daarbij komt ook nog dat van steeds meer fora de /0 feature niet meer werkt omdat de Fok!database een time-out geeft. Software- en scriptmatig gezien heb ik de boel nu aardig voor elkaar, maar praktisch wil het allemaal nog niet zo. 1: Mijn CPU-tje is te langzaam (heb de boel al naar een snellere PC gekopiëerd, maar die staat niet 24/7 aan). 2: Het leegtrekken van de complete forumlijsten gaat bij steeds minder fora goed (vanwege die /0) De mysql-database is 2,8 GB groot, een query om topposters uit het feedbackforum te halen is gecrashed op mijn K6 en nu ben ik bezig om dezelfde query op de snelle PC uit te voeren. Al met al is het vooral de veelheid aan data die voor problemen zorgt, zowel hier als bij fok (vanwege die time-outs). | |
dolle_hond | woensdag 29 januari 2003 @ 10:02 |
k3: die /0 heb je toch niet nodig, bij elk topic krijg je toch in de header te zien bij welk forum het hoort? of werkt dat niet als je het importeert naar je database? | |
scoutboy | woensdag 29 januari 2003 @ 16:45 |
Maar weer ffkes een update... ben nu bezig om voor de tig'ste keer mijn scriptje te herschrijven ... Hij blijft maar uit mijn geheugen lopen (Ben nu zelfs zo ver dat ik vanavond een script ga schrijven met eigen cache systeem ![]() Maar wat ik vooral wou weten .. wat wil iedereen echt weten. en Is het iemand al gelukt om een goed update script te schrijven want dat wil bij mij nog niet echt lukken Verder heeft er al iemand stats online | |
DJKoster | vrijdag 31 januari 2003 @ 21:06 |
Wie is er zo aardig om hier wat leuke statistiekjes van te maken? | |
yootje | vrijdag 31 januari 2003 @ 22:49 |
quote:Hmm... als ik de bedoeling goed begrijp zou ik dit graag willen weten: Wie het meest heeft gepost vandaag (elke dag updaten) | |
dolle_hond | woensdag 5 februari 2003 @ 10:38 |
stil hier, nog nieuws? | |
Tijn | woensdag 5 februari 2003 @ 10:42 |
Ik heb nog niks gehoord van onze admins, maar ze zouden het gaan bespreken. | |
K3 | woensdag 5 februari 2003 @ 12:18 |
quote:Zonder die /0 moet je te vaak connecten met Fok om na te gaan of topics geupdate zijn. Met /0 heb je per forum snel en makkelijk een overzicht. Overigens moge het duidelijk zijn dat ik niet meer actief bezig ben hiermee, oa omdat ik niet normaal kan queryen op de database (te langzame CPU) en hem dus maar leegekieperd heb (scheelt weer 3GB). | |
Dr_Flash | vrijdag 31 oktober 2003 @ 21:13 |
Oracle, PHP, SQL... kan er niet gewoon iets met FileMaker Pro? ![]() | |
SHERMAN | zaterdag 1 november 2003 @ 22:11 |
volgens mij ligt dit project stil hoor, het is anders al een redelijk datum topic, zal wel geinig zijn als het zou werken eigenlijk | |
Tiemie | zaterdag 1 november 2003 @ 22:26 |
Als er nog mensen zijn die dit 'project' opnieuw willen starten doe ik wel mee ![]() | |
KonnieKipke | zaterdag 1 november 2003 @ 22:42 |
hmmmz.. Het project blijft wel leuk. | |
dolle_hond | zondag 2 november 2003 @ 11:46 |
de time-outs zijn verholpen door een licht gewijzigde structuur... |