Jawel, 'met topicstarter' aangeven. De topicstarter is namelijk ook bij de data van het topic meegeindexeerd.quote:Op woensdag 19 maart 2008 23:55 schreef NED het volgende:
Ow, het zal wel de bedoeling zijn neem ik aan, maar ik kan niet op alleen een topicstarter zoeken?
Als ik alleen daar 'WebForce' invul vind hij niets...quote:Op woensdag 19 maart 2008 23:59 schreef The_Terminator het volgende:
[..]
Jawel, 'met topicstarter' aangeven. De topicstarter is namelijk ook bij de data van het topic meegeindexeerd.
Zowel bij het zoeken naar veld en bij 'met topicstarter'. Dit is een beetje omslachtig maar dat ga ik nog aanpassenquote:Op donderdag 20 maart 2008 00:00 schreef WebForce het volgende:
[..]
Als ik alleen daar 'WebForce' invul vind hij niets...
Klopt, maar 200.000 topics is minder dan 20% van FOK!. Dit wordt uiteraard wel meer, maar ik moet dit eerst werkende zien te krijgen onder Zend Lucene, dat is veel sneller dan FULLTEXT wat bij MySQL ingebouwd zit.quote:Op donderdag 20 maart 2008 00:09 schreef Farenji het volgende:
Mooi werk! werkt verdomde snel en hij lijkt best veel te vinden! Ik vind hem nu al bruikbaarder dan dat prutswerk van roonaan.
Het werkt idd niet om alleen op topicstarter te zoeken zonder dat je een zoekterm invult.
Ook vind ik toch nog niet alles terug - om een voorbeeld te geven, als ik op "gnostiek" zoek dan vind ik maar 1 topic - met google vind ik er veel meer, bijv deze: De gnostiek.
Tof!quote:Op donderdag 20 maart 2008 00:01 schreef The_Terminator het volgende:
[..]
Zowel bij het zoeken naar veld en bij 'met topicstarter'. Dit is een beetje omslachtig maar dat ga ik nog aanpassen
Nee, het zijn alleen gedeelten van die jaren. Ik heb meerdere indexers openstaan (werkt vannuit een browser) en ze doen elk een jaar met elk 1 topic per 2 seconden.quote:Op donderdag 20 maart 2008 00:15 schreef NED het volgende:
Heb je tussen 2002 en 2006 alles geindexeerd?
Hij vind tussen eind januari ofzo 2006 en eind januari 2002 niets als TS
Nou heb ik dat accoutn ook een poos in de koelkast gehad, maar volgens mij toch echt geen 4 jaar ::?
Niet zo heel lang, aangezien dit gebruikmaakt van een simpele MySQL query is er niet veel code vereist, het meeste werk zat dan ook in het schrijven van het indexeer script en het indexeren zelf. Ik denk dat ik ongeveer een dag in totaal kwijt ben geweest (in uren) aan het schrijven en testen van het script, echter ben ik er lang niet elke dag mee bezig geweest vanwege werk en andere verplichtingen, dit is hoogstens een paar uur per week geweest.quote:Op donderdag 20 maart 2008 01:47 schreef NED het volgende:
Hoelang ben je hier nou in totaal mee bezig geweest?
In uren dan?
Een dag in totaal.quote:Op donderdag 20 maart 2008 06:28 schreef The_Terminator het volgende:
[..]
Niet zo heel lang, aangezien dit gebruikmaakt van een simpele MySQL query is er niet veel code vereist, het meeste werk zat dan ook in het schrijven van het indexeer script en het indexeren zelf. Ik denk dat ik ongeveer een dag in totaal kwijt ben geweest (in uren) aan het schrijven en testen van het script, echter ben ik er lang niet elke dag mee bezig geweest vanwege werk en andere verplichtingen, dit is hoogstens een paar uur per week geweest.
Just get a lifequote:Op donderdag 20 maart 2008 06:28 schreef The_Terminator het volgende:
[..]
Niet zo heel lang, aangezien dit gebruikmaakt van een simpele MySQL query is er niet veel code vereist, het meeste werk zat dan ook in het schrijven van het indexeer script en het indexeren zelf. Ik denk dat ik ongeveer een dag in totaal kwijt ben geweest (in uren) aan het schrijven en testen van het script, echter ben ik er lang niet elke dag mee bezig geweest vanwege werk en andere verplichtingen, dit is hoogstens een paar uur per week geweest.
Het is natuurlijk wel zo dat een complete search ook daadwerkelijk in berichten zelf zoekt en dat die optie door de gebruiker in of uitgeschakeld kan worden. Het probleem is echter dat als ik alle data wil indexeren dat een database van een aantal gig opleverd, en dat bevorderd de snelheid niet echt. Misschien dat ik dat nog aan ga passen als ik het werkende heb onder Lucene, dat is een stuk sneller namelijk.quote:Op donderdag 20 maart 2008 09:53 schreef NED het volgende:
[..]
Een dag in totaal.
Godsklere zeg! En dan heeft Danny ons zo in de kou laten staan al die jaren voor iets wat slechts een dagje werk is!
Mooi dat er eindelijk iets fatsoenlijks gemaakt is
Jup, dat kanquote:Op donderdag 20 maart 2008 20:50 schreef gebrokenglas het volgende:
Zou de lijst met alle fora gealfabetiseerd kunnen worden? Dat zou het selecteren erg vergemakkelijken.
Nu is hij volgens mij random.
Het probleem is (maar dat had je zelf ook vast al bedacht) dat met het meenemen van andere posts het ranking algoritme ingewikkelder wordt - je wil de topictitel en de startpost zwaarder laten wegen dan de overige posts en dan voldoet de fulltext search van mysql al niet meer. Geen idee of Lucene daar wel in voorziet, ik weet daar niks vanaf. Maar het lijkt me wel een flinke stap van de search zoals je hem nu hebt en bijv de search zoals die in de oude fok zat van een aantal jaar geleden, toen de db nog te behappen was, nog ver voor replique.quote:Op donderdag 20 maart 2008 19:07 schreef The_Terminator het volgende:
[..]
Het is natuurlijk wel zo dat een complete search ook daadwerkelijk in berichten zelf zoekt en dat die optie door de gebruiker in of uitgeschakeld kan worden. Het probleem is echter dat als ik alle data wil indexeren dat een database van een aantal gig opleverd, en dat bevorderd de snelheid niet echt. Misschien dat ik dat nog aan ga passen als ik het werkende heb onder Lucene, dat is een stuk sneller namelijk.
Idd, woorden korter dan 4 letters staan er niet in. Hier kun je de mogelijke operatoren vinden: http://www.thuisserver.net/foksearch/zoektips.phpquote:Op vrijdag 21 maart 2008 01:57 schreef Palomar het volgende:
Ziet er goed uitKun je ook op meerdere woorden zoeken dmv. AND? Ik heb het idee dat je alleen OR kunt doen. Als je bijv. zoekt op "nokia n73" (zonder aanh.tekens) of "nokia AND n73" of "+nokia +n73" of "+nokia + n73" dan krijg ik allemaal topics waar alleen "nokia" in de startpost staat.
[edit] misschien beetje ongelukkige zoekterm gebruikt, want "n73" komt in zn geheel nog niet voor in de database zie ik. Met andere zoektermen lijkt het beter te werken, met plusjes ervoor om AND te zoeken.
Je weet hoeveel posts FOK! heeft he?quote:Op vrijdag 21 maart 2008 02:18 schreef hello_moto1992 het volgende:
Misschien dat het helemaal tip-top gemaakt kan worden door alle posts ook mee te nemen en dan te integreren in FOK! zelf.
Achja help nog meer fabels in de wereldquote:Op vrijdag 21 maart 2008 02:47 schreef The_Terminator het volgende:
[..]
Je weet hoeveel posts FOK! heeft he?
Dit is opzich wel mogelijk en Lucene zou er geen probleem mee mogen hebben, echter heeft dit een gigantische database tot gevolg, en 32-bit systemen kunnen maar een index van rond de 2 gig aan.
Tja, natuurlijk is er ook nog Xapian, dat heb ik ook op mijn server geinstalleerd maar ik kan nergens goede voorbeelden vinden.quote:Op vrijdag 21 maart 2008 02:50 schreef Skinkie het volgende:
[..]
Achja help nog meer fabels in de wereldOk wellicht ben ik betere kwaliteit software gewend. Leuk initiatief van een 'crew' member. Maar helaas vind ik het weer zo sneu dat er een perfecte index was, zelfs met Nederlandse stemming algoritmes, en lekkere interface en dat er nu weer iets anders is...
Gaat dan ook via google.quote:Op zaterdag 22 maart 2008 18:50 schreef gebrokenglas het volgende:
Ja ik stond ook echt versteld van de snelheid. Met het klikken stond het er ook al.
quote:Op zondag 23 maart 2008 00:40 schreef F04 het volgende:
Naah, een vlotte snelle search is dat. Alleen die van Got is sneller en beter.
Echnie.quote:Op zondag 23 maart 2008 00:40 schreef F04 het volgende:
Alleen die van Got is sneller en beter.
Bij de zoekfunctie rechtsboven in beeld wel hoorquote:
Thanksquote:Op zondag 23 maart 2008 14:01 schreef roediej het volgende:
netjes gemaakt!, mijn complimenten
Tof topic.quote:Op woensdag 26 maart 2008 02:04 schreef Juup© het volgende:
Met dank aan Asta la vista meneer
Kijk mij nou!!!!
Heb ik lang niet kunnen vinden. Mijn dank is groot.
Misschien de mogelijkheid om twee tijdsperiodes in te vullen waar tussen gezocht moet worden?quote:Op woensdag 26 maart 2008 02:08 schreef mcDavid het volgende:
Vraagje heh, zou de search op relevantie iets meer naar de datum kunnen kijken?
Een topic uit 1999 kun je nauwelijks relevant noemen, ook al voldoet het hardstikke netjes aan je zoekopdracht...
Dat is wel een goed idee inderdaad. Ik kan er inderdaad voor zorgen dat topics met dat soort data minder relevant worden. Ik ga er echter wel een checkbox zij zetten zodat die optie ook uitgeschakeld kan worden.quote:Op woensdag 26 maart 2008 02:08 schreef mcDavid het volgende:
Vraagje heh, zou de search op relevantie iets meer naar de datum kunnen kijken?
Een topic uit 1999 kun je nauwelijks relevant noemen, ook al voldoet het hardstikke netjes aan je zoekopdracht...
Dat zou ook kunnen, aangezien ik de datum ook bijhou alszijde fulltext.quote:Op woensdag 26 maart 2008 02:13 schreef Juup© het volgende:
[..]
Misschien de mogelijkheid om twee tijdsperiodes in te vullen waar tussen gezocht moet worden?
Das ook wel een goeie.quote:Op woensdag 26 maart 200802:20 schreef The_Terminator het volgende:
[..]
Dat is wel een goed idee inderdaad. Ik kan er inderdaad voor zorgen dat topics met dat soort data minder relevant worden. Ik ga er echter wel een checkbox zij zetten zodat die optie ook uitgeschakeld kan worden.
quote:Resultaten:
For: Topicnaam:Topicstarter: Datum:
GC Voorspel hier de nieuwe Jamba hype's Jegorex 9 maart 2008 @ 13:29
Er zijn 2 resultaten gevonden, zoekquery uitgevoerd in 0.00 seconden.
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |