Het liefste zou ik de source hier posten. Het werkt op basis van python met wat libraries, er wordt tijdelijk data opgeslagen in een sqllite database (zodat je apart kunt scrapen). Maargoed, het is niet leuk voor FOK! als iedereen het gaat gebruiken ivm mogelijke performance issues . Had nog wel even de AV doorgelezen om te keken of het mocht en daar stond niks over in.quote:Op dinsdag 30 mei 2017 11:37 schreef jogy het volgende:
De ' ' smiley is meestal wel een negatieve indicator. De [ afbeelding ] ook. Dat zijn zo op het eerste gezicht degene die het 'eerlijkst' gebruikt worden.
Je hebt verder ook FOK!kers die permanent en overal negatief zijn dus die zou je ook kunnen gebruiken of je maakt zelf een beginnetje door een woordenlijst die over het algemeen gebruikt wordt in een negatieve post. Zoiets. Wel een tof project trouwens, ik ben benieuwd naar je voortgang .
Voor PI's zal ik het oude 'johnnyknoxville' document wel eens weer naar boven toveren .quote:Op dinsdag 30 mei 2017 11:41 schreef jogy het volgende:
Of begin inderdaad eerst door de 'makkelijkste/eerlijkste/minst sarcastische' users te selecteren voor je training. Is even wat handmatig gedoe maar dan heb je in ieder geval een redelijke basis. Er zijn vast nog wel een paar mensen die bijvoorbeeld post-icoontjes gebruiken om daadwerkelijk aan te geven wat de bedoeling is van de post.
De source hier neergooien lijkt me ook niet het meest geweldige plan eigenlijk, gewoon centraal houden dat iedereen gebruik maakt van dezelfde libraries en het forum niet onnodig word gebruikt.quote:Op dinsdag 30 mei 2017 12:20 schreef Maanvis het volgende:
Het liefste zou ik de source hier posten. Het werkt op basis van python met wat libraries, er wordt tijdelijk data opgeslagen in een sqllite database (zodat je apart kunt scrapen). Maargoed, het is niet leuk voor FOK! als iedereen het gaat gebruiken ivm mogelijke performance issues . Had nog wel even de AV doorgelezen om te keken of het mocht en daar stond niks over in.
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.Iedereen is de hoofdrolspeler van zijn eigen comedie.
'Goatboy is hurt by your indifference'
<a href="https://www.youtube.com/watch?v=M9srplWe_QQ" target="_blank" rel="nofollow">Vrijheid</a>
[b]Dean Radin presenteert: "Science and the taboo of psi"[/b]
quote:Op dinsdag 30 mei 2017 13:01 schreef jogy het volgende:
[..]
De source hier neergooien lijkt me ook niet het meest geweldige plan eigenlijk, gewoon centraal houden dat iedereen gebruik maakt van dezelfde libraries en het forum niet onnodig word gebruikt.Ik ken dat tooltje niet eens meer, dus geen idee waar je het over hebt.SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
Nou ja, je was behoorlijk aan het drammen over dat tooltje destijds en dan is het wel raar dat je nu zelf op vergelijkbare wijze iets wilt doen dat dan blijkbaar voor jou wél oké is enkel en alleen omdat dit jouw projectje is. Ik denk dat daarop wordt gedoeld.quote:Op dinsdag 30 mei 2017 13:34 schreef Maanvis het volgende:
[..]
Ik ken dat tooltje niet eens meer, dus geen idee waar je het over hebt.
quote:Op dinsdag 30 mei 2017 13:34 schreef Maanvis het volgende:
[..]
Ik ken dat tooltje niet eens meer, dus geen idee waar je het over hebt.
1 | if TS = Iwanius then SENTIMENT=N |
Dit is puur een analyse, de data wordt niet bewaard . Vergelijkbaar met wat Arcee doet/deed dus, en drammen was het ook niet echt. Sorry als het destijds zo over kwam maar ja ouwe koeien hequote:Op dinsdag 30 mei 2017 13:38 schreef Danny het volgende:
[..]
Nou ja, je was behoorlijk aan het drammen over dat tooltje destijds en dan is het wel raar dat je nu zelf op vergelijkbare wijze iets wilt doen dat dan blijkbaar voor jou wél oké is enkel en alleen omdat dit jouw projectje is. Ik denk dat daarop wordt gedoeld.
SPOILER: meest positieve replies in ONZOm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.SPOILER: meest negatieve in ONZOm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.Kortom, wat ik nog moet doen is denk ik filteren op smiley only reacties. Alhoewel die zeer positief zijn of negatief zijn is het natuurlijk wel zo dat het niet fijn werkt om echt de tekst te analyseren.
Wordclouds zijn daarentegen weer wel leuk. Hier 1 van mezelf (van een paar myat lijsten van mezelf)
Of voor een aantal fora (ik denk dat je wel kunt raden welke dit zijn )
Je kunt zo'n wordcloud dan ook transponeren over iemands usericon, maar het eindresultaat is dan nog niet echt om over naar huis te schrijven:
Anyway, zoals je waarschijnlijk wel ziet zitten in die wordcloud alleen zelfstandige naamwoorden. Dat komt omdat je anders wordclouds krijgt vol met 'de het een van op naast' etc . Dus gebruik ik de 'pattern' library om alleen zelfstandige naamwoorden te krijgen. Deze library gebruik ik overigens ook voor de sentimentanalyse zelf, maar deze is nog niet zo accuraat als ik zou willen.
Verder gebruik ik https://github.com/amueller/word_cloud deze library voor de wordclouds, en voor het scrapen gewoon standaard functionaliteit die in python zit (session en request libraries).Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
thxquote:Op dinsdag 20 juni 2017 00:41 schreef jogy het volgende:
Tof! Leuk dat je er vervolg aan geeft, leuk experiment, Maanvis.
Je wilt sturen op een voorspellende factor welke posts weggemodereerd worden?quote:Op dinsdag 20 juni 2017 19:49 schreef TwenteFC het volgende:
Mag hier serieus op geantwoord worden of is dit sowieso een no-go op fok?
Ik wil ook geen scriptkiddies aanzetten tot een (onbedoelde) dos aanval op FOK! doordat ze met een aantal vps-jes hun databases lopen te vullen.
Erg waardevolle en helaas niet beschikbare data zou zijn de verwijderde en/of gewijzigde reacties van moderators. Of je moet over een langere periode topics gaat monitoren en de mutaties bij houden.
Geen idee waardoor dat precies komt, dat wordcloud generator ding is een black box voor mij. . Misschien doordat er speciale karakters bij staan?quote:Op woensdag 21 juni 2017 11:32 schreef Bosbeetle het volgende:
Ik reageer vrij vaak in ONZ met alleen " " blijkbaar... En hoezo staat GPD twee keer in ONZ wordcloud?
Nouja het is een extra factor die je mee kan wegen om de boel te trainen, verwijderde reacties zijn veelal negatief in de context van het topic. Natuurlijk zijn de moderators verre van perfect maar in grote lijnen zal het wel kloppen.quote:Op woensdag 21 juni 2017 11:47 schreef Maanvis het volgende:
[..]
Je wilt sturen op een voorspellende factor welke posts weggemodereerd worden?
Is dat wel echt mogelijk? Moderatie is toch grotendeels nattevingerwerk.
Ik zou het wel op reacties van de FP kunnen doen, voorspellen welke reacties geliked worden .
|
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |