abonnement Unibet Coolblue
  dinsdag 30 mei 2017 @ 10:49:41 #1
19440 Maanvis
Centuries in a lifetime
pi_171321500
Hoihoi,

Ik ben sinds een paar maanden geïnteresseerd geraakt in neural networks en hoe die gebruikt kunnen worden, en heb ook al ooit een 'fok bot' gemaakt die zoals mij kan posten.

Nu ben ik afgelopen week bezig geweest met een serie python scriptjes die ervoor zorgen dat je op FOK! kunt inloggen, de cookiewall kunt accepteren etc, en dan vervolgens een topique kunt ophalen en daar iets mee kunt doen. Bijv. een sentimentanalyse, om te bepalen welke topiques en forums het positiefst of negatiefst gereageerd wordt. Dat leek me wel interessant. Of een leuke visuele wordcloud per user :).

Mgoed, sentimenanalyse dus. Wat ik het liefste doe is zo weinig mogelijk werk, dus met bestaande datasets werken. Nu gebruik ik daarvoor pattern-nl, maar die is nog niet zo goed als ik zou willen, omdat ie gebaseerd is op boekreviews en dus niet op het type teksten dat je hier leest.

Hebben jullie wellicht ideeën hoe ik het beste mijn eigen classifier kan trainen en wat dan een positieve of negatieve post zou zijn? Ik zat zelf te denken aan smileys als alternatief, maar of dat ook het beste is? Bovendien heb je er van die sarcasten bij die de hele tijd de :) gebruiken terwijl ze iemand tot op het bot afzeiken. Dus dan heb je ook de reacties nodig.
Of ik train 'm op de FP want daar worden reacties gewaardeerd met een score. Maar dan loop je het risico dat mensen die alleen een hoge score gaven omdat men het met ze eens was ipv dat het bericht zelf positief was. Ideetjes zijn welkom :)
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
  dinsdag 30 mei 2017 @ 11:37:01 #2
34614 jogy
Hersenflatulent
pi_171322434
De ' :') ' smiley is meestal wel een negatieve indicator. De 13.gif ook. Dat zijn zo op het eerste gezicht degene die het 'eerlijkst' gebruikt worden.

Je hebt verder ook FOK!kers die permanent en overal negatief zijn dus die zou je ook kunnen gebruiken of je maakt zelf een beginnetje door een woordenlijst die over het algemeen gebruikt wordt in een negatieve post. Zoiets. Wel een tof project trouwens, ik ben benieuwd naar je voortgang :).
Iedereen is de hoofdrolspeler van zijn eigen comedie.
'Goatboy is hurt by your indifference'
<a href="https://www.youtube.com/watch?v=M9srplWe_QQ" target="_blank" rel="nofollow">Vrijheid</a>
[b]Dean Radin presenteert: "Science and the taboo of psi"[/b]
  dinsdag 30 mei 2017 @ 11:41:45 #3
34614 jogy
Hersenflatulent
pi_171322543
Of begin inderdaad eerst door de 'makkelijkste/eerlijkste/minst sarcastische' users te selecteren voor je training. Is even wat handmatig gedoe maar dan heb je in ieder geval een redelijke basis. Er zijn vast nog wel een paar mensen die bijvoorbeeld post-icoontjes gebruiken om daadwerkelijk aan te geven wat de bedoeling is van de post.
Iedereen is de hoofdrolspeler van zijn eigen comedie.
'Goatboy is hurt by your indifference'
<a href="https://www.youtube.com/watch?v=M9srplWe_QQ" target="_blank" rel="nofollow">Vrijheid</a>
[b]Dean Radin presenteert: "Science and the taboo of psi"[/b]
  dinsdag 30 mei 2017 @ 12:20:56 #4
19440 Maanvis
Centuries in a lifetime
pi_171323366
quote:
14s.gif Op dinsdag 30 mei 2017 11:37 schreef jogy het volgende:
De ' :') ' smiley is meestal wel een negatieve indicator. De [ afbeelding ] ook. Dat zijn zo op het eerste gezicht degene die het 'eerlijkst' gebruikt worden.

Je hebt verder ook FOK!kers die permanent en overal negatief zijn dus die zou je ook kunnen gebruiken of je maakt zelf een beginnetje door een woordenlijst die over het algemeen gebruikt wordt in een negatieve post. Zoiets. Wel een tof project trouwens, ik ben benieuwd naar je voortgang :).
Het liefste zou ik de source hier posten. Het werkt op basis van python met wat libraries, er wordt tijdelijk data opgeslagen in een sqllite database (zodat je apart kunt scrapen). Maargoed, het is niet leuk voor FOK! als iedereen het gaat gebruiken ivm mogelijke performance issues ;). Had nog wel even de AV doorgelezen om te keken of het mocht en daar stond niks over in.

quote:
14s.gif Op dinsdag 30 mei 2017 11:41 schreef jogy het volgende:
Of begin inderdaad eerst door de 'makkelijkste/eerlijkste/minst sarcastische' users te selecteren voor je training. Is even wat handmatig gedoe maar dan heb je in ieder geval een redelijke basis. Er zijn vast nog wel een paar mensen die bijvoorbeeld post-icoontjes gebruiken om daadwerkelijk aan te geven wat de bedoeling is van de post.
Voor PI's zal ik het oude 'johnnyknoxville' document wel eens weer naar boven toveren :).
Ik zat zelf al te denken om bijv. te classificeren op basis van écht positief ( _O_ ) en écht negatieve ( :( , :r , |:( , :') ) smileys. en dan gewoon iig te classificeren per zin (of de smiley die er in de buurt staat). En dan daarna misschien op andere emoties. Bijv 'grappig' ( _O- , :D ) , verveeld ( :{ :o ), verdrietig ( :'( ;( ) , teleurgesteld ( -O- :{ ) etc..

Echter dan moet ik nog wel een stukje hebben om namen er uit te filteren, maar dat zou ik moeten kunnen doen op basis van een bestaande NL corpus (woordenlijst) in combinatie met hoofdlettercheck. Want anders krijg je dat mensen die het over sylvana simons hebben altijd een negatieve ondertoon terwijl de zin op zich niet eens negatief is.
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
  dinsdag 30 mei 2017 @ 13:01:44 #5
34614 jogy
Hersenflatulent
pi_171323959
quote:
0s.gif Op dinsdag 30 mei 2017 12:20 schreef Maanvis het volgende:
Het liefste zou ik de source hier posten. Het werkt op basis van python met wat libraries, er wordt tijdelijk data opgeslagen in een sqllite database (zodat je apart kunt scrapen). Maargoed, het is niet leuk voor FOK! als iedereen het gaat gebruiken ivm mogelijke performance issues ;). Had nog wel even de AV doorgelezen om te keken of het mocht en daar stond niks over in.
De source hier neergooien lijkt me ook niet het meest geweldige plan eigenlijk, gewoon centraal houden dat iedereen gebruik maakt van dezelfde libraries en het forum niet onnodig word gebruikt.
SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Iedereen is de hoofdrolspeler van zijn eigen comedie.
'Goatboy is hurt by your indifference'
<a href="https://www.youtube.com/watch?v=M9srplWe_QQ" target="_blank" rel="nofollow">Vrijheid</a>
[b]Dean Radin presenteert: "Science and the taboo of psi"[/b]
  dinsdag 30 mei 2017 @ 13:34:02 #6
19440 Maanvis
Centuries in a lifetime
pi_171324615
quote:
11s.gif Op dinsdag 30 mei 2017 13:01 schreef jogy het volgende:

[..]

De source hier neergooien lijkt me ook niet het meest geweldige plan eigenlijk, gewoon centraal houden dat iedereen gebruik maakt van dezelfde libraries en het forum niet onnodig word gebruikt.
SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Ik ken dat tooltje niet eens meer, dus geen idee waar je het over hebt.
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
  Admin dinsdag 30 mei 2017 @ 13:38:33 #7
1 crew  Danny
Ik mis m'n grote vriend..
pi_171324746
quote:
0s.gif Op dinsdag 30 mei 2017 13:34 schreef Maanvis het volgende:

[..]

Ik ken dat tooltje niet eens meer, dus geen idee waar je het over hebt.
Nou ja, je was behoorlijk aan het drammen over dat tooltje destijds en dan is het wel raar dat je nu zelf op vergelijkbare wijze iets wilt doen dat dan blijkbaar voor jou wél oké is enkel en alleen omdat dit jouw projectje is. Ik denk dat daarop wordt gedoeld.
- Oh hi Mark!
- Cool... Cool, cool, cool.
Jayden, Ik mis mijn grote vriend...
Zie wat ik kijk: trakt.tv
  dinsdag 30 mei 2017 @ 13:40:02 #8
34614 jogy
Hersenflatulent
pi_171324786
quote:
0s.gif Op dinsdag 30 mei 2017 13:34 schreef Maanvis het volgende:

[..]

Ik ken dat tooltje niet eens meer, dus geen idee waar je het over hebt.
Iedereen is de hoofdrolspeler van zijn eigen comedie.
'Goatboy is hurt by your indifference'
<a href="https://www.youtube.com/watch?v=M9srplWe_QQ" target="_blank" rel="nofollow">Vrijheid</a>
[b]Dean Radin presenteert: "Science and the taboo of psi"[/b]
  dinsdag 30 mei 2017 @ 13:40:31 #9
157922 fathank
Wie baas is bakt koekjes.
pi_171324800
1if TS = Iwanius then SENTIMENT=N
Behulpzaam als een waterkraan.
Op woensdag 29 april 2015 16:30 schreef seto het volgende:
als je niet #teamhenk bent ben je gewoon een *weggeFopt*homo
  dinsdag 30 mei 2017 @ 15:41:10 #10
19440 Maanvis
Centuries in a lifetime
pi_171327597
quote:
0s.gif Op dinsdag 30 mei 2017 13:38 schreef Danny het volgende:

[..]

Nou ja, je was behoorlijk aan het drammen over dat tooltje destijds en dan is het wel raar dat je nu zelf op vergelijkbare wijze iets wilt doen dat dan blijkbaar voor jou wél oké is enkel en alleen omdat dit jouw projectje is. Ik denk dat daarop wordt gedoeld.
Dit is puur een analyse, de data wordt niet bewaard :). Vergelijkbaar met wat Arcee doet/deed dus, en drammen was het ook niet echt. Sorry als het destijds zo over kwam maar ja ouwe koeien he :)

[ Bericht 6% gewijzigd door Maanvis op 30-05-2017 15:48:26 ]
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
pi_171482479
quote:
14s.gif Op dinsdag 30 mei 2017 13:40 schreef fathank het volgende:

[ code verwijderd ]

_O-
  dinsdag 20 juni 2017 @ 00:36:11 #12
19440 Maanvis
Centuries in a lifetime
pi_171803700
Okay, sentimentanalyse werkt nog niet helemaal goed, ik heb het idee dat de library die ik gebruik nog niet geavanceerd genoeg is.

SPOILER: meest positieve replies in ONZ
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
SPOILER: meest negatieve in ONZ
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Kortom, wat ik nog moet doen is denk ik filteren op smiley only reacties. Alhoewel die zeer positief zijn of negatief zijn is het natuurlijk wel zo dat het niet fijn werkt om echt de tekst te analyseren.

Wordclouds zijn daarentegen weer wel leuk. Hier 1 van mezelf (van een paar myat lijsten van mezelf)



Of voor een aantal fora (ik denk dat je wel kunt raden welke dit zijn ;) )










Je kunt zo'n wordcloud dan ook transponeren over iemands usericon, maar het eindresultaat is dan nog niet echt om over naar huis te schrijven:


Anyway, zoals je waarschijnlijk wel ziet zitten in die wordcloud alleen zelfstandige naamwoorden. Dat komt omdat je anders wordclouds krijgt vol met 'de het een van op naast' etc :). Dus gebruik ik de 'pattern' library om alleen zelfstandige naamwoorden te krijgen. Deze library gebruik ik overigens ook voor de sentimentanalyse zelf, maar deze is nog niet zo accuraat als ik zou willen.
Verder gebruik ik https://github.com/amueller/word_cloud deze library voor de wordclouds, en voor het scrapen gewoon standaard functionaliteit die in python zit (session en request libraries).
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
  dinsdag 20 juni 2017 @ 00:41:21 #13
34614 jogy
Hersenflatulent
pi_171803764
Tof! Leuk dat je er vervolg aan geeft, leuk experiment, Maanvis.
Iedereen is de hoofdrolspeler van zijn eigen comedie.
'Goatboy is hurt by your indifference'
<a href="https://www.youtube.com/watch?v=M9srplWe_QQ" target="_blank" rel="nofollow">Vrijheid</a>
[b]Dean Radin presenteert: "Science and the taboo of psi"[/b]
  dinsdag 20 juni 2017 @ 00:42:16 #14
19440 Maanvis
Centuries in a lifetime
pi_171803778
quote:
17s.gif Op dinsdag 20 juni 2017 00:41 schreef jogy het volgende:
Tof! Leuk dat je er vervolg aan geeft, leuk experiment, Maanvis.
thx :)
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
pi_171818229
Mag hier serieus op geantwoord worden of is dit sowieso een no-go op fok?
:P Ik wil ook geen scriptkiddies aanzetten tot een (onbedoelde) dos aanval op FOK! doordat ze met een aantal vps-jes hun databases lopen te vullen.

Erg waardevolle en helaas niet beschikbare data zou zijn de verwijderde en/of gewijzigde reacties van moderators. Of je moet over een langere periode topics gaat monitoren en de mutaties bij houden. :P

[ Bericht 16% gewijzigd door TwenteFC op 20-06-2017 20:01:50 ]
pi_171818407
Naja ik kan dit iig wel dumpen, ik weet niet of je het al kent:

http://predictionio.incub(...)ry/template-gallery/
  Moderator woensdag 21 juni 2017 @ 11:32:32 #17
27682 crew  Bosbeetle
terminaal verdwaald
pi_171831464
_O-

Ik reageer vrij vaak in ONZ met alleen " :D " blijkbaar... En hoezo staat GPD twee keer in ONZ wordcloud?
En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna
  woensdag 21 juni 2017 @ 11:47:05 #18
19440 Maanvis
Centuries in a lifetime
pi_171831786
quote:
19s.gif Op dinsdag 20 juni 2017 19:49 schreef TwenteFC het volgende:
Mag hier serieus op geantwoord worden of is dit sowieso een no-go op fok?
:P Ik wil ook geen scriptkiddies aanzetten tot een (onbedoelde) dos aanval op FOK! doordat ze met een aantal vps-jes hun databases lopen te vullen.

Erg waardevolle en helaas niet beschikbare data zou zijn de verwijderde en/of gewijzigde reacties van moderators. Of je moet over een langere periode topics gaat monitoren en de mutaties bij houden. :P
Je wilt sturen op een voorspellende factor welke posts weggemodereerd worden?
Is dat wel echt mogelijk? Moderatie is toch grotendeels nattevingerwerk.
Ik zou het wel op reacties van de FP kunnen doen, voorspellen welke reacties geliked worden ;).
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
  woensdag 21 juni 2017 @ 11:49:15 #19
19440 Maanvis
Centuries in a lifetime
pi_171831820
quote:
2s.gif Op woensdag 21 juni 2017 11:32 schreef Bosbeetle het volgende:
_O-

Ik reageer vrij vaak in ONZ met alleen " :D " blijkbaar... En hoezo staat GPD twee keer in ONZ wordcloud?
Geen idee waardoor dat precies komt, dat wordcloud generator ding is een black box voor mij. :). Misschien doordat er speciale karakters bij staan?
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
  woensdag 21 juni 2017 @ 11:49:49 #20
19440 Maanvis
Centuries in a lifetime
pi_171831833
Oh by the way verzoekjes zijn welkom (mits redelijkerwijs te doen)
Trots lid van het 👿 Duivelse Viertal 👿
Een gedicht over Maanvis
Het ONZ / [KAMT] Kennis- en Adviescentrum Maanvis Topics , voor al je vragen over mijn topiques!
pi_171839007
quote:
0s.gif Op woensdag 21 juni 2017 11:47 schreef Maanvis het volgende:

[..]

Je wilt sturen op een voorspellende factor welke posts weggemodereerd worden?
Is dat wel echt mogelijk? Moderatie is toch grotendeels nattevingerwerk.
Ik zou het wel op reacties van de FP kunnen doen, voorspellen welke reacties geliked worden ;).
Nouja het is een extra factor die je mee kan wegen om de boel te trainen, verwijderde reacties zijn veelal negatief in de context van het topic. Natuurlijk zijn de moderators verre van perfect maar in grote lijnen zal het wel kloppen.

Het linkje dat ik stuurde staan meerdere voorbeelden uit de machine learning hoek waaronder dus een sentiment analyse waar jij mee bezig bent. En je kan er meteen een api van maken :P en als je het in de praktische hoek gaat zoeken dan maak je er een automatische report bot van en als het allemaal goed genoeg werkt dan heb je straks geen modjes meer nodig :D

:P Alleen een smiley zou ik trouwens classificeren als een nutteloze bijdrage.
abonnement Unibet Coolblue
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')