abonnement Unibet Coolblue Bitvavo
pi_217271919
quote:
Het Amerikaanse tijdschrift The Atlantic heeft inzicht gekregen in de database die Meta, het moederbedrijf van Facebook, Instagram en WhatsApp, gebruikte voor de ontwikkeling van zijn AI-model Llama. Deze Libary Genesis (LibGen), één van de grootste illegale boekendatasets die online circuleren, bevat zo’n 7,5 miljoen boeken en 81 miljoen wetenschappelijke artikelen; auteursrechtelijk beschermde werken die zonder toestemming zijn gebruikt.

Uit rechtbankdocumenten blijkt dat Mark Zuckerberg zelf toestemming gaf om de dataset te downloaden en te gebruiken. Langs legale weg licenties verkrijgen zou te veel tijd en geld kosten. Als auteurs kunnen we niet toestaan dat er zo met ons werk wordt omgegaan.
https://www.theatlantic.c(...)-meta-openai/682093/

Wat veel mensen al vermoedden is weer bewezen. Om de AI modellen te trainen, wordt alles van het internet getrokken en trekt, in dit geval, Meta zich niks aan van auteursrechten.

Hoe gaat dit aflopen? Gezamenlijke rechtszaak van een heleboel auteurs/ uitgevers tegen meta, en voortaan mag meta alleen nog maar openbare data gebruiken? Of is dit de nieuwe standaard, en zijn binnenkort alle uitgevers failliet en stevenen we af op een wereld waarin niets nieuws meer wordt gepubliceerd?
Op donderdag 7 juli 2022 12:47 schreef LordofLeaves het volgende:
Bij deze ben jij de marimba van KLB. :P
pi_217273393
mensen die zelf die AI modellen gebruiken moeten er dan ook mee stoppen of hun bek houden, want anders zijn ze niet veel beter dan Meta
pi_217273432
quote:
0s.gif Op donderdag 3 april 2025 11:10 schreef gwn_een_user het volgende:
mensen die zelf die AI modellen gebruiken moeten er dan ook mee stoppen of hun bek houden, want anders zijn ze niet veel beter dan Meta
Wat een onzin.
  donderdag 3 april 2025 @ 11:15:23 #4
75043 Hexagon
Vreemd Fenomeen
pi_217273478
Maar je mag toch altijd kennis uit andermans werk citeren? Of spuugt deze AI integraal boeken van een ander uit?
pi_217273658
quote:
0s.gif Op donderdag 3 april 2025 11:15 schreef Hexagon het volgende:
Maar je mag toch altijd kennis uit andermans werk citeren? Of spuugt deze AI integraal boeken van een ander uit?
Ze hebben een complete illegale online database van artikelen en boeken en gebruikt. Dus als je vraagt om het hele boek na te vertellen, dan zal dat wel gebeuren inderdaad. Bovendien is altijd mogen citeren niet hetzelfde als gratis het artikel mogen lezen.

Op zich vind ik wel dat veel van dat soort journals best absurde prijzen rekenen voor het publiceren of lezen van artikelen en dat dat de wetenschap niet per se verder helpt, maar two wrongs dont make a right. Schrijvers van boeken en publicisten hebben wel bepaalde kosten, en als die helemaal niet meer gedekt worden, omdat alles gratis bij Meta te vinden is, dan droogt de wetenschap snel op.
Op donderdag 7 juli 2022 12:47 schreef LordofLeaves het volgende:
Bij deze ben jij de marimba van KLB. :P
pi_217273674
quote:
0s.gif Op donderdag 3 april 2025 11:10 schreef gwn_een_user het volgende:
mensen die zelf die AI modellen gebruiken moeten er dan ook mee stoppen of hun bek houden, want anders zijn ze niet veel beter dan Meta
Dat is op zich wel waar, maar dan moet je in eerste instantie wel weten dat Meta dat gedaan heeft. En omdat volgens mij geen enkel AI bedrijf precies vrij wil geven waar het zijn data vandaan haalt, kunnen mensen er enkel per toeval of door een interne bron binnen het bedrijf achter komen.
Op donderdag 7 juli 2022 12:47 schreef LordofLeaves het volgende:
Bij deze ben jij de marimba van KLB. :P
pi_217273772
Nee, ik werk niet.

Hihaho
M'n schoenen zijn gejat, maar ik hoef niet meer naar buiten, want er is nog wel wat.
  donderdag 3 april 2025 @ 11:51:01 #8
140043 Isdatzo
Born in the echoes.
pi_217273800
Ze mogen prima mijn werk stelen maar van m'n salaris blijven ze af!!!
Huilen dan.
pi_217273812
Het leuke is dat dit soort bedrijven met twee maten meten.

Als om wat voor reden dan ook dit straffeloos blijft, mogen andere bedrijven dan ook Meta haar data en diensten gebruiken voor het trainen van haar eigen (gen) AI?
pi_217274114
Stoppen met al die Meta rotzooi.
Maar dat is uiteraard te moeilijk voor velen.

De social media verslaving _O-
En jij zit daar onrustig, en jij kijkt langs mij heen
En ik hoor in alles wat je zegt, de stem van iemand
Die bang is voor zichzelf
  donderdag 3 april 2025 @ 16:09:11 #12
24533 ACT-F
Onmeunige gaspedoal emmer
pi_217276015
Had je de voorwaarden van je sociale medium maar moeten nalezen. Gratis bestaat niet.
Bekijk de webcam via UStream. Luister naar Gutter FM
pi_217278510
"You can call me Susan if it makes you happy"
pi_217278970
quote:
6s.gif Op donderdag 3 april 2025 16:09 schreef ACT-F het volgende:
Had je de voorwaarden van je sociale medium maar moeten nalezen. Gratis bestaat niet.
Of je leest het topic.

(Verder, meta bouwt ook gewoon een profiel over je op als je geen account hebt hoor. Ontkom je echt niet aan.)
  donderdag 3 april 2025 @ 21:09:00 #15
24533 ACT-F
Onmeunige gaspedoal emmer
pi_217279262
quote:
7s.gif Op donderdag 3 april 2025 20:46 schreef kipknots het volgende:

[..]
Of je leest het topic.

(Verder, meta bouwt ook gewoon een profiel over je op als je geen account hebt hoor. Ontkom je echt niet aan.)
Alsof zij zich maar iets aantrekken van de regels, want geld :9~ Toen ik me 15 jaar geleden inschreef bij FB en Twitter wist ik maar al te goed dat zij de data zich toe-eigenden. Met dien verstande heb ik nooit iets gepost waarvan ik wilde dat het auteursrecht bij mij bleef. Deel in zo'n geval je data op je eigen webruimte en plaats hooguit een link er naartoe.
Bekijk de webcam via UStream. Luister naar Gutter FM
  vrijdag 4 april 2025 @ 01:07:12 #16
44679 Leshy
Held met sokken.
pi_217281354
quote:
0s.gif Op donderdag 3 april 2025 11:27 schreef knoopie het volgende:
Dus als je vraagt om het hele boek na te vertellen, dan zal dat wel gebeuren inderdaad.
Dat is doorgaans niet hoe LLMs werken. De trainingsdata is vaak niet zomaar beschikbaar om letterlijk uit te citeren, maar wordt voornamelijk gebruikt om een soort statistisch profiel op te bouwen van welke woorden waar betrekking op hebben en in welke volgorde die een coherent antwoord vormen op wat de gebruiker vraagt.

Bovendien zijn er vaak ook wel beveiligingen ingebouwd als het gaat om bekende inhoud: als ik ChatGPT bijvoorbeeld vraag naar de openingsparagrafen van Lord of the Rings, dan zegt ChatGPT onmiddellijk dat het die niet mag citeren vanwege copyright. Met wat misleiding krijg ik de eerste zin er wel uit, maar ook dan schakelt hij over naar "en verder vat ik samen wat er wordt verteld, want copyright."

Dat maakt het vaak ook lastig om AI-fabrikanten aan te pakken, omdat er maar zelden sprake is van daadwerkelijke schendingen van copyright. Veel mensen vinden generatieve AI een bedreiging voor menselijke creativiteit, zien het als een bedreiging voor hun eigen inkomstenbron als maker van creatieve inhoud, of vinden het niet in orde dat een commercieel product wordt getraind met de resultaten van hun werk zonder dat ze daar een vergoeding voor ontvangen.

Maar in principe doen generatieve AI-modellen wat dat betreft niet zoveel anders dan wat mensen doen - leren door naar anderen te kijken, en dat vervolgens te combineren tot nieuwe, unieke werken. Alleen de schaal waarop dat kan is natuurlijk vele malen groter.
pi_217281622
quote:
0s.gif Op vrijdag 4 april 2025 01:07 schreef Leshy het volgende:

[..]

Maar in principe doen generatieve AI-modellen wat dat betreft niet zoveel anders dan wat mensen doen - leren door naar anderen te kijken, en dat vervolgens te combineren tot nieuwe, unieke werken.
Maar bijvoorbeeld musici doen dat niet door het stemgeluid van een ander te gebruiken. Ze gebruiken tenminste hun eigen stem. Ik ben het dan ook niet met je eens dat generatieve AI "niet zoveel anders" doet dan creatieve mensen.
Ik ben een kl ⭕⭕n van deze user
pi_217282340
quote:
6s.gif Op donderdag 3 april 2025 21:09 schreef ACT-F het volgende:

[..]
Alsof zij zich maar iets aantrekken van de regels, want geld :9~ Toen ik me 15 jaar geleden inschreef bij FB en Twitter wist ik maar al te goed dat zij de data zich toe-eigenden. Met dien verstande heb ik nooit iets gepost waarvan ik wilde dat het auteursrecht bij mij bleef. Deel in zo'n geval je data op je eigen webruimte en plaats hooguit een link er naartoe.
Het gaat hierbijj niet om zaken die op de Facebook/Instagram/Whatsapp/... gepost zijn.

Wat Meta heeft gedaan is via torrents een grote verzameling aan boeken en wetenschappelijke artikelen binnen gehaald (zonder hiervoor te betalen of de auteurs in te lichten) en hun AI hiermee getrained. Deze boeken/artikelen waren ook niet publiekelijk beschikbaar.

Als jij je zaken op een open website hebt staan dan kan je er verder nu ook wel zeker van zijn dat ze gescraped zijn en gebruikt om AI te trainen. Maar Meta ging hier nog een stap verder dan dat.
pi_217282454
quote:
6s.gif Op donderdag 3 april 2025 21:09 schreef ACT-F het volgende:

[..]
Alsof zij zich maar iets aantrekken van de regels, want geld :9~ Toen ik me 15 jaar geleden inschreef bij FB en Twitter wist ik maar al te goed dat zij de data zich toe-eigenden. Met dien verstande heb ik nooit iets gepost waarvan ik wilde dat het auteursrecht bij mij bleef. Deel in zo'n geval je data op je eigen webruimte en plaats hooguit een link er naartoe.
Het topic gaat helemaal niet over info van facebook oid. Het gaat er over dat Meta een illegale online database heeft gebruikt om zijn model te trainen.
Op donderdag 7 juli 2022 12:47 schreef LordofLeaves het volgende:
Bij deze ben jij de marimba van KLB. :P
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')