FOK!forum / Nieuws & Achtergronden / Heeft Meta ook jouw werk gestolen?
knoopiedonderdag 3 april 2025 @ 08:55
quote:
Het Amerikaanse tijdschrift The Atlantic heeft inzicht gekregen in de database die Meta, het moederbedrijf van Facebook, Instagram en WhatsApp, gebruikte voor de ontwikkeling van zijn AI-model Llama. Deze Libary Genesis (LibGen), één van de grootste illegale boekendatasets die online circuleren, bevat zo’n 7,5 miljoen boeken en 81 miljoen wetenschappelijke artikelen; auteursrechtelijk beschermde werken die zonder toestemming zijn gebruikt.

Uit rechtbankdocumenten blijkt dat Mark Zuckerberg zelf toestemming gaf om de dataset te downloaden en te gebruiken. Langs legale weg licenties verkrijgen zou te veel tijd en geld kosten. Als auteurs kunnen we niet toestaan dat er zo met ons werk wordt omgegaan.
https://www.theatlantic.c(...)-meta-openai/682093/

Wat veel mensen al vermoedden is weer bewezen. Om de AI modellen te trainen, wordt alles van het internet getrokken en trekt, in dit geval, Meta zich niks aan van auteursrechten.

Hoe gaat dit aflopen? Gezamenlijke rechtszaak van een heleboel auteurs/ uitgevers tegen meta, en voortaan mag meta alleen nog maar openbare data gebruiken? Of is dit de nieuwe standaard, en zijn binnenkort alle uitgevers failliet en stevenen we af op een wereld waarin niets nieuws meer wordt gepubliceerd?
gwn_een_userdonderdag 3 april 2025 @ 11:10
mensen die zelf die AI modellen gebruiken moeten er dan ook mee stoppen of hun bek houden, want anders zijn ze niet veel beter dan Meta
Glazenmakerdonderdag 3 april 2025 @ 11:12
quote:
0s.gif Op donderdag 3 april 2025 11:10 schreef gwn_een_user het volgende:
mensen die zelf die AI modellen gebruiken moeten er dan ook mee stoppen of hun bek houden, want anders zijn ze niet veel beter dan Meta
Wat een onzin.
Hexagondonderdag 3 april 2025 @ 11:15
Maar je mag toch altijd kennis uit andermans werk citeren? Of spuugt deze AI integraal boeken van een ander uit?
knoopiedonderdag 3 april 2025 @ 11:27
quote:
0s.gif Op donderdag 3 april 2025 11:15 schreef Hexagon het volgende:
Maar je mag toch altijd kennis uit andermans werk citeren? Of spuugt deze AI integraal boeken van een ander uit?
Ze hebben een complete illegale online database van artikelen en boeken en gebruikt. Dus als je vraagt om het hele boek na te vertellen, dan zal dat wel gebeuren inderdaad. Bovendien is altijd mogen citeren niet hetzelfde als gratis het artikel mogen lezen.

Op zich vind ik wel dat veel van dat soort journals best absurde prijzen rekenen voor het publiceren of lezen van artikelen en dat dat de wetenschap niet per se verder helpt, maar two wrongs dont make a right. Schrijvers van boeken en publicisten hebben wel bepaalde kosten, en als die helemaal niet meer gedekt worden, omdat alles gratis bij Meta te vinden is, dan droogt de wetenschap snel op.
knoopiedonderdag 3 april 2025 @ 11:29
quote:
0s.gif Op donderdag 3 april 2025 11:10 schreef gwn_een_user het volgende:
mensen die zelf die AI modellen gebruiken moeten er dan ook mee stoppen of hun bek houden, want anders zijn ze niet veel beter dan Meta
Dat is op zich wel waar, maar dan moet je in eerste instantie wel weten dat Meta dat gedaan heeft. En omdat volgens mij geen enkel AI bedrijf precies vrij wil geven waar het zijn data vandaan haalt, kunnen mensen er enkel per toeval of door een interne bron binnen het bedrijf achter komen.
Het_Bokjedonderdag 3 april 2025 @ 11:46
Nee, ik werk niet.

Hihaho
Isdatzodonderdag 3 april 2025 @ 11:51
Ze mogen prima mijn werk stelen maar van m'n salaris blijven ze af!!!
Joppiezdonderdag 3 april 2025 @ 11:52
Het leuke is dat dit soort bedrijven met twee maten meten.

Als om wat voor reden dan ook dit straffeloos blijft, mogen andere bedrijven dan ook Meta haar data en diensten gebruiken voor het trainen van haar eigen (gen) AI?
Canopusdonderdag 3 april 2025 @ 12:31
Stoppen met al die Meta rotzooi.
Maar dat is uiteraard te moeilijk voor velen.

De social media verslaving _O-
Feoladonderdag 3 april 2025 @ 12:34
Bekijk deze YouTube-video
ACT-Fdonderdag 3 april 2025 @ 16:09
Had je de voorwaarden van je sociale medium maar moeten nalezen. Gratis bestaat niet.
TLCdonderdag 3 april 2025 @ 20:09
giphy.gif?cid=6c09b952wss82llhmoe5kocrok7zhd732gi5t6vzvg6qavf2&ep=v1_internal_gif_by_id&rid=giphy.gif&ct=v
kipknotsdonderdag 3 april 2025 @ 20:46
quote:
6s.gif Op donderdag 3 april 2025 16:09 schreef ACT-F het volgende:
Had je de voorwaarden van je sociale medium maar moeten nalezen. Gratis bestaat niet.
Of je leest het topic.

(Verder, meta bouwt ook gewoon een profiel over je op als je geen account hebt hoor. Ontkom je echt niet aan.)
ACT-Fdonderdag 3 april 2025 @ 21:09
quote:
7s.gif Op donderdag 3 april 2025 20:46 schreef kipknots het volgende:

[..]
Of je leest het topic.

(Verder, meta bouwt ook gewoon een profiel over je op als je geen account hebt hoor. Ontkom je echt niet aan.)
Alsof zij zich maar iets aantrekken van de regels, want geld :9~ Toen ik me 15 jaar geleden inschreef bij FB en Twitter wist ik maar al te goed dat zij de data zich toe-eigenden. Met dien verstande heb ik nooit iets gepost waarvan ik wilde dat het auteursrecht bij mij bleef. Deel in zo'n geval je data op je eigen webruimte en plaats hooguit een link er naartoe.
Leshyvrijdag 4 april 2025 @ 01:07
quote:
0s.gif Op donderdag 3 april 2025 11:27 schreef knoopie het volgende:
Dus als je vraagt om het hele boek na te vertellen, dan zal dat wel gebeuren inderdaad.
Dat is doorgaans niet hoe LLMs werken. De trainingsdata is vaak niet zomaar beschikbaar om letterlijk uit te citeren, maar wordt voornamelijk gebruikt om een soort statistisch profiel op te bouwen van welke woorden waar betrekking op hebben en in welke volgorde die een coherent antwoord vormen op wat de gebruiker vraagt.

Bovendien zijn er vaak ook wel beveiligingen ingebouwd als het gaat om bekende inhoud: als ik ChatGPT bijvoorbeeld vraag naar de openingsparagrafen van Lord of the Rings, dan zegt ChatGPT onmiddellijk dat het die niet mag citeren vanwege copyright. Met wat misleiding krijg ik de eerste zin er wel uit, maar ook dan schakelt hij over naar "en verder vat ik samen wat er wordt verteld, want copyright."

Dat maakt het vaak ook lastig om AI-fabrikanten aan te pakken, omdat er maar zelden sprake is van daadwerkelijke schendingen van copyright. Veel mensen vinden generatieve AI een bedreiging voor menselijke creativiteit, zien het als een bedreiging voor hun eigen inkomstenbron als maker van creatieve inhoud, of vinden het niet in orde dat een commercieel product wordt getraind met de resultaten van hun werk zonder dat ze daar een vergoeding voor ontvangen.

Maar in principe doen generatieve AI-modellen wat dat betreft niet zoveel anders dan wat mensen doen - leren door naar anderen te kijken, en dat vervolgens te combineren tot nieuwe, unieke werken. Alleen de schaal waarop dat kan is natuurlijk vele malen groter.
recursiefvrijdag 4 april 2025 @ 06:43
quote:
0s.gif Op vrijdag 4 april 2025 01:07 schreef Leshy het volgende:

[..]

Maar in principe doen generatieve AI-modellen wat dat betreft niet zoveel anders dan wat mensen doen - leren door naar anderen te kijken, en dat vervolgens te combineren tot nieuwe, unieke werken.
Maar bijvoorbeeld musici doen dat niet door het stemgeluid van een ander te gebruiken. Ze gebruiken tenminste hun eigen stem. Ik ben het dan ook niet met je eens dat generatieve AI "niet zoveel anders" doet dan creatieve mensen.
kipknotsvrijdag 4 april 2025 @ 08:51
quote:
6s.gif Op donderdag 3 april 2025 21:09 schreef ACT-F het volgende:

[..]
Alsof zij zich maar iets aantrekken van de regels, want geld :9~ Toen ik me 15 jaar geleden inschreef bij FB en Twitter wist ik maar al te goed dat zij de data zich toe-eigenden. Met dien verstande heb ik nooit iets gepost waarvan ik wilde dat het auteursrecht bij mij bleef. Deel in zo'n geval je data op je eigen webruimte en plaats hooguit een link er naartoe.
Het gaat hierbijj niet om zaken die op de Facebook/Instagram/Whatsapp/... gepost zijn.

Wat Meta heeft gedaan is via torrents een grote verzameling aan boeken en wetenschappelijke artikelen binnen gehaald (zonder hiervoor te betalen of de auteurs in te lichten) en hun AI hiermee getrained. Deze boeken/artikelen waren ook niet publiekelijk beschikbaar.

Als jij je zaken op een open website hebt staan dan kan je er verder nu ook wel zeker van zijn dat ze gescraped zijn en gebruikt om AI te trainen. Maar Meta ging hier nog een stap verder dan dat.
knoopievrijdag 4 april 2025 @ 09:07
quote:
6s.gif Op donderdag 3 april 2025 21:09 schreef ACT-F het volgende:

[..]
Alsof zij zich maar iets aantrekken van de regels, want geld :9~ Toen ik me 15 jaar geleden inschreef bij FB en Twitter wist ik maar al te goed dat zij de data zich toe-eigenden. Met dien verstande heb ik nooit iets gepost waarvan ik wilde dat het auteursrecht bij mij bleef. Deel in zo'n geval je data op je eigen webruimte en plaats hooguit een link er naartoe.
Het topic gaat helemaal niet over info van facebook oid. Het gaat er over dat Meta een illegale online database heeft gebruikt om zijn model te trainen.