mega-compressie - deel 2 - | Wetenschap, Filosofie, Levensbeschouwing (WFL)

vrijdag 22 juli 2005 @ 14:42:28 #142

#ANONIEM

quote:
Op vrijdag 22 juli 2005 14:33 schreef Pietverdriet het volgende:

[..]

Als dat zo is, en logischer wijze volgt dat uit de aanname dat sloot´s uitvinding echt was, dan zou je uit een random 4 K string een film moeten kunnen genereren.

Dat is net zo waarschijnlijk als in kladblok wat letters neerplempen, het door een compiler halen en dan windows XP nagemaakt hebben.

quote:
De hoeveelheid data in 4 K is niet voldoende voor informatie, maar alleen maar voor een catalogus nummer.

Je hoeft de data enkel te omschrijven, niet te comprimeren. 2^256 Geeft een enorm groot getal, maar is dus ook met 5 chars te beschrijven.

vrijdag 22 juli 2005 @ 14:48:38 #143

XoxIx

The Librarian

quote:
Op vrijdag 22 juli 2005 14:34 schreef BUG80 het volgende:

[..]

Ja inderdaad. Zip doet dat natuurlijk ook, maar die slaat de tree op bij de data, omdat elk bestand zijn eigen optimale tree heeft. Maar stel nu dat Sloot een tree heeft gevonden van bijvoorbeeld 1 GB die voor alle films goed werkt. Onwaarschijnlijk, maar stel.

Een film is niet hetzelfde als een willekeurig bestand. Ongecomprimeerde films, die echt bestaan uit compleet opgeslagen frames zijn inderdaad gemakkelijk behoorlijk veel kleiner te krijgen. Net als dat je ongecomprimeerde BMPs kleiner kunt krijgen door het om te zetten naar GIF.

vrijdag 22 juli 2005 @ 14:51:02 #144

gnomaat

quote:
Op vrijdag 22 juli 2005 14:12 schreef BUG80 het volgende:
Kijk, ik zie het verschil tussen 750 MB en 4 kB niet zo

Waar je naar moet kijken is de entropie of het data "gewicht" van een bestand. Een uncompressed film is een dikke 150 GB. Hier zit natuurlijk ontzettend vele redundancy in, zodat je de essentie van die content ook wel in 700 MB (minder dan een half % van het origineel) kwijt kunt. Maar daar zit natuurlijk een grens aan.

Waar die grens ligt hangt van de film af (en wat je nog als acceptabele losses beschouwt), maar voor een normale gemiddelde speelfilm zal die grens onder de 700 MB maar ver boven de 4 KB liggen. 4KB gewoon te weinig. Het is vast wel wiskundig te bewijzen met Shannon ondergrenzen e.d. maar bovendien voel je gewoon op je klompen aan dat 4096 bytes gewoon te weinig zijn om een film te representeren (ik wel althans).

Het hele verhaal rammelt sowieso aan alle kanten omdat er wordt gesteld dat iedere film (of zelfs iedere data) in een sleutel van dezelfde grootte past. Terwijl een film die twee keer zo lang duurt als een andere, met vergelijkbare content, natuurlijk ook twee keer zoveel entropie omvat.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 14:51:58 #145

XoxIx

The Librarian

quote:
Op vrijdag 22 juli 2005 14:42 schreef gelly het volgende:

Dat is net zo waarschijnlijk als in kladblok wat letters neerplempen, het door een compiler halen en dan windows XP nagemaakt hebben.

Windows XP is geen 4Kb groot

quote:
Je hoeft de data enkel te omschrijven, niet te comprimeren. 2^256 Geeft een enorm groot getal, maar is dus ook met 5 chars te beschrijven.

Maar niet elk willekeurig getal is te schrijven als 2^n met n een natuurlijk getal.

vrijdag 22 juli 2005 @ 14:55:36 #146

Kaalhei

under a dead Ohio sky

quote:
Op vrijdag 22 juli 2005 14:19 schreef Pietverdriet het volgende:

[..]

Hoe meer je comprimeert, hoe meer info je verliest.

Je hebt ook lossless comprimeren, WinZip bv.

Ik sta hier voor de hemelpoort - Nergens is een god te zien - Volgens mij bestaat hij niet -
Onze leider zei doe niet zo dom - En vertel het de wereld nooit - Beneden staat de vodka klaar

vrijdag 22 juli 2005 @ 14:57:31 #147

Kaalhei

under a dead Ohio sky

quote:
Op vrijdag 22 juli 2005 14:31 schreef Pietverdriet het volgende:

[..]

dat is dan eigenlijk geen compressie maar de informatie ergens anders neerleggen.

Dan heb je maar 1 bit nodig voor de Matrix op I-max. Staat de bit op 0 dan gebeurt er niets, zet je de bit op 1 dan kijk je naar de sleutel. De sleutel is dan vervolgens de film van een paar gigabyte.

Ik sta hier voor de hemelpoort - Nergens is een god te zien - Volgens mij bestaat hij niet -
Onze leider zei doe niet zo dom - En vertel het de wereld nooit - Beneden staat de vodka klaar

vrijdag 22 juli 2005 @ 15:02:03 #148

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 14:51 schreef gnomaat het volgende:

[..]

Waar je naar moet kijken is de entropie of het data "gewicht" van een bestand. Een uncompressed film is een dikke 150 GB. Hier zit natuurlijk ontzettend vele redundancy in, zodat je de essentie van die content ook wel in 700 MB (minder dan een half % van het origineel) kwijt kunt. Maar daar zit natuurlijk een grens aan.

Waar die grens ligt hangt van de film af (en wat je nog als acceptabele losses beschouwt), maar voor een normale gemiddelde speelfilm zal die grens onder de 700 MB maar ver boven de 4 KB liggen. 4KB gewoon te weinig. Het is vast wel wiskundig te bewijzen met Shannon ondergrenzen e.d. maar bovendien voel je gewoon op je klompen aan dat 4096 bytes gewoon te weinig zijn om een film te representeren (ik wel althans).

Wat dat betreft ben ik het helemaal met je eens, maar ben jij het met mij eens dat als je in het bezit bent van een soort super database/Huffman tree (die niet bestaat denk ik), het dan wel mogelijk moet zijn om veel verder te comprimeren dan dat, zolang je die database maar apart opslaat. Het blijft natuurlijk theoretisch gewauwel, maar 60 jaar geleden geloofde ook niemand dat je muziek op kon slaan op 1/7 van de grootte, zonder perceptioneel verlies. Zeg nooit nooit!

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 15:03:52 #149

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 14:57 schreef Kaalhei het volgende:

[..]

Dan heb je maar 1 bit nodig voor de Matrix op I-max. Staat de bit op 0 dan gebeurt er niets, zet je de bit op 1 dan kijk je naar de sleutel. De sleutel is dan vervolgens de film van een paar gigabyte.

Dat is het idee ja. En als je die "tree" nou wat kleiner maakt dan een paar gigabyte gebruik je vervolgens niet 1 bit, maar 32768 bits. En wie weet, misschien kan je met diezelfde tree The Matrix Reloaded ook wel comprimeren.

_{Zelf geloof ik er ook niet zo in hoor}

Mijn mixtape: labtones.com/listener/JSP

Redactie Frontpage vrijdag 22 juli 2005 @ 15:05:43 #150

SunChaser

Leuker wordt het niet

Waar hebben jullie allemaal gestudeerd

In mijn tijd kregen we gewoon economie en geschiedenis over Willem van Oranje op school

vrijdag 22 juli 2005 @ 15:06:59 #151

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 22 juli 2005 15:02 schreef BUG80 het volgende:
Het blijft natuurlijk theoretisch gewauwel, maar 60 jaar geleden geloofde ook niemand dat je muziek op kon slaan op 1/7 van de grootte, zonder perceptioneel verlies. Zeg nooit nooit!

De wet van Shannon is uit 1948..

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 22 juli 2005 @ 15:08:28 #152

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 22 juli 2005 15:05 schreef SunChaser het volgende:
Waar hebben jullie allemaal gestudeerd In mijn tijd kregen we gewoon economie en geschiedenis over Willem van Oranje op school

Das best pittig voor de kappersschool, niet?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 22 juli 2005 @ 15:11:19 #153

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 15:06 schreef Pietverdriet het volgende:

[..]

De wet van Shannon is uit 1948..

Dat ging niet over perceptioneel coderen, toch. De werking van het oor is pas halverwege de jaren '50 in detail onderzocht.

_{We dwalen weer af}

Mijn mixtape: labtones.com/listener/JSP

Redactie Frontpage vrijdag 22 juli 2005 @ 15:13:56 #154

SunChaser

Leuker wordt het niet

quote:
Op vrijdag 22 juli 2005 15:08 schreef Pietverdriet het volgende:

[..]

Das best pittig voor de kappersschool, niet?

Och... Je hebt soms mensen die een Balthazar Gerards kapsel willen

vrijdag 22 juli 2005 @ 15:20:12 #155

#ANONIEM

Overigens heb ik nu even 'snel' een applet geschreven die mijn compressiemethode simpel laat zien, ik zal hem even ergens parkeren.

vrijdag 22 juli 2005 @ 15:20:16 #156

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 22 juli 2005 15:13 schreef SunChaser het volgende:

[..]

Och... Je hebt soms mensen die een Balthazar Gerards kapsel willen

Zet je onduleerijzers maar aan...

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 22 juli 2005 @ 15:46:20 #157

gnomaat

quote:
Op vrijdag 22 juli 2005 15:20 schreef gelly het volgende:
Overigens heb ik nu even 'snel' een applet geschreven die mijn compressiemethode simpel laat zien, ik zal hem even ergens parkeren.

Mooi!

Ik heb hier vast een voorbeeldbestandje neergezet:
http://www.free-space.us/gnomaat/compression_test.zip (zit een file van 10 KB in)

Deze zip is nog niet password protected ofzo, maar kun je vast kijken of het een beetje werkt.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 15:54:42 #158

#ANONIEM

quote:
Op vrijdag 22 juli 2005 15:46 schreef gnomaat het volgende:

[..]

Mooi!

Ik heb hier vast een voorbeeldbestandje neergezet:
http://www.free-space.us/gnomaat/compression_test.zip (zit een file van 10 KB in)

Deze zip is nog niet password protected ofzo, maar kun je vast kijken of het een beetje werkt.

Hold your horses

Het is een applet om te laten zien dat compressie van meer dan 50% mogelijk is en dat die compressie toeneemt naarmate het te coderen getal groter wordt...

Ik zoek alleen even een webspace om de boel te dumpen, ben het wachtwoord van de mijne kwijt...

vrijdag 22 juli 2005 @ 16:15:04 #159

yootje

quote:
Op vrijdag 22 juli 2005 15:54 schreef gelly het volgende:

[..]

Hold your horses Het is een applet om te laten zien dat compressie van meer dan 50% mogelijk is en dat die compressie toeneemt naarmate het te coderen getal groter wordt...

Ik zoek alleen even een webspace om de boel te dumpen, ben het wachtwoord van de mijne kwijt...

* yootje biedt webspace aan.

vrijdag 22 juli 2005 @ 16:15:34 #160

#ANONIEM

http://www.free-space.us/primer/Applet1.html

Je kunt deze applet beter in een standalone viewer bekijken, zowel firefox als IE zweten nogal als het ingegeven getal erg groot wordt. Het loopt niet vast, al lijkt het wel zo.

vrijdag 22 juli 2005 @ 16:18:30 #161

yootje

Used primes : 8 for 9 decimals
Compression is 88 %
Used primes : 0 for 1024 decimals
Compression is 0 %
Used primes : 0 for 1024 decimals
Compression is 0 %

vrijdag 22 juli 2005 @ 16:25:12 #162

XoxIx

The Librarian

quote:
Op vrijdag 22 juli 2005 16:15 schreef gelly het volgende:
http://www.free-space.us/primer/Applet1.html

Je kunt deze applet beter in een standalone viewer bekijken, zowel firefox als IE zweten nogal als het ingegeven getal erg groot wordt. Het loopt niet vast, al lijkt het wel zo.

Beweert die applet nu dat het zulke grote priemgetallen in 1 byte codeert?

vrijdag 22 juli 2005 @ 16:27:35 #163

#ANONIEM

quote:
Op vrijdag 22 juli 2005 16:25 schreef XoxIx het volgende:

[..]

Beweert die applet nu dat het zulke grote priemgetallen in 1 byte codeert?

Ja, ik sla namelijk niet de priemgetallen zelf op, alleen het hoeveelste Mersenne priemgetal het is.

vrijdag 22 juli 2005 @ 16:28:15 #164

#ANONIEM

Used primes : 94 for 171 decimals
Compression is 54 %

vrijdag 22 juli 2005 @ 16:31:16 #165

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 16:27 schreef gelly het volgende:

[..]

Ja, ik sla namelijk niet de priemgetallen zelf op, alleen het hoeveelste Mersenne priemgetal het is.

Dan kan je dus nog theoretisch veel meer compressie halen door hierna nog eens Huffman compressie er overheen te halen (de zip-methode).

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 16:36:16 #166

#ANONIEM

Ik zou wel eens willen kijken tot hoever die compressie gaat, het lijkt namelijk zo dat de compressie groter wordt naarmate de getallen groter worden. Over die 171 decimals deed mn comp 5 minuten, maar het is ook in Java geschreven.

vrijdag 22 juli 2005 @ 16:37:51 #167

XoxIx

The Librarian

quote:
Op vrijdag 22 juli 2005 16:27 schreef gelly het volgende:

[..]

Ja, ik sla namelijk niet de priemgetallen zelf op, alleen het hoeveelste Mersenne priemgetal het is.

Je rekent niet correct. Je input mag maar 10 verschillende waarden hebben (0..9), maar het rangnummer van je priemgetal kan best 1.000.000 zijn (dus 1 miljoen verschillende waarden).

Als je het goed wilt doen moet je dus berekenen hoe lang de decimale representatie is van je priemgetallen. Bijvoorbeeld:

121 = 101 + 19 + 2
Dat wordt niet: 3 voor 3 met geen compressie, maar 6 voor 3 is 100% verlies.

Zelfs nu wordt er nog wat gesjoemeld, maar niet meer zo erg als dat in het applet gebeurt.

vrijdag 22 juli 2005 @ 16:42:04 #168

#ANONIEM

quote:
Op vrijdag 22 juli 2005 16:37 schreef XoxIx het volgende:

[..]

Je rekent niet correct. Je input mag maar 10 verschillende waarden hebben (0..9), maar het rangnummer van je priemgetal kan best 1.000.000 zijn (dus 1 miljoen verschillende waarden).

Als je het goed wilt doen moet je dus berekenen hoe lang de decimale representatie is van je priemgetallen. Bijvoorbeeld:

121 = 101 + 19 + 2
Dat wordt niet: 3 voor 3 met geen compressie, maar 6 voor 3 is 100% verlies.

Zelfs nu wordt er nog wat gesjoemeld, maar niet meer zo erg als dat in het applet gebeurt.

Klopt, daarom werkt het ook niet bij kleine getallen, nou ja het werkt wel maar er is verlies. Ik gebruik enorm grote priemgetallen die in kleine notatie worden weergegeven. Test het maar in de applet, je zal zien dat hoe groter de getallen worden hoe groter de compressie wordt.

vrijdag 22 juli 2005 @ 16:44:01 #169

XoxIx

The Librarian

quote:
Op vrijdag 22 juli 2005 16:42 schreef gelly het volgende:

[..]

Klopt, daarom werkt het ook niet bij kleine getallen, nou ja het werkt wel maar er is verlies. Ik gebruik enorm grote priemgetallen die in kleine notatie worden weergegeven. Test het maar in de applet, je zal zien dat hoe groter de getallen worden hoe groter de compressie wordt.

Als je je applet hebt aangepast. Je telt het aantal priemgetallen dat je gebruikt, niet het aantal tekens dat je gebruikt, terwijl je bij de input kijkt naar het aantal tekens.

vrijdag 22 juli 2005 @ 16:48:08 #170

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 16:37 schreef XoxIx het volgende:

[..]

Je rekent niet correct. Je input mag maar 10 verschillende waarden hebben (0..9), maar het rangnummer van je priemgetal kan best 1.000.000 zijn (dus 1 miljoen verschillende waarden).

Als je het goed wilt doen moet je dus berekenen hoe lang de decimale representatie is van je priemgetallen. Bijvoorbeeld:

121 = 101 + 19 + 2
Dat wordt niet: 3 voor 3 met geen compressie, maar 6 voor 3 is 100% verlies.

Zelfs nu wordt er nog wat gesjoemeld, maar niet meer zo erg als dat in het applet gebeurt.

Hij heeft gelijk, ja. Als je het goed wil doen moet je alle 256 mogelijke karakters die je kunt maken met een byte accepteren. Het getal '121' kun je namelijk makkelijk in 1 byte kwijt, terwijl jij het in 3 stopt en er vervolgens weer 3 van maakt.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 16:48:10 #171

#ANONIEM

quote:
Op vrijdag 22 juli 2005 16:44 schreef XoxIx het volgende:

[..]

Als je je applet hebt aangepast. Je telt het aantal priemgetallen dat je gebruikt, niet het aantal tekens dat je gebruikt, terwijl je bij de input kijkt naar het aantal tekens.

Ik kan elk gebruikt priemgetal opslaan in 1 byte, dus waarom zou ik daar rekening mee moeten houden ? Het integere getal dat je ingeeft is in feite de integere weergave van data. Het is niet zo dat dat getal in een bestand komt te staan.

vrijdag 22 juli 2005 @ 16:49:36 #172

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 16:48 schreef gelly het volgende:

[..]

Ik kan elk gebruikt priemgetal opslaan in 1 byte, dus waarom zou ik daar rekening mee moeten houden ? Het integere getal dat je ingeeft is in feite de integere weergave van data. Het is niet zo dat dat getal in een bestand komt te staan.

Zie mijn post. Je telt getallen tot 256 als 3 karakters/bytes in plaats van 1.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 16:51:40 #173

#ANONIEM

quote:
Op vrijdag 22 juli 2005 16:49 schreef BUG80 het volgende:

[..]

Zie mijn post. Je telt getallen tot 256 als 3 karakters/bytes in plaats van 1.

Uhm nee. Ik kan met een byte aangeven welke plaats het priemgetal heeft in de index van Mesenne priemgetallen. Je moet die getallen niet als karakters zien maar als de integere weergave van bytes.

vrijdag 22 juli 2005 @ 16:54:55 #174

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 16:51 schreef gelly het volgende:

[..]

Uhm nee. Ik kan met een byte aangeven welke plaats het priemgetal heeft in de index van Mesenne priemgetallen. Je moet die getallen niet als karakters zien maar als de integere weergave van bytes.

Juist. Maar in de invoer doe je dat niet en dat is niet eerlijk. De volgende invoer sequentie:

100 255 8 1 3

is niet 9 bytes waard zoals jouw applet zou zeggen, maar 5. Vergeet niet dat een willekeurig bestand niet alleen bestaat uit de getallen 0-9 maar het complete ASCII alfabet. Als je dat omzet naar getallen kom je op sequenties als hierboven.

Kortom, je compressie is (helaas) niet zo goed als het lijkt.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:01:33 #175

BUG80

Stop making sense

Weet je wat, ik geef even een voorbeeld. Het volgende is een willekeurig bestand van 10 bytes:

quote:
N‹'³aÜÛ˜æ

Als ik dit omzet naar (ASCII) getallen wordt het:

quote:
78 139 39 179 97 220 219 152 127 230

In getallen 0-9 heeft het dus een lengte van 27 bytes. Jouw applet geeft:

quote:
Used primes : 21 for 27 decimals
Compression is 77 %

Kortom, hij vergroot het bestand van 10 naar 21 bytes!!

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:08:12 #176

galoptic

Heb dat boek (De Broncode) twee maandjes geleden voor 1,5 euro gekocht als afgeschreven boek bij m'n bieb... Raar dat het er toen al lag: in perfecte nieuwstaat en met een voorwoord van augustus 2004.

vrijdag 22 juli 2005 @ 17:21:14 #177

BUG80

Stop making sense

Hier nog een link naar een ietwat slordig geschreven Word document met daarin een verhaal waarin de auteur probeert uit te leggen dat er een kern van waarheid zou kunnen zitten in de verhalen van Sloot, hoewel hij wel stevig moest hebben overdreven volgens die theorie.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:37:53 #178

gnomaat

quote:
Op vrijdag 22 juli 2005 16:27 schreef gelly het volgende:
Ja, ik sla namelijk niet de priemgetallen zelf op, alleen het hoeveelste Mersenne priemgetal het is.

Maar wat heeft dat voor zin, dan kun je alleen data (getallen) van precies die vorm compressen, of anders maakt het restant wat je ook nog moet compressen het totaal groter dan het origineel.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 17:39:11 #179

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 17:37 schreef gnomaat het volgende:

[..]

Maar wat heeft dat voor zin, dan kun je alleen data (getallen) van precies die vorm compressen, of anders maakt het restant wat je ook nog moet compressen het totaal groter dan het origineel.

Zie mijn voorbeeld.

Het idee is mooi, dat wel.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:40:27 #180

BUG80

Stop making sense

Misschien had Sloot wel priemwoorden gevonden in plaats van priemgetallen

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:45:42 #181

gnomaat

quote:
Op vrijdag 22 juli 2005 17:01 schreef BUG80 het volgende:
Weet je wat, ik geef even een voorbeeld. Het volgende is een willekeurig bestand van 10 bytes:
[..]

Als ik dit omzet naar (ASCII) getallen wordt het:
[..]

In getallen 0-9 heeft het dus een lengte van 27 bytes. Jouw applet geeft:
[..]

Kortom, hij vergroot het bestand van 10 naar 21 bytes!!

Dat is geen eerlijke vergelijking.
In je eerste stap, als je het omzet naar ASCII, zeg je "dit getal heeft een lengte van 27 bytes". Maar op die manier hangt het van de data af, als er veel bytes met ascii waarde onder de 100 in zitten worden het veelal getallen van 2 decimalen, en veel boven de 100, dan 3.

Je moet het hele bestand als één groot getal zien: 78 + 256*139 + 256²*39 + ... enz

Vervolgens, als hij een getal van 27 decimalen comprimeert naar 21 decimalen, kun je niet zeggen "dat zijn 21 bytes, en da's groter dan 10". Dat getal van 21 decimalen moet je dan weer splitsen in ASCII waarden en die bytes schrijf je weg. Dat zijn er dan veel minder dan 21. Zo begon je tenslotte ook met je oorspronkelijke bestand.

Dus je schrijft een byte weg met de waarde (getal mod 256), en vervolgens deel je het getal door 256 (afronden naar beneden). Dit herhaal je tot je nul overhoudt.

Overigens heeft deze methode van het interpreteren van een bestand als getal nog het probleem dat je geen verschil kunt zien tussen een bestand bestaande uit twee nul-bytes of uit tweehonderd nul-bytes.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 17:49:00 #182

#ANONIEM

quote:
Op vrijdag 22 juli 2005 17:37 schreef gnomaat het volgende:

[..]

Maar wat heeft dat voor zin, dan kun je alleen data (getallen) van precies die vorm compressen, of anders maakt het restant wat je ook nog moet compressen het totaal groter dan het origineel.

Er is geen restant...

vrijdag 22 juli 2005 @ 17:50:52 #183

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 17:45 schreef gnomaat het volgende:

[..]

Dat is geen eerlijke vergelijking.
In je eerste stap, als je het omzet naar ASCII, zeg je "dit getal heeft een lengte van 27 bytes". Maar op die manier hangt het van de data af, als er veel bytes met ascii waarde onder de 100 in zitten worden het veelal getallen van 2 decimalen, en veel boven de 100, dan 3.

Ik heb dit met een random generator gedaan, het viel toevallig hoog uit. De verwachtingswaarde voor de lengte van een ASCII getal is (100*1 + 100*2 + 56*3)/256 = 1,82 decimalen.

quote:
Vervolgens, als hij een getal van 27 decimalen comprimeert naar 21 decimalen, kun je niet zeggen "dat zijn 21 bytes, en da's groter dan 10". Dat getal van 21 decimalen moet je dan weer splitsen in ASCII waarden en die bytes schrijf je weg. Dat zijn er dan veel minder dan 21. Zo begon je tenslotte ook met je oorspronkelijke bestand.

Dat doet het applet van Gelly ook precies, dus volgens mij is dit wel een eerlijke vergelijking.

edit: Het applet van Gelly schrijft '186' dus weg als 1 ASCII byte i.p.v. "1", "8" en "6".

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:54:17 #184

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 17:49 schreef gelly het volgende:

[..]

Er is geen restant...

Hij bedoelt met restant: alles wat niet in de range 0-9 valt.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 17:56:04 #185

#ANONIEM

quote:
Op vrijdag 22 juli 2005 17:50 schreef BUG80 het volgende:

[..]

edit: Het applet van Gelly schrijft '186' dus weg als 1 ASCII byte i.p.v. "1", "8" en "6".

Dat kan omdat dat 'karakter' onderdeel is van een groter getal.

vrijdag 22 juli 2005 @ 17:57:11 #186

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 17:56 schreef gelly het volgende:

[..]

Dat kan omdat dat 'karakter' onderdeel is van een groter getal.

Snap je wat ik bedoel met mijn getallenvoorbeeld? Dat bestand van 10 bytes?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 18:12:21 #187

-erwin-

liberaal intellectueel

quote:
Op donderdag 21 juli 2005 15:48 schreef Danny het volgende:

[..]

Veel getallen die je niet in 1 notatie samen kunt vatten kun je wellicht wel in meerdere wiskundige notaties samenvatten waar je dan na bewerking (optellen bv) WEL het juiste getal uitkrijgt.
Zelfs al zou je een getal van 20 miljoen cijfers dan moeten opdelen is 10.000 van die korte notaties heb je alsnog van 20Mb 100Kb gemaakt.

hierbij geldt hetzelfde principe als hierboven al aangehaald. ik kan in een paar bytes een heel groot getal produceren, maar ik kan niet in een paar bytes elk groot getal produceren. zoiets valt via relatief eenvoudige logica te bewijzen.

fotoboek.fok.nl/-erwin-
Ik heb geen respect voor gelovigen en hun geloof.
Mijn posts reflecteren niet noodzakelijkerwijs mijn mening.

vrijdag 22 juli 2005 @ 18:30:00 #188

-erwin-

liberaal intellectueel

quote:
Op vrijdag 22 juli 2005 15:02 schreef BUG80 het volgende:

[..]

Wat dat betreft ben ik het helemaal met je eens, maar ben jij het met mij eens dat als je in het bezit bent van een soort super database/Huffman tree (die niet bestaat denk ik), het dan wel mogelijk moet zijn om veel verder te comprimeren dan dat, zolang je die database maar apart opslaat.

Klopt. Echter is 4kb daarvoor veel en veel te klein. Zelfs met 1 film kun je door alle scenes in andere volgordes te zetten al bijna genoeg verschillende mogelijkheden produceren om 4kb vol te krijgen. Laat staan dat je alle mogelijke films zou kunnen opslaan op die manier.

Voor mij staan een aantal zaken als een paal boven water.
1. Het is een lossy compressie.
2. 4kb is onmogelijk. Ordes in de tientallen danwel honderden megabytes lijken aannemelijker.
3. De grootte van de data ligt niet vast. Langere film betekent meer data.
4. Het systeem heeft waarschijnlijk nooit bestaan.

fotoboek.fok.nl/-erwin-
Ik heb geen respect voor gelovigen en hun geloof.
Mijn posts reflecteren niet noodzakelijkerwijs mijn mening.

vrijdag 22 juli 2005 @ 18:30:41 #189

gnomaat

quote:
Op vrijdag 22 juli 2005 17:50 schreef BUG80 het volgende:
Ik heb dit met een random generator gedaan, het viel toevallig hoog uit. De verwachtingswaarde voor de lengte van een ASCII getal is (100*1 + 100*2 + 56*3)/256 = 1,82 decimalen.

Okee, dan heb ik twee briljante manieren om files te compressen:

1. Schrijf een bestand 1000 bytes uit als decimalen zoals bovenstaand. Naar verwachting krijg je dan zo'n 1828 decimalen (hangt natuurlijk van je bestand af, maar gemiddeld).
Aangezien je makkelijk 2 decimalen per byte kunt opslaan (dat worden bytes met ascii waarden 0 t/m 99) heb je dus 914 bytes nodig om die decimalen weer op te slaan. Blijft over: 914/1000 = 91%. Dit is recursief toepasbaar.

2. Voordat je dit doet tel je eerst de frequentie van alle bytes. Vervolgens verwissel je de bytes zodat de meest veelvoorkomende bytes de laagste ascii waarden krijgen. Op die manier heb je zoveel mogelijk bytes die zo min mogelijk decimalen kosten. Het verwisselen kost enkel een re-map tabel van 256 bytes, ongeacht hoe groot het bestand.

En, zie je al waar de fout zit?

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 18:41:24 #190

Barati

Gelly, om inzicht te krijgen in het feit dat je methode niet doet wat je claimt stel ik voor dat je een willekeurig inputbestand genereert dat je vervolgens comprimeert met jou methode waarna je het decomprimeert en vergelijkt met het origineel. Kijk dan eens naar de compressie ratio.

vrijdag 22 juli 2005 @ 18:45:40 #191

gnomaat

quote:
Op vrijdag 22 juli 2005 17:49 schreef gelly het volgende:
Er is geen restant...

Alleen als het precies een groot priemgetal is.
Als de input data bijvoorbeeld 618970019642690137449562111 is, dan kun je volstaan met "89" (omdat 2⁸⁹-1 = dat getal), of zelfs "9" (omdat 2⁸⁹-1 het tiende Mersenne priemgetal is en je begint te tellen vanaf 0).

Maar dat is een zeer uitzonderlijke input. Wat nu als de input bijvoorbeeld 761825315945362690850838009 is?

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 18:48:26 #192

gnomaat

Oh ja dit klopt trouwens ook niet helemaal:

quote:
Op vrijdag 22 juli 2005 17:50 schreef BUG80 het volgende:
Ik heb dit met een random generator gedaan, het viel toevallig hoog uit. De verwachtingswaarde voor de lengte van een ASCII getal is (100*1 + 100*2 + 56*3)/256 = 1,82 decimalen.

Moet zijn (10*1 + 90*2 + 156*3)/256 = 2.57 decimalen gemiddeld per byte.

Maar dat was niet eens de grootste fout in mijn "briljante" nieuwe compressiemethode van hierboven

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 19:05:07 #193

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 18:30 schreef gnomaat het volgende:

[..]

Okee, dan heb ik twee briljante manieren om files te compressen:

1. Schrijf een bestand 1000 bytes uit als decimalen zoals bovenstaand. Naar verwachting krijg je dan zo'n 1828 decimalen (hangt natuurlijk van je bestand af, maar gemiddeld).
Aangezien je makkelijk 2 decimalen per byte kunt opslaan (dat worden bytes met ascii waarden 0 t/m 99) heb je dus 914 bytes nodig om die decimalen weer op te slaan. Blijft over: 914/1000 = 91%. Dit is recursief toepasbaar.

2. Voordat je dit doet tel je eerst de frequentie van alle bytes. Vervolgens verwissel je de bytes zodat de meest veelvoorkomende bytes de laagste ascii waarden krijgen. Op die manier heb je zoveel mogelijk bytes die zo min mogelijk decimalen kosten. Het verwisselen kost enkel een re-map tabel van 256 bytes, ongeacht hoe groot het bestand.

En, zie je al waar de fout zit?

Ehh nee. Volgens mij heb je zojuist gewoon een eerste opzet voor een Huffman tree ontworpen, alleen dan met behulp van bytes ipv bits

_{of ik mis iets}

En inderdaad de verwachtingswaarde voor de lengte in decimalen van een ASCII waarde is 2.57, mijn fout, sorry

[edit]Methode 1 vervalt dus al, aangezien gemiddeld genomen je bestanden groter worden met deze methode. Je bestand van 1000 bytes worden 2570 decimalen. Dit gedeeld door 2 = 1285[/edit]

Waar het verhaal van Gelly fout gaat is het volgende: hij comprimeert decimalen terug naar bytes met behulp van ontbinding in priemgetallen, in plaats van bytes naar bytes, wat veel eerlijker zou zijn. Dat is wat ik probeer duidelijk te maken.

[ Bericht 5% gewijzigd door BUG80 op 22-07-2005 19:13:49 ]

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 19:07:48 #194

BUG80

Stop making sense

Probeer anders eens het volgende bestand te comprimeren met behulp van de methode van Gelly, je zult zien dat het groter wordt:

quote:
x6YNsgK#mJ

Ik heb expres 'leesbare' karakters gebruikt. Succes.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 19:09:42 #195

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 18:45 schreef gnomaat het volgende:

[..]

Alleen als het precies een groot priemgetal is.
Als de input data bijvoorbeeld 618970019642690137449562111 is, dan kun je volstaan met "89" (omdat 2⁸⁹-1 = dat getal), of zelfs "9" (omdat 2⁸⁹-1 het tiende Mersenne priemgetal is en je begint te tellen vanaf 0).

Maar dat is een zeer uitzonderlijke input. Wat nu als de input bijvoorbeeld 761825315945362690850838009 is?

Nogmaals, volgens mij bedoelde hij niet restant als in "modulo", maar het restant als je alleen de decimalen in een bestand comprimeert. Een gemiddeld bestand bestaat namelijk uit veel meer dan alleen decimalen.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 19:35:12 #196

#ANONIEM

quote:
Op vrijdag 22 juli 2005 18:45 schreef gnomaat het volgende:

[..]

Alleen als het precies een groot priemgetal is.
Als de input data bijvoorbeeld 618970019642690137449562111 is, dan kun je volstaan met "89" (omdat 2⁸⁹-1 = dat getal), of zelfs "9" (omdat 2⁸⁹-1 het tiende Mersenne priemgetal is en je begint te tellen vanaf 0).

Maar dat is een zeer uitzonderlijke input. Wat nu als de input bijvoorbeeld 761825315945362690850838009 is?

Dit is ook een ruwe opzet hoor, ben nog druk bezig te kijken wat het beste werkt. Je kunt je voorstellen dat je door het scannen van datareeksen getallen tegenkomt die je door een veel kortere notatie kunt vervangen. Een combinatie van verschillende logaritmen moet zeker een forse compressie oplever mijns inziens.

vrijdag 22 juli 2005 @ 19:47:01 #197

BUG80

Stop making sense

Gelly, please

Je vergelijkt appels met peren. Je begint met decimalen met een bandbreedte van 0-9, die je vervolgens ontbindt in priemgetallen, die je opslaat als bytes in bandbreedte 0-255. Vind je het gek dat je compressie bereikt.

Neem het volgende getal (lengte 22 decimalen):

quote:
1792873102928338392382

Jouw applet maakt daar 16 priemgetallen van, die je opslaat als bytes met waarde 0-255. Met de hand kan ik er echter ook bytes van maken:

179 28 73 102 92 83 38 39 238 2

Nou zijn het er ineens nog maar 10! Kortom met de hand bereik ik meer compressie dan met jouw methode!

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 20:11:41 #198

gnomaat

quote:
Op vrijdag 22 juli 2005 19:35 schreef gelly het volgende:
Dit is ook een ruwe opzet hoor, ben nog druk bezig te kijken wat het beste werkt. Je kunt je voorstellen dat je door het scannen van datareeksen getallen tegenkomt die je door een veel kortere notatie kunt vervangen. Een combinatie van verschillende logaritmen moet zeker een forse compressie oplever mijns inziens.

Gemiddeld levert dat minder winst op dan de extra ruimte die het je kost om de metadata voor zo'n notatie op te slaan. Ongeacht je methode of het type korte notatie dat je gebruikt.

Maar goed, mijn challenge staat nog steeds, werk je idee gerust uit. Als je een appje weet te bakken dat mijn 10KB bestand onder de 9 KB krijgt (dus een file van maximaal 9216 bytes) dan

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 20:22:45 #199

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 18:30 schreef gnomaat het volgende:
En, zie je al waar de fout zit?

gnomaat, kun je deze vraag nog even beantwoorden?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 20:33:30 #200

gnomaat

quote:
Op vrijdag 22 juli 2005 20:22 schreef BUG80 het volgende:
gnomaat, kun je deze vraag nog even beantwoorden?

Hint: als het decimale getal 112131032202120121 is, van welke ascii waardes komt dat dan? (m.a.w. welke originele file hoort hierbij?)

Birthdays are good for you: the more you have, the longer you live.

vrijdag 22 juli 2005 @ 20:40:42 #201

BUG80

Stop making sense

quote:
Op vrijdag 22 juli 2005 20:33 schreef gnomaat het volgende:

[..]

Hint: als het decimale getal 112131032202120121 is, van welke ascii waardes komt dat dan? (m.a.w. welke originele file hoort hierbij?)

Bedoel je dat één getallenreeks kan staan voor meerdere ASCII files?

Ok, dan moet je dus inderdaad werken met A0 + 256*A1 + 256²*A3, enz.., met Ai de ASCII waarde van karakter 'i', maar dat maakt het uiteindelijke getal toch alleen maar nog langer? Dat maakt Gelly's methode nog inefficienter.

Maar ok, je hebt gelijk, mijn uitleg was te simpel gedacht, wat dit betreft.

[edit] Je getal hoort volgens bovenstaande methode bij de volgende 8 bytes:

192 139 180 102 148 94 142 1

_{De 'Prime test' maakt er vervolgens 15 van}[/edit]

[ Bericht 6% gewijzigd door BUG80 op 22-07-2005 20:52:11 ]

Mijn mixtape: labtones.com/listener/JSP

vrijdag 22 juli 2005 @ 21:12:53 #202

BabeWatcher

Stephanie <3

Ik heb al heel lang geleden een systeem proberen te maken gebaseerd op Chaos. Bij een willekeurig bestand neemt een tabel met verwijzingen gewoon meer ruimte in dan het origineel. Ik denk dat dat met priemgetallen niet veel beter zal zijn.

Dit figuur is met een paar regels code te maken, het opgeslagen plaatje kost veel meer ruimte dan de broncode.

[ alle babes op 1 pagina via fok!wiki -bijgewerkt tot 20/10/2015 ]
Leve Kim , Leve Maduro , Leve Castro
#freeTarik #freeDemon_from_heaven

zaterdag 23 juli 2005 @ 00:10:34 #203

gnomaat

quote:
Op vrijdag 22 juli 2005 20:40 schreef BUG80 het volgende:
Bedoel je dat één getallenreeks kan staan voor meerdere ASCII files?

Ok, dan moet je dus inderdaad werken met A0 + 256*A1 + 256²*A3, enz.., met Ai de ASCII waarde van karakter 'i', maar dat maakt het uiteindelijke getal toch alleen maar nog langer?

Nog langer dan iets wat niet werkt ja, dus je moet wel

Birthdays are good for you: the more you have, the longer you live.

zaterdag 23 juli 2005 @ 11:15:37 #204

BUG80

Stop making sense

quote:
Op zaterdag 23 juli 2005 00:10 schreef gnomaat het volgende:

[..]

Nog langer dan iets wat niet werkt ja, dus je moet wel

Ja, dat is waar.

Maar goed, dat deze specifieke methode niet werkt betekent nog niet dat we het idee van Gelly moeten afschrijven. Ik maakte al eerder een semi-grappige opmerking over "priemwoorden", maar misschien zit daar wel wat in. Stel nou dat we met een getallenstelsel gaan werken dat niet uit de decimalen 0-9 bestaat, maar uit ASCII waarden 0-255. Met zo'n getallenstelsel kun je net zo goed bewerkingen uitvoeren, zoals optellen en vermenigvuldigen. Vergelijk het met het hexadecimale stelsel 00-FF. Aangezien je lineaire operaties uit kunt voeren, zouden er ook equivalenten van priemgetallen moeten bestaan, toch?

Alleen ben ik bang dat de volgende stelling geldig is: Ontbinding van een getal in andere getallen zal gemiddeld genomen niet tot compressie leiden.

Mijn mixtape: labtones.com/listener/JSP

zaterdag 23 juli 2005 @ 12:05:38 #205

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 22 juli 2005 21:12 schreef BabeWatcher het volgende:
Ik heb al heel lang geleden een systeem proberen te maken gebaseerd op Chaos. Bij een willekeurig bestand neemt een tabel met verwijzingen gewoon meer ruimte in dan het origineel. Ik denk dat dat met priemgetallen niet veel beter zal zijn.

[[url=http://img280.imageshack.us/img280/3992/fb9yy.th.png]afbeelding][/URL]
Dit figuur is met een paar regels code te maken, het opgeslagen plaatje kost veel meer ruimte dan de broncode.

jaja, maar, dat zegt niet zoveel.
Er zijn ook programma´tje die een landschap genereren waar je dan virtueel zeg maar door heen gaat.
Dat is echter geen compressie, maar genereren van beelden.

Stel, en ik zeg stel, je kan een bitmap plaatje omrekenen naar een vectorgrafiek, en dat naar een fractale formule die dat zou genereren, en je doet dat 25 maal per seconde, dan zou je film kunnen omrekenen naar een fractale formule.
Dan zou je eventueel een compressie methode hebben (vooropgesteld dat het resultaat dan kleiner is)
Okay, stel dit zou kunnen, dan zou de hoeveelheid iteraties per film enorm groot zijn, en het is met zekerheid niet de methode die Sloot zou kunnen hebben gebruikt omdat
1) De wiskunde die daarvoor nodig is eerst eens moet uitgevonden worden.
2) De rekencapaciteit nodig is astronomisch.
3) Ook je met deze methode geen film naar 4K gaat krijgen.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

zaterdag 23 juli 2005 @ 12:41:00 #206

-erwin-

liberaal intellectueel

quote:
Op zaterdag 23 juli 2005 12:05 schreef Pietverdriet het volgende:

[..]

jaja, maar, dat zegt niet zoveel.
Er zijn ook programma´tje die een landschap genereren waar je dan virtueel zeg maar door heen gaat.
Dat is echter geen compressie, maar genereren van beelden.

Stel, en ik zeg stel, je kan een bitmap plaatje omrekenen naar een vectorgrafiek, en dat naar een fractale formule die dat zou genereren, en je doet dat 25 maal per seconde, dan zou je film kunnen omrekenen naar een fractale formule.
Dan zou je eventueel een compressie methode hebben (vooropgesteld dat het resultaat dan kleiner is)
Okay, stel dit zou kunnen, dan zou de hoeveelheid iteraties per film enorm groot zijn, en het is met zekerheid niet de methode die Sloot zou kunnen hebben gebruikt omdat
1) De wiskunde die daarvoor nodig is eerst eens moet uitgevonden worden.
2) De rekencapaciteit nodig is astronomisch.
3) Ook je met deze methode geen film naar 4K gaat krijgen.

Voornamelijk het laatste punt is waar het om gaat. De stelling dat het met 32768 bits mogelijk zou zijn om meer dan 32768 verschillende films te produceren is ridicuul. Dat kan iedere wiskundige je vertellen. Daarom is het, zoals ik al aangaf, wellicht wel mogelijk om films tot tientallen tot honderden mb's te reduceren, mits je bereid bent een bepaald kwaliteitsverlies toe te staan. Wellicht dat dit visueel kan worden gereduceerd tot praktisch 0, maar logisch gezien (op bitniveau) is het verlies er.

fotoboek.fok.nl/-erwin-
Ik heb geen respect voor gelovigen en hun geloof.
Mijn posts reflecteren niet noodzakelijkerwijs mijn mening.

zaterdag 23 juli 2005 @ 12:45:02 #207

gnomaat

quote:
Op zaterdag 23 juli 2005 12:41 schreef -erwin- het volgende:
Voornamelijk het laatste punt is waar het om gaat. De stelling dat het met 32768 bits mogelijk zou zijn om meer dan 32768 verschillende films te produceren is ridicuul.

Ehm, meer dan 2³²⁷⁶⁸ films. En dat zijn er heel wat meer dan er ooit gemaakt zullen worden

Birthdays are good for you: the more you have, the longer you live.

zaterdag 23 juli 2005 @ 12:46:47 #208

gnomaat

quote:
Op zaterdag 23 juli 2005 11:15 schreef BUG80 het volgende:
Maar goed, dat deze specifieke methode niet werkt betekent nog niet dat we het idee van Gelly moeten afschrijven. Ik maakte al eerder een semi-grappige opmerking over "priemwoorden", maar misschien zit daar wel wat in. Stel nou dat we met een getallenstelsel gaan werken dat niet uit de decimalen 0-9 bestaat, maar uit ASCII waarden 0-255. Met zo'n getallenstelsel kun je net zo goed bewerkingen uitvoeren, zoals optellen en vermenigvuldigen. Vergelijk het met het hexadecimale stelsel 00-FF. Aangezien je lineaire operaties uit kunt voeren, zouden er ook equivalenten van priemgetallen moeten bestaan, toch?

Natuurlijk, die priemgetallen zijn hetzelfde als "onze" priemgetallen.

Het priem zijn van getallen hangt niet af van het talstelsel waarin je ze noteert.

quote:
Alleen ben ik bang dat de volgende stelling geldig is: Ontbinding van een getal in andere getallen zal gemiddeld genomen niet tot compressie leiden.

Ik weet het wel zeker

Birthdays are good for you: the more you have, the longer you live.

zaterdag 23 juli 2005 @ 12:48:19 #209

-erwin-

liberaal intellectueel

quote:
Op zaterdag 23 juli 2005 12:45 schreef gnomaat het volgende:

[..]

Ehm, meer dan 2³²⁷⁶⁸ films. En dat zijn er heel wat meer dan er ooit gemaakt zullen worden

ahum. mijn fout

ik zal hem maar niet editen, anders lijkt het zo raar. goede morgen

fotoboek.fok.nl/-erwin-
Ik heb geen respect voor gelovigen en hun geloof.
Mijn posts reflecteren niet noodzakelijkerwijs mijn mening.

zaterdag 23 juli 2005 @ 12:52:14 #210

BUG80

Stop making sense

quote:
Op zaterdag 23 juli 2005 12:48 schreef -erwin- het volgende:

[..]

ahum. mijn fout ik zal hem maar niet editen, anders lijkt het zo raar. goede morgen

Neem een bakkie koffie zou ik zeggen

Mijn mixtape: labtones.com/listener/JSP

zaterdag 23 juli 2005 @ 12:53:10 #211

JasperE

daar is de kont

Stel dat de code bestaat, alsnog had geen enkele laptop in die tijd de benodigde rekenkrecht voorhet direct afspelen van 16 filmen simultaan

gezellig!

zaterdag 23 juli 2005 @ 12:55:11 #212

BUG80

Stop making sense

quote:
Op zaterdag 23 juli 2005 12:46 schreef gnomaat het volgende:

[..]

Natuurlijk, die priemgetallen zijn hetzelfde als "onze" priemgetallen.

Het priem zijn van getallen hangt niet af van het talstelsel waarin je ze noteert.
[..]

Ik weet het wel zeker

Ja ik ook, gevoelsmatig. Heb je toevallig een link naar een wiskundig bewijs?

Gevoelsmatig zou het argument van -erwin- al voldoende moeten zijn:

quote:
hierbij geldt hetzelfde principe als hierboven al aangehaald. ik kan in een paar bytes een heel groot getal produceren, maar ik kan niet in een paar bytes elk groot getal produceren. zoiets valt via relatief eenvoudige logica te bewijzen.

Mijn mixtape: labtones.com/listener/JSP

zaterdag 23 juli 2005 @ 12:57:28 #213

BUG80

Stop making sense

quote:
Op zaterdag 23 juli 2005 12:53 schreef JasperE het volgende:
Stel dat de code bestaat, alsnog had geen enkele laptop in die tijd de benodigde rekenkrecht voorhet direct afspelen van 16 filmen simultaan

Als zowel beeld als geluid ongecomprimeerd zijn zou het wel moeten kunnen, toch? Maarja, ze waren wel gecomprimeerd, dat is juist het punt.

Dat is dus ook zoiets: als het algoritme bestaat moet het wel verdomd "licht" zijn geweest. Neem een equivalent van audio compressie: Ogg Vorbis. Daarmee haal je veel betere kwaliteit dan MP3 op dezelfde bitrate, maar het kost dan ook veel meer rekenkracht.

Mijn mixtape: labtones.com/listener/JSP

zaterdag 23 juli 2005 @ 13:03:04 #214

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op zaterdag 23 juli 2005 12:45 schreef gnomaat het volgende:

[..]

Ehm, meer dan 2³²⁷⁶⁸ films. En dat zijn er heel wat meer dan er ooit gemaakt zullen worden

en dan heb je 1 0 bit´s per film
De 2³²⁷⁶⁸ posities zijn dan alleen maar het catalogusnummer, je hebt niets meer over om informatie van de film op te slaan

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

zaterdag 23 juli 2005 @ 13:07:11 #215

Pietverdriet

Ik wou dat ik een ijsbeer was.

Maar goed, ik zie eigenlijk alleen maar het herkauwen van de dingen die in de vorige topics al uitvoerig herkauwt zijn.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

zaterdag 23 juli 2005 @ 13:48:12 #216

gnomaat

quote:
Op zaterdag 23 juli 2005 13:03 schreef Pietverdriet het volgende:
en dan heb je 1 0 bit´s per film
De 2³²⁷⁶⁸ posities zijn dan alleen maar het catalogusnummer, je hebt niets meer over om informatie van de film op te slaan

De eigenlijke films zouden dan in een database staan. Niet dat ik ook maar iets zinnigs zie in zo'n oplossing, maar het ging er alleen om dat de bewering dat 32768 bits al niet genoeg was om uberhaupt alle films uniek mee te identificeren omdat er veel meer zouden zijn, niet klopte.

Birthdays are good for you: the more you have, the longer you live.

zaterdag 23 juli 2005 @ 14:00:44 #217

gnomaat

quote:
Op zaterdag 23 juli 2005 12:57 schreef BUG80 het volgende:
Als zowel beeld als geluid ongecomprimeerd zijn zou het wel moeten kunnen, toch? Maarja, ze waren wel gecomprimeerd, dat is juist het punt.

Hoe zat dat eigenlijk bij die uitvinding van Jan Sloot, decomprimeerde zijn kastje de data? Of las hij alleen data uit dat kastje wat vervolgens met een normaal programma werd gedecomprimeerd?

Birthdays are good for you: the more you have, the longer you live.

zaterdag 23 juli 2005 @ 14:03:38 #218

gnomaat

quote:
Op zaterdag 23 juli 2005 12:55 schreef BUG80 het volgende:
Ja ik ook, gevoelsmatig. Heb je toevallig een link naar een wiskundig bewijs?

Nee zo niet, maar moet niet al te moeilijk zijn.
Wat voor ontbinding bedoel je precies, een getal normaal ontbinden in priemfactoren en dan voor iedere priemfactor opschrijven het hoeveelste priemgetal het is?
Of een zo groot mogelijk priemgetal vinden dat je van het getal af kunt trekken (eventueel alleen Mersenne priemgetallen of een andere bekende serie zodat je ze heel kort kunt noteren) en dan hetzelfde met het restant tot je 0 overhoudt. Dus een soort ontbinden in "priemsommen". Dat is geloof ik ook wat gelly deed?

Birthdays are good for you: the more you have, the longer you live.

zaterdag 23 juli 2005 @ 14:20:03 #219

BUG80

Stop making sense

quote:
Op zaterdag 23 juli 2005 14:03 schreef gnomaat het volgende:

[..]

Nee zo niet, maar moet niet al te moeilijk zijn.
Wat voor ontbinding bedoel je precies, een getal normaal ontbinden in priemfactoren en dan voor iedere priemfactor opschrijven het hoeveelste priemgetal het is?
Of een zo groot mogelijk priemgetal vinden dat je van het getal af kunt trekken (eventueel alleen Mersenne priemgetallen of een andere bekende serie zodat je ze heel kort kunt noteren) en dan hetzelfde met het restant tot je 0 overhoudt. Dus een soort ontbinden in "priemsommen". Dat is geloof ik ook wat gelly deed?

Ik bedoelde eigenlijk in het algemeen. Dus elke lineaire ontbinding. Gevoelsmatig denk ik namelijk dat je alleen compressie kunt bereiken door de entropie van een reeks tekens te verlagen. Ontbinden in priemgetallen, factoren van 256, of wat dan ook maakt daar geen gebruik van toch?

Mijn mixtape: labtones.com/listener/JSP

zaterdag 23 juli 2005 @ 14:22:51 #220

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op zaterdag 23 juli 2005 14:00 schreef gnomaat het volgende:

[..]

Hoe zat dat eigenlijk bij die uitvinding van Jan Sloot, decomprimeerde zijn kastje de data? Of las hij alleen data uit dat kastje wat vervolgens met een normaal programma werd gedecomprimeerd?

Als je de vorige topics doorleest zal je zien dat de uitvinding geen van beide deed, omdat het helemaal niet kan.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

zaterdag 23 juli 2005 @ 14:43:06 #221

gnomaat

quote:
Op zaterdag 23 juli 2005 14:22 schreef Pietverdriet het volgende:
Als je de vorige topics doorleest zal je zien dat de uitvinding geen van beide deed, omdat het helemaal niet kan.

Say what! Was het NEP?!

Ik weet het, maar ik bedoelde: wat werd er gesuggereerd door Jan Sloot

Birthdays are good for you: the more you have, the longer you live.

dinsdag 26 juli 2005 @ 00:31:17 #222

DirtyHarry

Poehé :P

Ik heb wiskundig bewijs dat Sloots verhaal niet kan kloppen.

Een sleutel van 128 kilobyte kan 2^128*1024*8 = 2^1048576 verschillende waarden aannemen. Ik ga er even vanuit dat Sloot zijn algoritme volledig optimaal werkt, dus met die sleutel kan hij 2^1048576 films genereren.

Zou dit aantal genoeg zijn om alle mogelijke films weer te geven die mogelijk zijn? Laten we eerst eens kijken naar 1 frame van 640x480 pixels met 16bit kleurdiepte. Hoeveel mogelijkheden zijn hiervoor?

Stel je hebt 3 pixels met elk 2 mogelijke kleurwaarden. De kleurwaarde mogelijkheden noem ik gewoon even 0 en 1. De mogelijkheden hiermee zijn:
0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1
Aantal mogelijkheden is 2³ = 8

Voor een plaatje van x pixels en y kleurwaarden per pixel is het aantal mogelijkheden y^x
Voor een plaatje van 640x480 = 307200 pixels met 2¹⁶ = 65536 mogelijke kleurwaarden is het aantal mogelijkheden dus 65536³⁰⁷²⁰⁰ = (2¹⁶)³⁰⁷²⁰⁰ = 2^4915200

Zoals je kan zien zijn er 2^4915200/2^1048576 = 2^3866624 zoveel plaatjes mogelijk dan met 128kbyte kan gekatalogiseerd worden.

Nu hebben we het nog niet eens over films. Neem een film van 640*480@25fps, 16bit kleurdiepte en 90 minuten lang.
Aantal mogelijkheden nu:
Totaal aantal pixels: 640x480x25x90x60 = 41472000000
2¹⁶ mogelijkheden per pixel

Totaal: (2¹⁶)^41472000000 = 2^663552000000 mogelijkheden.

Wat Sloot dus al die tijd heeft beweerd is dat 128kilobyte alle 2^663552000000 mogelijke films zou kunnen bevatten. Sure...

dinsdag 26 juli 2005 @ 00:34:08 #223

-erwin-

liberaal intellectueel

quote:
Op dinsdag 26 juli 2005 00:31 schreef DirtyHarry het volgende:
Ik heb wiskundig bewijs dat Sloots verhaal niet kan kloppen.

dat is evident.

fotoboek.fok.nl/-erwin-
Ik heb geen respect voor gelovigen en hun geloof.
Mijn posts reflecteren niet noodzakelijkerwijs mijn mening.

dinsdag 26 juli 2005 @ 00:36:02 #224

HenryHill

Fake it 'till you make it

quote:
Op dinsdag 26 juli 2005 00:31 schreef DirtyHarry het volgende:
Nu hebben we het nog niet eens over films. Neem een film van 640*480@25fps, 16bit kleurdiepte en 90 minuten lang.
Aantal mogelijkheden nu:
Totaal aantal pixels: 640x480x25x90x60 = 41472000000
2¹⁶ mogelijkheden per pixel

Totaal: (2¹⁶)^41472000000 = 2^663552000000 mogelijkheden.

Da's mooi, maar hoe verklaar je dan dat je films kunt downloaden van 700Mb? Zelfs als je 512x384 als resolutie gebruikt dan zit je er nog een paar flinke factors naast...

So this is how liberty dies... with thunderous applause.
Truth? What's so great about the truth? Try lying for a change, it's the currency of the world

dinsdag 26 juli 2005 @ 00:36:47 #225

-erwin-

liberaal intellectueel

quote:
Op dinsdag 26 juli 2005 00:36 schreef HenryHill het volgende:

[..]

Da's mooi, maar hoe verklaar je dan dat je films kunt downloaden van 700Mb? Zelfs als je 512x384 als resolutie gebruikt dan zit je er nog een paar flinke factors naast...

lossy compression

fotoboek.fok.nl/-erwin-
Ik heb geen respect voor gelovigen en hun geloof.
Mijn posts reflecteren niet noodzakelijkerwijs mijn mening.

dinsdag 26 juli 2005 @ 00:39:23 #226

HenryHill

Fake it 'till you make it

quote:
Op dinsdag 26 juli 2005 00:36 schreef -erwin- het volgende:

[..]

lossy compression

Maar ik geloof dat uit Sloot zijn "paper" (

) niet te destilleren valt of hij nu wel of geen lossy compressie gebruikt of niet.

So this is how liberty dies... with thunderous applause.
Truth? What's so great about the truth? Try lying for a change, it's the currency of the world

dinsdag 26 juli 2005 @ 00:41:15 #227

DirtyHarry

Poehé :P

quote:
Op dinsdag 26 juli 2005 00:36 schreef HenryHill het volgende:

[..]

Da's mooi, maar hoe verklaar je dan dat je films kunt downloaden van 700Mb? Zelfs als je 512x384 als resolutie gebruikt dan zit je er nog een paar flinke factors naast...

Bij het comprimeren van films verlies je waanzinnig veel data. Als je een film van 640x480@25fps van 90 minuten verliesloos wil opslaan heb je volgens mij minstens 80 gigabyte ruimte nodig.

dinsdag 26 juli 2005 @ 00:41:54 #228

DirtyHarry

Poehé :P

quote:
Op dinsdag 26 juli 2005 00:39 schreef HenryHill het volgende:

[..]

Maar ik geloof dat uit Sloot zijn "paper" ( ) niet te destilleren valt of hij nu wel of geen lossy compressie gebruikt of niet.

Hij zei dat ie verliesloos (pixel voor pixel) een film weer kon laten zien

dinsdag 26 juli 2005 @ 05:34:37 #229

ACT-F

Onmeunige gaspedoal emmer

Dit fenomeen houdt me al bezig sinds 1994/95. Pas dit jaar heb ik van iemand die ik slechts één dag kende voor het eerst gehoord dat er nog iemand was die dit ook daadwerkelijk uitgevonden had, maar dat de broncode zoek was. Roel Pieper was in het spel. Sinds slechts enkele weken weet ik dat datgene waar ik al jaren over zit te piekeren, wellicht is uitgevonden door een zekere Jan Sloot. In al die jaren heb ik één ding altijd zeker geweten; de algoritme is kinderljk eenvoudig, maar je moet net weten hoe het in elkaar steekt. Toen ik de verhalen las over Jan Sloot ben ik best wel geschrokken van de overeenkomsten. Ook hij was als de dood over het feit dat zijn algoritme uit zou lekken, voordat deze beschermd was, omdat deze kinderlijk eenvoudig is. Bovendien heeft Jan Sloot een electro achtergrond, net als ik. En laat ik nu tijdens mijn MTS periode (1994/95 dus) tijdens de les op het zelfde idee gekomen zijn om getallen reeksen te reduceren, toen een leraar een bepaalde techniek aan het uitleggen was. Hmmm.

Vreemd toch, dat meedere mensen hetzelfde proberen uit te vinden en dan tot de ontdekking komen dat iemand anders wellicht de uitvinding gedaan heeft die jij hebt willen doen. De overeenkomsten zijn zo sterk, waardoor ik zeker weet dat Jan Sloot's algoritme werkt. Wat het is weet ik ook niet, maar ik weet in welke richting ik zoeken moet.

Bekijk de webcam via UStream. Luister naar Gutter FM

dinsdag 26 juli 2005 @ 09:27:03 #230

livEliveD

Cogito ergo doleo

quote:
Op zaterdag 23 juli 2005 13:07 schreef Pietverdriet het volgende:
Maar goed, ik zie eigenlijk alleen maar het herkauwen van de dingen die in de vorige topics al uitvoerig herkauwt zijn.

Op zaterdag 7 oktober 2006 14:56 schreef Friek_ het volgende:
Nu kon ik het niet laten om even snel op je Fotoboek te kijken en ik zag wat ik al dacht: een onzeker beta-studentje.

dinsdag 26 juli 2005 @ 09:33:42 #231

livEliveD

Cogito ergo doleo

quote:
Op dinsdag 26 juli 2005 00:36 schreef -erwin- het volgende:
lossy compression

Mja zodra iedereen het hier over eens is kunnen we verder. Dat het wiskundig anders niet kan is al 10.000 keer geschreven op tig manieren. Met lossy compression is wel de vraag hoe de kwaliteit was van de demo.

Op zaterdag 7 oktober 2006 14:56 schreef Friek_ het volgende:
Nu kon ik het niet laten om even snel op je Fotoboek te kijken en ik zag wat ik al dacht: een onzeker beta-studentje.

dinsdag 26 juli 2005 @ 10:43:29 #232

DirtyHarry

Poehé :P

quote:
Op dinsdag 26 juli 2005 05:34 schreef ACT-F het volgende:
Dit fenomeen houdt me al bezig sinds 1994/95. Pas dit jaar heb ik van iemand die ik slechts één dag kende voor het eerst gehoord dat er nog iemand was die dit ook daadwerkelijk uitgevonden had, maar dat de broncode zoek was. Roel Pieper was in het spel. Sinds slechts enkele weken weet ik dat datgene waar ik al jaren over zit te piekeren, wellicht is uitgevonden door een zekere Jan Sloot. In al die jaren heb ik één ding altijd zeker geweten; de algoritme is kinderljk eenvoudig, maar je moet net weten hoe het in elkaar steekt. Toen ik de verhalen las over Jan Sloot ben ik best wel geschrokken van de overeenkomsten. Ook hij was als de dood over het feit dat zijn algoritme uit zou lekken, voordat deze beschermd was, omdat deze kinderlijk eenvoudig is. Bovendien heeft Jan Sloot een electro achtergrond, net als ik. En laat ik nu tijdens mijn MTS periode (1994/95 dus) tijdens de les op het zelfde idee gekomen zijn om getallen reeksen te reduceren, toen een leraar een bepaalde techniek aan het uitleggen was. Hmmm.

Vreemd toch, dat meedere mensen hetzelfde proberen uit te vinden en dan tot de ontdekking komen dat iemand anders wellicht de uitvinding gedaan heeft die jij hebt willen doen. De overeenkomsten zijn zo sterk, waardoor ik zeker weet dat Jan Sloot's algoritme werkt. Wat het is weet ik ook niet, maar ik weet in welke richting ik zoeken moet.

Interessant, maar hoe verklaar jij dan dat het wiskundig gezien onmogelijk is om films verliesloos op te slaan in een sleutel met zo'n kleine opslagcapaciteit?
En in welke richting zouden we dan moeten denken wat betreft de werking van dat algoritme?

dinsdag 26 juli 2005 @ 11:00:25 #233

BUG80

Stop making sense

quote:
Op dinsdag 26 juli 2005 10:43 schreef DirtyHarry het volgende:

[..]

Interessant, maar hoe verklaar jij dan dat het wiskundig gezien onmogelijk is om films verliesloos op te slaan in een sleutel met zo'n kleine opslagcapaciteit?
En in welke richting zouden we dan moeten denken wat betreft de werking van dat algoritme?

Je bewijs is een beetje dubieus. Met hetzelfde bewijs kun je namelijk wiskundig aantonen dat 700 MB niet genoeg is, terwijl we allemaal weten dat dat wél zo is.

Theoretisch is het mogelijk, aangezien het aantal mogelijke permutaties dat je kunt maken met 32768 bits hoger is dan het aantal films dat ooit gemaakt zal worden. Praktisch haalbaar is een ander verhaal.

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 11:11:14 #234

DirtyHarry

Poehé :P

quote:
Op dinsdag 26 juli 2005 11:00 schreef BUG80 het volgende:

[..]

Je bewijs is een beetje dubieus. Met hetzelfde bewijs kun je namelijk wiskundig aantonen dat 700 MB niet genoeg is, terwijl we allemaal weten dat dat wél zo is.

Er is daarna al gezegd dat dat komt omdat er enorm veel lossy compressie is om een film naar 700MB te comprimeren. De clue is volgens mij nog altijd dat sloot beweerde het verliesloos te kunnen.

quote:
Theoretisch is het mogelijk, aangezien het aantal mogelijke permutaties dat je kunt maken met 32768 bits hoger is dan het aantal films dat ooit gemaakt zal worden. Praktisch haalbaar is een ander verhaal.

Het aantal mogelijke films is zo ontzettend veel groter dan het aantal mogelijke permutaties dat je kunt maken met die 32768 bits. Niet dat er zoveel films zullen worden gemaakt, maar in principe zouden alle mogelijke films die kunnen worden gemaakt met zijn algoritme in zo'n sleutel moeten passen. Nou dat past dus never nooit niet.

dinsdag 26 juli 2005 @ 11:16:12 #235

BUG80

Stop making sense

quote:
Op dinsdag 26 juli 2005 11:11 schreef DirtyHarry het volgende:

[..]

Er is daarna al gezegd dat dat komt omdat er enorm veel lossy compressie is om een film naar 700MB te comprimeren. De clue is volgens mij nog altijd dat sloot beweerde het verliesloos te kunnen.

Ik bedoel alleen maar dat je bewijs geen bewijs is. Je zegt het volgende:

2^2663552000000 >> 2^32768, dus het is niet mogelijk.

Dan zeg ik, in 700 MB zitten 5872025600 bits.

2^2663552000000 >> 2^5872025600, dus ook niet mogelijk.

Je bewijs is niet sluitend. Het is intuitief, maar niet wiskundig. edit: Of het lossy of lossless is maakt niet uit.

quote:
Het aantal mogelijke films is zo ontzettend veel groter dan het aantal mogelijke permutaties dat je kunt maken met die 32768 bits. Niet dat er zoveel films zullen worden gemaakt, maar in principe zouden alle mogelijke films die kunnen worden gemaakt met zijn algoritme in zo'n sleutel moeten passen. Nou dat past dus never nooit niet.

2^32768 is megagroot, probeer het maar eens te berekenen. Zoveel films zullen er in het bestaan van het heelal nooit gemaakt worden. Het enige probleem is, dat je op een gegeven moment 1 mogelijke permutatie per film krijgt. Dat is praktisch onmogelijk te realiseren. Het is alleen niet te bewijzen dat het niet kan.

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 11:23:48 #236

BUG80

Stop making sense

Oja, nog een kleine toevoeging. Met jouw bewijs kun je ook aantonen dat je met WinZip nooit een bestand kunt verkleinen.

Immers, met 1024 bits kun je 2^1024 mogelijke bestanden maken, dat kun je dus nooit verkleinen naar 512 bits, bijvoorbeeld.

Snap je nu mijn probleem met jouw verhaal?

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 11:37:57 #237

Pinobot

Te lui voor een echte religie.

Het probleem met het sloot verhaal is niet zozeer of het wel of niet mogelijk is maar dat ie het deed op een Pentium 2 laptop.

Het leven is als een pisvlek in de zwarte pantalon van de eeuwigheid.

dinsdag 26 juli 2005 @ 11:45:23 #238

BUG80

Stop making sense

Ik heb trouwens een keer een gastcollege gehad van Roel Pieper, waarin hij maar bleef hameren op het feit dat je als ondernemer risico's moet durven nemen om verder te komen. Ik geloof dat hij zoiets zei als "9 op de 10 investeringen worden een grote flop, maar het gaat om die ene die wél een succes wordt".

Het zou heel goed kunnen dat Pieper ook sceptisch was over de vinding van Sloot, maar in het kader van zijn investeringstheorie nam hij het risico om er een paar miljoen in te steken.

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 12:59:31 #239

livEliveD

Cogito ergo doleo

quote:
Op dinsdag 26 juli 2005 11:37 schreef Pinobot het volgende:
Het probleem met het sloot verhaal is niet zozeer of het wel of niet mogelijk is maar dat ie het deed op een Pentium 2 laptop.

Neuh

Op zaterdag 7 oktober 2006 14:56 schreef Friek_ het volgende:
Nu kon ik het niet laten om even snel op je Fotoboek te kijken en ik zag wat ik al dacht: een onzeker beta-studentje.

dinsdag 26 juli 2005 @ 13:36:45 #240

DirtyHarry

Poehé :P

BUG80
Gegeven de volgende simpele situatie:
Een plaatje van 2x2 pixels met voor elke pixel de waarde zwart of wit. Het totaal aantal mogelijke plaatjes wat je in dit geval kan creeeren is 2^2x2 = 2⁴, mee eens?
Nou mag jij voor mij vertellen wat de kortst mogelijke sleutel is waarmee je alle mogelijke plaatjes mee weet te katalogiseren. (ik heb het nog niet eens over het genereren van het plaatje uit een unieke sleutel)

Ik ga ondertussen

drinken

dinsdag 26 juli 2005 @ 13:39:32 #241

BUG80

Stop making sense

quote:
Op dinsdag 26 juli 2005 13:36 schreef DirtyHarry het volgende:
BUG80
Gegeven de volgende simpele situatie:
Een plaatje van 2x2 pixels met voor elke pixel de waarde zwart of wit. Het totaal aantal mogelijke plaatjes wat je in dit geval kan creeeren is 2^2x2 = 2⁴, mee eens?
Nou mag jij voor mij vertellen wat de kortst mogelijke sleutel is waarmee je alle mogelijke plaatjes mee weet te katalogiseren. (ik heb het nog niet eens over het genereren van het plaatje uit een unieke sleutel)

Ik ga ondertussen drinken

Ja ik snap wel wat je bedoelt. Je gaat er in je redenering alleen van uit dat je eventuele redundantie niet uit de data kunt halen. Nogmaals, hoe denk je dat WinZip werkt? Dat gaat toch ook tegen jouw principe in, dat je minstens het aantal bits nodig hebt dat elke mogelijke combinatie kan representeren?

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 13:46:28 #242

BUG80

Stop making sense

Laat ik het dan nog eens anders formuleren.

Zolang niet alle mogelijke combinaties gemaakt kunnen worden binnen het bestaan van het heelal, heb je ook niet alle bits nodig die dat kunnen representeren.

Stel dat er uiteindelijk in de hele geschiedenis maar vier films gemaakt worden:

0001
1010
1111
1010

Om deze ongecomprimeerd op te slaan heb je 4 bits nodig. Echter, er is vast wel een algoritme te verzinnen waarmee deze reeksen in maar 2 bits op te slaan zijn (want: er zijn maar 4 mogelijke films gemaakt).

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 14:19:19 #243

DirtyHarry

Poehé :P

quote:
Op dinsdag 26 juli 2005 13:46 schreef BUG80 het volgende:
Laat ik het dan nog eens anders formuleren.

Zolang niet alle mogelijke combinaties gemaakt kunnen worden binnen het bestaan van het heelal, heb je ook niet alle bits nodig die dat kunnen representeren.

Stel dat er uiteindelijk in de hele geschiedenis maar vier films gemaakt worden:

0001
1010
1111
1010

Om deze ongecomprimeerd op te slaan heb je 4 bits nodig. Echter, er is vast wel een algoritme te verzinnen waarmee deze reeksen in maar 2 bits op te slaan zijn (want: er zijn maar 4 mogelijke films gemaakt).

Ja ok dat klopt

Alle mogelijke films zullen kwa aantal makkelijk in die 128 kilobyte passen. Maar dan moet je op de een of andere manier dat algoritme wijs maken welke combinaties niet bestaan en welke wel. En dat lijkt me praktisch gezien vrij lastig

dinsdag 26 juli 2005 @ 14:20:44 #244

BUG80

Stop making sense

quote:
Op dinsdag 26 juli 2005 14:19 schreef DirtyHarry het volgende:

[..]

Ja ok dat klopt Alle mogelijke films zullen kwa aantal makkelijk in die 128 kilobyte passen. Maar dan moet je op de een of andere manier dat algoritme wijs maken welke combinaties niet bestaan en welke wel. En dat lijkt me praktisch gezien vrij lastig

Inderdaad, zoniet onmogelijk. Dat betekent dat hij één of ander patroon had moeten vinden dat voor alle films geldt.

Ik ben het dus met je eens hoor, ik geloof er niet in, maar wiskundig bewijzen dat het onmogelijk is gaat niet volgens mij.

Mijn mixtape: labtones.com/listener/JSP

dinsdag 26 juli 2005 @ 16:11:13 #245

ACT-F

Onmeunige gaspedoal emmer

quote:
Op dinsdag 26 juli 2005 11:11 schreef DirtyHarry het volgende:

[..]

Er is daarna al gezegd dat dat komt omdat er enorm veel lossy compressie is om een film naar 700MB te comprimeren. De clue is volgens mij nog altijd dat sloot beweerde het verliesloos te kunnen.
[..]

Het aantal mogelijke films is zo ontzettend veel groter dan het aantal mogelijke permutaties dat je kunt maken met die 32768 bits. Niet dat er zoveel films zullen worden gemaakt, maar in principe zouden alle mogelijke films die kunnen worden gemaakt met zijn algoritme in zo'n sleutel moeten passen. Nou dat past dus never nooit niet.

Compressie is eigenlijk het verkeerde woord, je noteert de getallen op een andere manier en het is van toepassing op elke bitstroom. Meer zeg ik niet

Bekijk de webcam via UStream. Luister naar Gutter FM

dinsdag 26 juli 2005 @ 16:22:07 #246

BUG80

Stop making sense

Ik heb het eerste deel van de Netwerk uitzending inmiddels gezien. Jammer dat ze geen sceptici aan het woord laten, het is wel erg eenzijdig zo.

Ik vraag me trouwens al een tijdje af waarom deze vermeende techniek alleen op films werd toegepast door Sloot.

1) Was het een algoritme dat optimaal of alleen maar voor films werkt?
2) Is het omdat dat makkelijker te demonstreren valt (spreekt tot de verbeelding)?
3) Is het omdat je dan makkelijker mensen kan bedriegen? (als je "gewone" of willekeurige bestanden gebruikt, zullen mensen als snel vragen of je ook andere bestande wilt proberen)

Mijn mixtape: labtones.com/listener/JSP

donderdag 28 juli 2005 @ 21:28:05 #247

Doderok

quote:
Op dinsdag 26 juli 2005 11:23 schreef BUG80 het volgende:
Oja, nog een kleine toevoeging. Met jouw bewijs kun je ook aantonen dat je met WinZip nooit een bestand kunt verkleinen.

Immers, met 1024 bits kun je 2^1024 mogelijke bestanden maken, dat kun je dus nooit verkleinen naar 512 bits, bijvoorbeeld.

Snap je nu mijn probleem met jouw verhaal?

Er is een verschil tussen nooit een bestand kunnen verkleinen = geen enkel bestand kunnen verkleinen, en niet alle bestanden kunnen verkleinen.
Als je een bestand neemt van bvb 2000 bits, en winzip comprimeert dit tot een bestand van 1024 bits, dan zal winzip dat bestand van 1024 bits niet meer kunnen comprimeren.
Tekstbestanden bijvoorbeeld comprimeren goed omdat tekst veel redundantie bevat.

Nu lijkt het misschien dat je de toch winst maakt met winzip over het totaal van de 2^1024 mogelijke files, omdat je een deel kleiner kunt maken. MAAR: er zullen ook files groter worden!!

vb: ik heb een bitmap X gecromprimeerd met winzip, het resultaat is een file Y van 1.325.093 bytes.
Nu ga ik deze file nog eens comprimeren, resultaat:file Z van 1.325.300 bytes
Waarom is deze file groter geworden? Winzip kan hem niet verder comprimeren, maar hij kan hem ook niet onveranderd laten, want als ik hem dan zou unzippen zou ik de oorspronkelijke bitmap X terugkrijgen en niet file Y.

Nu is winzip niet geoptimaliseerd voor het verwerken van reeds gecomprimeerde files, men zou het algoritme kunnen aanpassen zodat files hoogstens 1 bit groter kunnen worden. Die ene bit zou dan aangeven of het bestand gecomprimeerd is, of het origineel bevat. Blijkt compressie het bestand groter te maken,dan voeg je enkel deze bit toe aan het bestand (je zet een 0 ervoor), in het andere geval zet je een 1 voor het resultaat. Merk op dat hierdoor alle gecomprimeerde bestanden een bit groter worden.

Uiteindelijk, als je alle mogelijke files van 1024 bits comprimeert, dus 1024 * 2^1024 bits aan data, dan zal je als resultaat opnieuw 1024 * 2^1024 bits aan data krijgen. De compressie van een deel van de bestanden wordt gecompenseerd door de extra bit die een ander deel van de bestanden krijgen. (in werkelikheid zal je meer data krijgen dan waar je mee begonnen zijn, omdat winzip oa een CRC waarde toevoegd)

donderdag 28 juli 2005 @ 21:48:49 #248

Doderok

quote:
Op dinsdag 26 juli 2005 13:46 schreef BUG80 het volgende:
Laat ik het dan nog eens anders formuleren.

Zolang niet alle mogelijke combinaties gemaakt kunnen worden binnen het bestaan van het heelal, heb je ook niet alle bits nodig die dat kunnen representeren.

Stel dat er uiteindelijk in de hele geschiedenis maar vier films gemaakt worden:

0001
1010
1111
1010

Om deze ongecomprimeerd op te slaan heb je 4 bits nodig. Echter, er is vast wel een algoritme te verzinnen waarmee deze reeksen in maar 2 bits op te slaan zijn (want: er zijn maar 4 mogelijke films gemaakt).

Als er maar 4 films gemaakt zijn heb je inderdaad maar twee bits nodig om ze op te slaan, ongeacht de grootte van de films. Dit algoritme is eenvoudig, MAAR het data-gedeelte moet de volledige films bevatten!

Als je een compressie-algoritme ontwerpt voor een bepaald type files, dan kan je de compressie verhogen door het algoritme meer data te geven. Voor nederlandse teksten kan je bijv. heel de nederlandse woordenlijst gebruiken, en de woorden volgens een frequentietabel te nummeren. vb: de=001 een=010 het=011 met=1000 van=1001 op=1010 enzovoort. Je bekijkt een hoop texten om de frequentie van elk woord te bepalen, en dan geef je elk woord een unieke code, hoe frequenter het woord voorkomt, hoe korter de code.

Deze methode zal niet werken als je bestanden met willekeurige letterreeksen wil comprimeren, omdat elke combinatie van een gegeven aantal letters even vaak zal voorkomen.

donderdag 28 juli 2005 @ 21:56:00 #249

BUG80

Stop making sense

quote:
Op donderdag 28 juli 2005 21:48 schreef Doderok het volgende:
Deze methode zal niet werken als je bestanden met willekeurige letterreeksen wil comprimeren, omdat elke combinatie van een gegeven aantal letters even vaak zal voorkomen.

Klopt, helemaal mee eens, net als je theorie over WinZip in je andere reactie.

Maar stel nou dat films, net als tekst, geen willekeurige tekenreeksen zijn en daadwerkelijk een bepaalde "magische" redundantie bevatten die toch in één algoritme te vangen is.

Het is allemaal hypothetisch, dat is waar. Nogmaals, het enige dat ik probeer aan te tonen, is dat het in mijn ogen niet *wiskundig* te bewijzen is dat de compressie van Sloot onmogelijk is, ook al is het intuitief nog zo onwaarschijnlijk.

Mijn mixtape: labtones.com/listener/JSP

donderdag 28 juli 2005 @ 23:56:26 #250

gnomaat

quote:
Op dinsdag 26 juli 2005 16:11 schreef ACT-F het volgende:
Compressie is eigenlijk het verkeerde woord, je noteert de getallen op een andere manier en het is van toepassing op elke bitstroom. Meer zeg ik niet

Je hoeft geen verdere details te verklappen, maar het klinkt alsof je iets essentieels over het hoofd ziet. Even om duidelijk te krijgen waar we het over hebben:

- een manier om meer data in dezelfde hoeveelheid bits te kunnen vastleggen, dus dat je bijvoorbeeld een film die uncompressed 150 GB is, kwijt kunt op een flash kaartje van 128 MB? (of zelfs nog kleiner)

- of een manier om fysiek gezien efficiënter data op te slaan, dus een één of ander zelfbedacht opslagmedium met een hogere datadichtheid (meer bits/cm²) dan de huidige harddisks/dvd's/enz ?

Is het lossy of lossless?

En werkt het alleen voor bepaalde soorten data, bijvoorbeeld audiovisuele data (zoals films), of ook voor random data?

Is de methode ook van toepassing op zichzelf? M.a.w. kun je de kleinere bitstream die je volgens jouw idee krijgt (als het resultaat weer een bitstream is althans) zelf ook weer als een normale bitstream interpreteren en die op dezelfde manier "anders noteren"? Zodat je dus dubbele winst krijgt.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 29 juli 2005 @ 08:41:30 #251

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op donderdag 28 juli 2005 21:56 schreef BUG80 het volgende:

Het is allemaal hypothetisch, dat is waar. Nogmaals, het enige dat ik probeer aan te tonen, is dat het in mijn ogen niet *wiskundig* te bewijzen is dat de compressie van Sloot onmogelijk is, ook al is het intuitief nog zo onwaarschijnlijk.

Lees de vorige topics eens door.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 09:50:30 #252

Barati

quote:
Op donderdag 28 juli 2005 21:56 schreef BUG80 het volgende:

[..]

Klopt, helemaal mee eens, net als je theorie over WinZip in je andere reactie.

Maar stel nou dat films, net als tekst, geen willekeurige tekenreeksen zijn en daadwerkelijk een bepaalde "magische" redundantie bevatten die toch in één algoritme te vangen is.

Het is allemaal hypothetisch, dat is waar. Nogmaals, het enige dat ik probeer aan te tonen, is dat het in mijn ogen niet *wiskundig* te bewijzen is dat de compressie van Sloot onmogelijk is, ook al is het intuitief nog zo onwaarschijnlijk.

Het is gemakkelijk in te zien dat de verzameling mogelijke films groter is dan de verzameling "sleutels" van 64 kB. Je kunt (in theorie) bijvoorbeeld alle mogelijke reeksen van 65 kB op papier uitschrijven en van iedere reeks een film maken. Of iedere mogelijk plaatje genereren met een resolutie van 1000x1000 en van iedere plaatje een film maken. Met een sleutelgrootte van 64 kB worden verschillende films in deze voorbeelden op dezelfde sleutel afgebeeld.

quote:
Theorem:
No program can compress without loss *all* files of size >= N bits, for
any given integer N >= 0.

Proof:
Assume that the program can compress without loss all files of size >= N
bits. Compress with this program all the 2^N files which have exactly N
bits. All compressed files have at most N-1 bits, so there are at most
(2^N)-1 different compressed files [2^(N-1) files of size N-1, 2^(N-2) of
size N-2, and so on, down to 1 file of size 0]. So at least two different
input files must compress to the same output file. Hence the compression
program cannot be lossless.
[...]
Note that no assumption is made about the compression algorithm. The proof applies to
*any* algorithm, including those using an external dictionary, or repeated
application of another algorithm, or combination of different algorithms, or
representation of the data as formulas, etc... All schemes are subject to the
counting argument. There is no need to use information theory to provide a
proof, just very basic mathematics.

(bron)

vrijdag 29 juli 2005 @ 10:16:49 #253

XoxIx

The Librarian

quote:
Op donderdag 28 juli 2005 21:56 schreef BUG80 het volgende:
[..]
Maar stel nou dat films, net als tekst, geen willekeurige tekenreeksen zijn en daadwerkelijk een bepaalde "magische" redundantie bevatten die toch in één algoritme te vangen is.

Tekst is vooral niet willekeurig omdat het vooral afhankelijk is van ongeveer 50 tekens (letters, cijfers en speciale tekens), terwijl er in een byte 256 kunnen worden gerepresenteerd. Films bestaan inderdaad al uit een heleboel redundantie, daarom kun je een enorme film met DivX of een gelijkwaardig compressie-algoritme al behoorlijk verkleinen. De ongeloofwaardigheid komt niet voort uit het kunnen comprimeren van films, maar het hebben van een chipknip met daarop 32 volledige films.

vrijdag 29 juli 2005 @ 10:41:36 #254

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 09:50 schreef Barati het volgende:

[..]

Het is gemakkelijk in te zien dat de verzameling mogelijke films groter is dan de verzameling "sleutels" van 64 kB. Je kunt (in theorie) bijvoorbeeld alle mogelijke reeksen van 65 kB op papier uitschrijven en van iedere reeks een film maken. Of iedere mogelijk plaatje genereren met een resolutie van 1000x1000 en van iedere plaatje een film maken. Met een sleutelgrootte van 64 kB worden verschillende films in deze voorbeelden op dezelfde sleutel afgebeeld.
[..]

(bron)

Ja dat klopt.

Maar. Er zijn zeker reeksen te verzinnen die zeker niet voor zullen komen, of onwaarschijnlijk. Bijvoorbeeld: films met alleen maar zwarte frames, of films die voor 50% uit ruis bestaan. Of films waarin in elk frame het complete mogelijke kleurenpallet voorkomt. En zo kun je nog wel even doorgaan. Het zou kunnen, dat het algoritme van Sloot "normale" films verkleint en "onwaarschijnlijke" films vergroot, net als WinZip.

Ergens moet er een ondergrens zijn van wat mogelijk is qua compressie van films en die ligt niet bij 80 GigaByte, lijkt me.

Ik kan het niet vaak genoeg zeggen: ik geloof er ook niet in. En als Sloot had gezegd dat zijn algoritme werkt op alle mogelijke bestanden viel dat ook wiskundig te bewijzen.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 10:53:22 #255

BUG80

Stop making sense

Ik kan het ook anders formuleren:

Je zou een random generator een film kunnen laten generen. Laat de generator 1,5 uur * 3600 sec * 25 frames * (720 * 480) pixels * 24 bits per pixel uitrekenen.

Hoe groot is de kans dat hier een film uitkomt die ook echt kijkbaar is? Ik denk verwaarloosbaar klein.

Kortom, kennelijk voldoet de data in films aan bepaalde conventies / patronen.

[edit]
Als je die generator alle mogelijke films van 1,5 uur zou laten berekenen (een onmogelijke klus, maar goed), dan zou je na afloop 99,999999999999999999..% weg kunnen gooien als zijnde waardeloos. Misschien is Sloot's algoritme daarop gebaseerd.
[/edit]

[ Bericht 10% gewijzigd door BUG80 op 29-07-2005 10:58:41 ]

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:20:35 #256

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 10:53 schreef BUG80 het volgende:
Ik kan het ook anders formuleren:

Je zou een random generator een film kunnen laten generen. Laat de generator 1,5 uur * 3600 sec * 25 frames * (720 * 480) pixels * 24 bits per pixel uitrekenen.

Hoe groot is de kans dat hier een film uitkomt die ook echt kijkbaar is? Ik denk verwaarloosbaar klein.

Kortom, kennelijk voldoet de data in films aan bepaalde conventies / patronen.

[edit]
Als je die generator alle mogelijke films van 1,5 uur zou laten berekenen (een onmogelijke klus, maar goed), dan zou je na afloop 99,999999999999999999..% weg kunnen gooien als zijnde waardeloos. Misschien is Sloot's algoritme daarop gebaseerd.
[/edit]

Nee, das volledige onzin.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 11:25:59 #257

Barati

quote:
Op vrijdag 29 juli 2005 10:41 schreef BUG80 het volgende:

[..]

Ja dat klopt.

Maar. Er zijn zeker reeksen te verzinnen die zeker niet voor zullen komen, of onwaarschijnlijk. Bijvoorbeeld: films met alleen maar zwarte frames, of films die voor 50% uit ruis bestaan. Of films waarin in elk frame het complete mogelijke kleurenpallet voorkomt. En zo kun je nog wel even doorgaan. Het zou kunnen, dat het algoritme van Sloot "normale" films verkleint en "onwaarschijnlijke" films vergroot, net als WinZip.

Dit kan ook niet anders. Zie bewijs hierboven.

quote:
Ergens moet er een ondergrens zijn van wat mogelijk is qua compressie van films en die ligt niet bij 80 GigaByte, lijkt me.

Ik kan het niet vaak genoeg zeggen: ik geloof er ook niet in. En als Sloot had gezegd dat zijn algoritme werkt op alle mogelijke bestanden viel dat ook wiskundig te bewijzen.

Sloot beweerde dat een film ongeacht de lengte verkleind kon worden tot een sleutel van 64 kB.

vrijdag 29 juli 2005 @ 11:26:27 #258

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:20 schreef Pietverdriet het volgende:

[..]

Nee, das volledige onzin.

Kun je ook uitleggen waarom?

Laten we zeggen dat voor een complete ongecomprimeerde film 80 GB nodig is. Ik durf te wedden dat elke film kleiner te maken is dan dat.

Kun jij dan bewijzen waar de ondergrens dan wel ligt?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:28:22 #259

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:26 schreef BUG80 het volgende:

[..]

Kun je ook uitleggen waarom?

Het genereren van random films en dan bijna alles weggooien is volledige onzin, dat hoef ik je toch niet uit te leggen, wel?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 11:34:23 #260

Barati

quote:
Op vrijdag 29 juli 2005 11:26 schreef BUG80 het volgende:

[..]

Kun je ook uitleggen waarom?

Laten we zeggen dat voor een complete ongecomprimeerde film 80 GB nodig is. Ik durf te wedden dat elke film kleiner te maken is dan dat.

Kun jij dan bewijzen waar de ondergrens dan wel ligt?

We moeten eerst afspreken wat we bedoelen met een film. Als iedere mogelijke bitstring in aanmerking komt bestaat er geen algoritme dat iedere film lossless verkleint.
Als je slecht specifieke bitstrings wilt rekenen tot de verzameling films dan zult je precies moeten definiëren welke dit zijn.

vrijdag 29 juli 2005 @ 11:34:40 #261

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:28 schreef Pietverdriet het volgende:

[..]

Het genereren van random films en dan bijna alles weggooien is volledige onzin, dat hoef ik je toch niet uit te leggen, wel?

Ik gebruikte dit gedachtenexperiment om aan te geven dat er kennelijk reeksen zijn te verzinnen die onwaarschijnlijk zijn, net als dat WinZip gebruik maakt van het feit dat er een hele hoop teksten zijn die onwaarschijnlijk zijn. Waar ga ik de fout in?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:36:00 #262

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:34 schreef Barati het volgende:
Als je slecht specifieke bitstrings wilt rekenen tot de verzameling films dan zult je precies moeten definiëren welke dit zijn.

Dat is precies wat ik bedoel! En wie gaat er bewijzen dat het niet mogelijk is om te voorspellen welke bitstrings wel en niet waarschijnlijk zijn?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:46:09 #263

XoxIx

The Librarian

quote:
Op vrijdag 29 juli 2005 10:53 schreef BUG80 het volgende:
Ik kan het ook anders formuleren:

Je zou een random generator een film kunnen laten generen. Laat de generator 1,5 uur * 3600 sec * 25 frames * (720 * 480) pixels * 24 bits per pixel uitrekenen.

Hoe groot is de kans dat hier een film uitkomt die ook echt kijkbaar is? Ik denk verwaarloosbaar klein.

Kortom, kennelijk voldoet de data in films aan bepaalde conventies / patronen.

[edit]
Als je die generator alle mogelijke films van 1,5 uur zou laten berekenen (een onmogelijke klus, maar goed), dan zou je na afloop 99,999999999999999999..% weg kunnen gooien als zijnde waardeloos. Misschien is Sloot's algoritme daarop gebaseerd.
[/edit]

Er zijn een enorme hoeveelheid films "kijkbaar". Neem een willekeurige film. Alleen al door films in verschillende talen na te synchroniseren en/of te ondertitelen groeit het al enorm. Daarnaast kun je alle mogelijke scenes toevoegen en weglaten of kleding, cast, bewoording, geluidseffecten en/of muziek aanpassen in elke wilekeurige combinatie. Zoals al eerder is opgemerkt is het aantal variaties op een enkele film al bijna eindeloos.

vrijdag 29 juli 2005 @ 11:49:19 #264

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:46 schreef XoxIx het volgende:

[..]

Er zijn een enorme hoeveelheid films "kijkbaar". Neem een willekeurige film. Alleen al door films in verschillende talen na te synchroniseren en/of te ondertitelen groeit het al enorm. Daarnaast kun je alle mogelijke scenes toevoegen en weglaten of kleding, cast, bewoording, geluidseffecten en/of muziek aanpassen in elke wilekeurige combinatie. Zoals al eerder is opgemerkt is het aantal variaties op een enkele film al bijna eindeloos.

Zeker, maar draai het eens om: het aantal realisaties dat je kunt maken in 80 GB waar je niks aan hebt is nog veel groter.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:51:01 #265

XoxIx

The Librarian

quote:
Op vrijdag 29 juli 2005 11:49 schreef BUG80 het volgende:

[..]

Zeker, maar draai het eens om: het aantal realisaties dat je kunt maken in 80 GB waar je niks aan hebt is nog veel groter.

Dan draai ik het gewoon nog een keer om. Het aantal combinaties dat je kunt maken met 64 KB is veel kleiner.

vrijdag 29 juli 2005 @ 11:51:15 #266

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:49 schreef BUG80 het volgende:

[..]

Zeker, maar draai het eens om: het aantal realisaties dat je kunt maken in 80 GB waar je niks aan hebt is nog veel groter.

En?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 11:55:59 #267

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:51 schreef Pietverdriet het volgende:

[..]

En?

Ok voorbeeld: Neem een willekeurige film. Door eindeloos te variëren met acteurs, talen, scenes, enz kun je, zeg, 10¹⁰ verschillende versies maken.

Echter, door de film aan te passen zodat je er niks meer aan hebt, door bijvoorbeeld door elk 3e frame zwart te maken, of elk 4e, of de helft eruit te knippen, enz zijn er, zeg 10¹⁰⁰ versies te maken waar je niets aan hebt.

Net als met tekst, is het aantal films dat niet voor zal komen vele malen groter dan het aantal dat wel voor zal komen, dat is alles wat ik probeer te zeggen.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:57:30 #268

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:51 schreef XoxIx het volgende:

[..]

Dan draai ik het gewoon nog een keer om. Het aantal combinaties dat je kunt maken met 64 KB is veel kleiner.

Inderdaad, maar nog steeds zo goed als oneindig (2^(64*1024*8) is heel, heel groot). Dus waar ligt de ondergrens nou echt?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 12:00:44 #269

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:55 schreef BUG80 het volgende:

[..]

Ok voorbeeld: Neem een willekeurige film. Door eindeloos te variëren met acteurs, talen, scenes, enz kun je, zeg, 10¹⁰ verschillende versies maken.

Echter, door de film aan te passen zodat je er niks meer aan hebt, door bijvoorbeeld door elk 3e frame zwart te maken, of elk 4e, of de helft eruit te knippen, enz zijn er, zeg 10¹⁰⁰ versies te maken waar je niets aan hebt.

Net als met tekst, is het aantal films dat niet voor zal komen vele malen groter dan het aantal dat wel voor zal komen, dat is alles wat ik probeer te zeggen.

Ja, dat begrijp ik, maar wat heeft dat er mee te maken?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 12:04:45 #270

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 12:00 schreef Pietverdriet het volgende:

[..]

Ja, dat begrijp ik, maar wat heeft dat er mee te maken?

Ik probeer de link te leggen met het comprimeren van andere typen bestanden, zoals tekst. Zodra je aan kunt geven dat er realisaties zijn die waarschijnlijker zijn dan andere, kun je gemiddeld genomen compressie bereiken.

Hoe kleiner de groep waarschijnlijke realisaties, hoe groter de maximaal haalbare compressie.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 12:05:51 #271

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:57 schreef BUG80 het volgende:

[..]

Inderdaad, maar nog steeds zo goed als oneindig (2^(64*1024*8) is heel, heel groot). Dus waar ligt de ondergrens nou echt?

Welke ondergrens?
Waarom denk je dat ie hard zou zijn?
Als je een film als Patton op DVD (MPEG 2) zet van Film, heb je verlies, in oplossend vermogen, in kleur, etc.
Als je die MPEG 2 nog verder comprimeerd naar DIVX, XVID, MPEG4, MJPG whatever heb je nog meer verlies.
is je file dan 750 Mb is ie te groot voor een normale CD, ah, dan haal je wat resolutie weg, en dan past ie wel.
Zo kan je doorgaan, maar de kwaliteit wordt steeds minder.
Dus die ondergrens ligt daar waar je de minimale kwaliteit legt.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 12:08:00 #272

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 12:04 schreef BUG80 het volgende:

[..]

Ik probeer de link te leggen met het comprimeren van andere typen bestanden, zoals tekst. Zodra je aan kunt geven dat er realisaties zijn die waarschijnlijker zijn dan andere, kun je gemiddeld genomen compressie bereiken.

Hoe kleiner de groep waarschijnlijke realisaties, hoe groter de maximaal haalbare compressie.

Ja, maar wat is nu je punt wat je daar mee wilt zeggen? Dat is allang en uitvoerig behandeld in de vorige topics. Dat je een database kan nemen met de filmbouwsteentjes, en een sleutel die ze achter elkaar plakt.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 12:09:18 #273

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 12:05 schreef Pietverdriet het volgende:

[..]

Welke ondergrens?
Waarom denk je dat ie hard zou zijn?
Als je een film als Patton op DVD (MPEG 2) zet van Film, heb je verlies, in oplossend vermogen, in kleur, etc.
Als je die MPEG 2 nog verder comprimeerd naar DIVX, XVID, MPEG4, MJPG whatever heb je nog meer verlies.
is je file dan 750 Mb is ie te groot voor een normale CD, ah, dan haal je wat resolutie weg, en dan past ie wel.
Zo kan je doorgaan, maar de kwaliteit wordt steeds minder.
Dus die ondergrens ligt daar waar je de minimale kwaliteit legt.

Ja in het geval van lossy compressie. In het geval van lossless compressie ligt de ondergrens daar waar het uiteindelijke bestand minimale redundantie heeft.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 12:10:47 #274

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 12:08 schreef Pietverdriet het volgende:

[..]

Ja, maar wat is nu je punt wat je daar mee wilt zeggen? Dat is allang en uitvoerig behandeld in de vorige topics. Dat je een database kan nemen met de filmbouwsteentjes, en een sleutel die ze achter elkaar plakt.

Ok, mijn fout, ik zal het allemaal nog eens aandachtig gaan lezen. Ik probeer alleen aan te ontkrachten dat er een wiskundig bewijs zou zijn dat de onmogelijkheid aantoont van deze compressie.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 13:03:41 #275

Barati

quote:
Op vrijdag 29 juli 2005 12:10 schreef BUG80 het volgende:

[..]

Ok, mijn fout, ik zal het allemaal nog eens aandachtig gaan lezen. Ik probeer alleen aan te ontkrachten dat er een wiskundig bewijs zou zijn dat de onmogelijkheid aantoont van deze compressie.

Definieer nu eerst eens wat je bedoelt met een film. Dan kunnen we verder.

vrijdag 29 juli 2005 @ 13:07:44 #276

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 13:03 schreef Barati het volgende:

[..]

Definieer nu eerst eens wat je bedoelt met een film. Dan kunnen we verder.

Mijn definitie van film: één realisatie uit de verzameling mogelijke bitstrings van rond de 80 GB (klopt die grootte ongeveer) die bovendien kijkbaar is.

Met kijkbaar bedoel ik dat het om echte beelden gaat, geen ruis-achtige verschijnselen. Een wiskundige definitie van kijkbaar is een Nobelprijs waard denk ik.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 13:40:05 #277

gnomaat

quote:
Op vrijdag 29 juli 2005 09:50 schreef Barati het volgende:
Het is gemakkelijk in te zien dat de verzameling mogelijke films groter is dan de verzameling "sleutels" van 64 kB. Je kunt (in theorie) bijvoorbeeld alle mogelijke reeksen van 65 kB op papier uitschrijven en van iedere reeks een film maken.

Zelfs in theorie niet, want de hoeveelheid papiermoleculen die je daarvoor nodig hebt is veel groter dan het aantal deeltjes in het heelal (dat laatste wordt geloof ik geschat op 10⁸⁰).

In de praktijk is het aantal films dat er bestaat en ooit in de toekomst gemaakt kan worden, veel kleiner dan het aantal combinaties dat je in 64 KB (of ook al in 4 KB) kwijt kunt.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 29 juli 2005 @ 13:40:53 #278

gnomaat

quote:
Op vrijdag 29 juli 2005 13:07 schreef BUG80 het volgende:
Met kijkbaar bedoel ik dat het om echte beelden gaat, geen ruis-achtige verschijnselen. Een wiskundige definitie van kijkbaar is een Nobelprijs waard denk ik.

kijkbaar := comprimeerbaar tot +/- 700 MB

Birthdays are good for you: the more you have, the longer you live.

vrijdag 29 juli 2005 @ 13:44:14 #279

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 13:40 schreef gnomaat het volgende:

[..]

kijkbaar := comprimeerbaar tot +/- 700 MB

Met de huidige technieken, ja.

Ik kan trouwens een hoop niet-kijkbare films maken die comprimeerbaar zijn tot 700 MB, dus dat gaat ook niet helemaal op.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 14:14:13 #280

Barati

quote:
Op vrijdag 29 juli 2005 13:40 schreef gnomaat het volgende:

[..]

Zelfs in theorie niet, want de hoeveelheid papiermoleculen die je daarvoor nodig hebt is veel groter dan het aantal deeltjes in het heelal (dat laatste wordt geloof ik geschat op 10⁸⁰).

In de praktijk is het aantal films dat er bestaat en ooit in de toekomst gemaakt kan worden, veel kleiner dan het aantal combinaties dat je in 64 KB (of ook al in 4 KB) kwijt kunt.

Vandaar mijn toevoeging "in theorie". Ik denk dat je mijn voorbeeld met het papier wel begrijpt...
De verzameling van mogelijke films is vele male groter dan het aantal combinaties die je kunt maken met 64 kB. Het is irrelevant of die films ook allemaal tegelijkertijd zouden kunnen bestaan.
Het is simpel om een programma te schrijven dat b.v. 2^1000000 unieke "kijkbare" films kan genereren (d.w.z. een zo'n film uit deze verzameling genereert).

[ Bericht 1% gewijzigd door Barati op 29-07-2005 14:19:59 ]

vrijdag 29 juli 2005 @ 14:19:47 #281

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 14:14 schreef Barati het volgende:
Het is simpel om een programma te schrijven dat b.v. 2^1000000 unieke "kijkbare" films kan genereren (d.w.z. een zo'n film uit deze verzameling genereert).

Ja, daar heb jij weer een punt. Je zou van een film willekeurig beeldjes kunnen spiegelen, inverteren, enz en dan heb je zo veel meer realisaties. De vraag is: zijn al deze realisaties waarschijnlijk (intuitief zeg je van niet: je gaat niet naar een film zitten kijken waarin willekeurige beeldjes zijn gespiegeld). Een algoritme wat de waarschijnlijkheid van deze realisaties in acht neemt is waarschijnlijk niet te schrijven. In de praktijk, althans.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 14:35:11 #282

Barati

quote:
Op vrijdag 29 juli 2005 14:19 schreef BUG80 het volgende:

[..]

Ja, daar heb jij weer een punt. Je zou van een film willekeurig beeldjes kunnen spiegelen, inverteren, enz en dan heb je zo veel meer realisaties. De vraag is: zijn al deze realisaties waarschijnlijk (intuitief zeg je van niet: je gaat niet naar een film zitten kijken waarin willekeurige beeldjes zijn gespiegeld). Een algoritme wat de waarschijnlijkheid van deze realisaties in acht neemt is waarschijnlijk niet te schrijven. In de praktijk, althans.

Neem een film met een tijdsduur van 1 uur. Deze bevat 24 * 60 * 60 = 86400 beelden. In ieder beeld zou je één pixel iets kunnen wijzigen (het minst significante bit van deze pixel bijvoorbeeld). Het aantal mogelijke gewijzigde films is hiermee groter dan 2^64k. Als het origineel kijkbaar is dan zijn deze gewijzigde films dat ook (bij een kleurendiepte van 24 bit zul je geen verschil merken tussen het origineel en de gewijzigde film)

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

mega-compressie - deel 2 -

» wetenschap, filosofie, levensbeschouwing

» wetenschap, filosofie, levensbeschouwing