mega-compressie - deel 2 - | Wetenschap, Filosofie, Levensbeschouwing (WFL)

vrijdag 29 juli 2005 @ 08:41:30 #251

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op donderdag 28 juli 2005 21:56 schreef BUG80 het volgende:

Het is allemaal hypothetisch, dat is waar. Nogmaals, het enige dat ik probeer aan te tonen, is dat het in mijn ogen niet *wiskundig* te bewijzen is dat de compressie van Sloot onmogelijk is, ook al is het intuitief nog zo onwaarschijnlijk.

Lees de vorige topics eens door.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 09:50:30 #252

Barati

quote:
Op donderdag 28 juli 2005 21:56 schreef BUG80 het volgende:

[..]

Klopt, helemaal mee eens, net als je theorie over WinZip in je andere reactie.

Maar stel nou dat films, net als tekst, geen willekeurige tekenreeksen zijn en daadwerkelijk een bepaalde "magische" redundantie bevatten die toch in één algoritme te vangen is.

Het is allemaal hypothetisch, dat is waar. Nogmaals, het enige dat ik probeer aan te tonen, is dat het in mijn ogen niet *wiskundig* te bewijzen is dat de compressie van Sloot onmogelijk is, ook al is het intuitief nog zo onwaarschijnlijk.

Het is gemakkelijk in te zien dat de verzameling mogelijke films groter is dan de verzameling "sleutels" van 64 kB. Je kunt (in theorie) bijvoorbeeld alle mogelijke reeksen van 65 kB op papier uitschrijven en van iedere reeks een film maken. Of iedere mogelijk plaatje genereren met een resolutie van 1000x1000 en van iedere plaatje een film maken. Met een sleutelgrootte van 64 kB worden verschillende films in deze voorbeelden op dezelfde sleutel afgebeeld.

quote:
Theorem:
No program can compress without loss *all* files of size >= N bits, for
any given integer N >= 0.

Proof:
Assume that the program can compress without loss all files of size >= N
bits. Compress with this program all the 2^N files which have exactly N
bits. All compressed files have at most N-1 bits, so there are at most
(2^N)-1 different compressed files [2^(N-1) files of size N-1, 2^(N-2) of
size N-2, and so on, down to 1 file of size 0]. So at least two different
input files must compress to the same output file. Hence the compression
program cannot be lossless.
[...]
Note that no assumption is made about the compression algorithm. The proof applies to
*any* algorithm, including those using an external dictionary, or repeated
application of another algorithm, or combination of different algorithms, or
representation of the data as formulas, etc... All schemes are subject to the
counting argument. There is no need to use information theory to provide a
proof, just very basic mathematics.

(bron)

vrijdag 29 juli 2005 @ 10:16:49 #253

XoxIx

The Librarian

quote:
Op donderdag 28 juli 2005 21:56 schreef BUG80 het volgende:
[..]
Maar stel nou dat films, net als tekst, geen willekeurige tekenreeksen zijn en daadwerkelijk een bepaalde "magische" redundantie bevatten die toch in één algoritme te vangen is.

Tekst is vooral niet willekeurig omdat het vooral afhankelijk is van ongeveer 50 tekens (letters, cijfers en speciale tekens), terwijl er in een byte 256 kunnen worden gerepresenteerd. Films bestaan inderdaad al uit een heleboel redundantie, daarom kun je een enorme film met DivX of een gelijkwaardig compressie-algoritme al behoorlijk verkleinen. De ongeloofwaardigheid komt niet voort uit het kunnen comprimeren van films, maar het hebben van een chipknip met daarop 32 volledige films.

vrijdag 29 juli 2005 @ 10:41:36 #254

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 09:50 schreef Barati het volgende:

[..]

Het is gemakkelijk in te zien dat de verzameling mogelijke films groter is dan de verzameling "sleutels" van 64 kB. Je kunt (in theorie) bijvoorbeeld alle mogelijke reeksen van 65 kB op papier uitschrijven en van iedere reeks een film maken. Of iedere mogelijk plaatje genereren met een resolutie van 1000x1000 en van iedere plaatje een film maken. Met een sleutelgrootte van 64 kB worden verschillende films in deze voorbeelden op dezelfde sleutel afgebeeld.
[..]

(bron)

Ja dat klopt.

Maar. Er zijn zeker reeksen te verzinnen die zeker niet voor zullen komen, of onwaarschijnlijk. Bijvoorbeeld: films met alleen maar zwarte frames, of films die voor 50% uit ruis bestaan. Of films waarin in elk frame het complete mogelijke kleurenpallet voorkomt. En zo kun je nog wel even doorgaan. Het zou kunnen, dat het algoritme van Sloot "normale" films verkleint en "onwaarschijnlijke" films vergroot, net als WinZip.

Ergens moet er een ondergrens zijn van wat mogelijk is qua compressie van films en die ligt niet bij 80 GigaByte, lijkt me.

Ik kan het niet vaak genoeg zeggen: ik geloof er ook niet in. En als Sloot had gezegd dat zijn algoritme werkt op alle mogelijke bestanden viel dat ook wiskundig te bewijzen.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 10:53:22 #255

BUG80

Stop making sense

Ik kan het ook anders formuleren:

Je zou een random generator een film kunnen laten generen. Laat de generator 1,5 uur * 3600 sec * 25 frames * (720 * 480) pixels * 24 bits per pixel uitrekenen.

Hoe groot is de kans dat hier een film uitkomt die ook echt kijkbaar is? Ik denk verwaarloosbaar klein.

Kortom, kennelijk voldoet de data in films aan bepaalde conventies / patronen.

[edit]
Als je die generator alle mogelijke films van 1,5 uur zou laten berekenen (een onmogelijke klus, maar goed), dan zou je na afloop 99,999999999999999999..% weg kunnen gooien als zijnde waardeloos. Misschien is Sloot's algoritme daarop gebaseerd.
[/edit]

[ Bericht 10% gewijzigd door BUG80 op 29-07-2005 10:58:41 ]

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:20:35 #256

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 10:53 schreef BUG80 het volgende:
Ik kan het ook anders formuleren:

Je zou een random generator een film kunnen laten generen. Laat de generator 1,5 uur * 3600 sec * 25 frames * (720 * 480) pixels * 24 bits per pixel uitrekenen.

Hoe groot is de kans dat hier een film uitkomt die ook echt kijkbaar is? Ik denk verwaarloosbaar klein.

Kortom, kennelijk voldoet de data in films aan bepaalde conventies / patronen.

[edit]
Als je die generator alle mogelijke films van 1,5 uur zou laten berekenen (een onmogelijke klus, maar goed), dan zou je na afloop 99,999999999999999999..% weg kunnen gooien als zijnde waardeloos. Misschien is Sloot's algoritme daarop gebaseerd.
[/edit]

Nee, das volledige onzin.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 11:25:59 #257

Barati

quote:
Op vrijdag 29 juli 2005 10:41 schreef BUG80 het volgende:

[..]

Ja dat klopt.

Maar. Er zijn zeker reeksen te verzinnen die zeker niet voor zullen komen, of onwaarschijnlijk. Bijvoorbeeld: films met alleen maar zwarte frames, of films die voor 50% uit ruis bestaan. Of films waarin in elk frame het complete mogelijke kleurenpallet voorkomt. En zo kun je nog wel even doorgaan. Het zou kunnen, dat het algoritme van Sloot "normale" films verkleint en "onwaarschijnlijke" films vergroot, net als WinZip.

Dit kan ook niet anders. Zie bewijs hierboven.

quote:
Ergens moet er een ondergrens zijn van wat mogelijk is qua compressie van films en die ligt niet bij 80 GigaByte, lijkt me.

Ik kan het niet vaak genoeg zeggen: ik geloof er ook niet in. En als Sloot had gezegd dat zijn algoritme werkt op alle mogelijke bestanden viel dat ook wiskundig te bewijzen.

Sloot beweerde dat een film ongeacht de lengte verkleind kon worden tot een sleutel van 64 kB.

vrijdag 29 juli 2005 @ 11:26:27 #258

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:20 schreef Pietverdriet het volgende:

[..]

Nee, das volledige onzin.

Kun je ook uitleggen waarom?

Laten we zeggen dat voor een complete ongecomprimeerde film 80 GB nodig is. Ik durf te wedden dat elke film kleiner te maken is dan dat.

Kun jij dan bewijzen waar de ondergrens dan wel ligt?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:28:22 #259

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:26 schreef BUG80 het volgende:

[..]

Kun je ook uitleggen waarom?

Het genereren van random films en dan bijna alles weggooien is volledige onzin, dat hoef ik je toch niet uit te leggen, wel?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 11:34:23 #260

Barati

quote:
Op vrijdag 29 juli 2005 11:26 schreef BUG80 het volgende:

[..]

Kun je ook uitleggen waarom?

Laten we zeggen dat voor een complete ongecomprimeerde film 80 GB nodig is. Ik durf te wedden dat elke film kleiner te maken is dan dat.

Kun jij dan bewijzen waar de ondergrens dan wel ligt?

We moeten eerst afspreken wat we bedoelen met een film. Als iedere mogelijke bitstring in aanmerking komt bestaat er geen algoritme dat iedere film lossless verkleint.
Als je slecht specifieke bitstrings wilt rekenen tot de verzameling films dan zult je precies moeten definiëren welke dit zijn.

vrijdag 29 juli 2005 @ 11:34:40 #261

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:28 schreef Pietverdriet het volgende:

[..]

Het genereren van random films en dan bijna alles weggooien is volledige onzin, dat hoef ik je toch niet uit te leggen, wel?

Ik gebruikte dit gedachtenexperiment om aan te geven dat er kennelijk reeksen zijn te verzinnen die onwaarschijnlijk zijn, net als dat WinZip gebruik maakt van het feit dat er een hele hoop teksten zijn die onwaarschijnlijk zijn. Waar ga ik de fout in?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:36:00 #262

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:34 schreef Barati het volgende:
Als je slecht specifieke bitstrings wilt rekenen tot de verzameling films dan zult je precies moeten definiëren welke dit zijn.

Dat is precies wat ik bedoel! En wie gaat er bewijzen dat het niet mogelijk is om te voorspellen welke bitstrings wel en niet waarschijnlijk zijn?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:46:09 #263

XoxIx

The Librarian

quote:
Op vrijdag 29 juli 2005 10:53 schreef BUG80 het volgende:
Ik kan het ook anders formuleren:

Je zou een random generator een film kunnen laten generen. Laat de generator 1,5 uur * 3600 sec * 25 frames * (720 * 480) pixels * 24 bits per pixel uitrekenen.

Hoe groot is de kans dat hier een film uitkomt die ook echt kijkbaar is? Ik denk verwaarloosbaar klein.

Kortom, kennelijk voldoet de data in films aan bepaalde conventies / patronen.

[edit]
Als je die generator alle mogelijke films van 1,5 uur zou laten berekenen (een onmogelijke klus, maar goed), dan zou je na afloop 99,999999999999999999..% weg kunnen gooien als zijnde waardeloos. Misschien is Sloot's algoritme daarop gebaseerd.
[/edit]

Er zijn een enorme hoeveelheid films "kijkbaar". Neem een willekeurige film. Alleen al door films in verschillende talen na te synchroniseren en/of te ondertitelen groeit het al enorm. Daarnaast kun je alle mogelijke scenes toevoegen en weglaten of kleding, cast, bewoording, geluidseffecten en/of muziek aanpassen in elke wilekeurige combinatie. Zoals al eerder is opgemerkt is het aantal variaties op een enkele film al bijna eindeloos.

vrijdag 29 juli 2005 @ 11:49:19 #264

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:46 schreef XoxIx het volgende:

[..]

Er zijn een enorme hoeveelheid films "kijkbaar". Neem een willekeurige film. Alleen al door films in verschillende talen na te synchroniseren en/of te ondertitelen groeit het al enorm. Daarnaast kun je alle mogelijke scenes toevoegen en weglaten of kleding, cast, bewoording, geluidseffecten en/of muziek aanpassen in elke wilekeurige combinatie. Zoals al eerder is opgemerkt is het aantal variaties op een enkele film al bijna eindeloos.

Zeker, maar draai het eens om: het aantal realisaties dat je kunt maken in 80 GB waar je niks aan hebt is nog veel groter.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:51:01 #265

XoxIx

The Librarian

quote:
Op vrijdag 29 juli 2005 11:49 schreef BUG80 het volgende:

[..]

Zeker, maar draai het eens om: het aantal realisaties dat je kunt maken in 80 GB waar je niks aan hebt is nog veel groter.

Dan draai ik het gewoon nog een keer om. Het aantal combinaties dat je kunt maken met 64 KB is veel kleiner.

vrijdag 29 juli 2005 @ 11:51:15 #266

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:49 schreef BUG80 het volgende:

[..]

Zeker, maar draai het eens om: het aantal realisaties dat je kunt maken in 80 GB waar je niks aan hebt is nog veel groter.

En?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 11:55:59 #267

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:51 schreef Pietverdriet het volgende:

[..]

En?

Ok voorbeeld: Neem een willekeurige film. Door eindeloos te variëren met acteurs, talen, scenes, enz kun je, zeg, 10¹⁰ verschillende versies maken.

Echter, door de film aan te passen zodat je er niks meer aan hebt, door bijvoorbeeld door elk 3e frame zwart te maken, of elk 4e, of de helft eruit te knippen, enz zijn er, zeg 10¹⁰⁰ versies te maken waar je niets aan hebt.

Net als met tekst, is het aantal films dat niet voor zal komen vele malen groter dan het aantal dat wel voor zal komen, dat is alles wat ik probeer te zeggen.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 11:57:30 #268

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 11:51 schreef XoxIx het volgende:

[..]

Dan draai ik het gewoon nog een keer om. Het aantal combinaties dat je kunt maken met 64 KB is veel kleiner.

Inderdaad, maar nog steeds zo goed als oneindig (2^(64*1024*8) is heel, heel groot). Dus waar ligt de ondergrens nou echt?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 12:00:44 #269

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:55 schreef BUG80 het volgende:

[..]

Ok voorbeeld: Neem een willekeurige film. Door eindeloos te variëren met acteurs, talen, scenes, enz kun je, zeg, 10¹⁰ verschillende versies maken.

Echter, door de film aan te passen zodat je er niks meer aan hebt, door bijvoorbeeld door elk 3e frame zwart te maken, of elk 4e, of de helft eruit te knippen, enz zijn er, zeg 10¹⁰⁰ versies te maken waar je niets aan hebt.

Net als met tekst, is het aantal films dat niet voor zal komen vele malen groter dan het aantal dat wel voor zal komen, dat is alles wat ik probeer te zeggen.

Ja, dat begrijp ik, maar wat heeft dat er mee te maken?

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 12:04:45 #270

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 12:00 schreef Pietverdriet het volgende:

[..]

Ja, dat begrijp ik, maar wat heeft dat er mee te maken?

Ik probeer de link te leggen met het comprimeren van andere typen bestanden, zoals tekst. Zodra je aan kunt geven dat er realisaties zijn die waarschijnlijker zijn dan andere, kun je gemiddeld genomen compressie bereiken.

Hoe kleiner de groep waarschijnlijke realisaties, hoe groter de maximaal haalbare compressie.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 12:05:51 #271

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 11:57 schreef BUG80 het volgende:

[..]

Inderdaad, maar nog steeds zo goed als oneindig (2^(64*1024*8) is heel, heel groot). Dus waar ligt de ondergrens nou echt?

Welke ondergrens?
Waarom denk je dat ie hard zou zijn?
Als je een film als Patton op DVD (MPEG 2) zet van Film, heb je verlies, in oplossend vermogen, in kleur, etc.
Als je die MPEG 2 nog verder comprimeerd naar DIVX, XVID, MPEG4, MJPG whatever heb je nog meer verlies.
is je file dan 750 Mb is ie te groot voor een normale CD, ah, dan haal je wat resolutie weg, en dan past ie wel.
Zo kan je doorgaan, maar de kwaliteit wordt steeds minder.
Dus die ondergrens ligt daar waar je de minimale kwaliteit legt.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 12:08:00 #272

Pietverdriet

Ik wou dat ik een ijsbeer was.

quote:
Op vrijdag 29 juli 2005 12:04 schreef BUG80 het volgende:

[..]

Ik probeer de link te leggen met het comprimeren van andere typen bestanden, zoals tekst. Zodra je aan kunt geven dat er realisaties zijn die waarschijnlijker zijn dan andere, kun je gemiddeld genomen compressie bereiken.

Hoe kleiner de groep waarschijnlijke realisaties, hoe groter de maximaal haalbare compressie.

Ja, maar wat is nu je punt wat je daar mee wilt zeggen? Dat is allang en uitvoerig behandeld in de vorige topics. Dat je een database kan nemen met de filmbouwsteentjes, en een sleutel die ze achter elkaar plakt.

In Baden-Badener Badeseen kann man Baden-Badener baden sehen.

vrijdag 29 juli 2005 @ 12:09:18 #273

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 12:05 schreef Pietverdriet het volgende:

[..]

Welke ondergrens?
Waarom denk je dat ie hard zou zijn?
Als je een film als Patton op DVD (MPEG 2) zet van Film, heb je verlies, in oplossend vermogen, in kleur, etc.
Als je die MPEG 2 nog verder comprimeerd naar DIVX, XVID, MPEG4, MJPG whatever heb je nog meer verlies.
is je file dan 750 Mb is ie te groot voor een normale CD, ah, dan haal je wat resolutie weg, en dan past ie wel.
Zo kan je doorgaan, maar de kwaliteit wordt steeds minder.
Dus die ondergrens ligt daar waar je de minimale kwaliteit legt.

Ja in het geval van lossy compressie. In het geval van lossless compressie ligt de ondergrens daar waar het uiteindelijke bestand minimale redundantie heeft.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 12:10:47 #274

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 12:08 schreef Pietverdriet het volgende:

[..]

Ja, maar wat is nu je punt wat je daar mee wilt zeggen? Dat is allang en uitvoerig behandeld in de vorige topics. Dat je een database kan nemen met de filmbouwsteentjes, en een sleutel die ze achter elkaar plakt.

Ok, mijn fout, ik zal het allemaal nog eens aandachtig gaan lezen. Ik probeer alleen aan te ontkrachten dat er een wiskundig bewijs zou zijn dat de onmogelijkheid aantoont van deze compressie.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 13:03:41 #275

Barati

quote:
Op vrijdag 29 juli 2005 12:10 schreef BUG80 het volgende:

[..]

Ok, mijn fout, ik zal het allemaal nog eens aandachtig gaan lezen. Ik probeer alleen aan te ontkrachten dat er een wiskundig bewijs zou zijn dat de onmogelijkheid aantoont van deze compressie.

Definieer nu eerst eens wat je bedoelt met een film. Dan kunnen we verder.

vrijdag 29 juli 2005 @ 13:07:44 #276

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 13:03 schreef Barati het volgende:

[..]

Definieer nu eerst eens wat je bedoelt met een film. Dan kunnen we verder.

Mijn definitie van film: één realisatie uit de verzameling mogelijke bitstrings van rond de 80 GB (klopt die grootte ongeveer) die bovendien kijkbaar is.

Met kijkbaar bedoel ik dat het om echte beelden gaat, geen ruis-achtige verschijnselen. Een wiskundige definitie van kijkbaar is een Nobelprijs waard denk ik.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 13:40:05 #277

gnomaat

quote:
Op vrijdag 29 juli 2005 09:50 schreef Barati het volgende:
Het is gemakkelijk in te zien dat de verzameling mogelijke films groter is dan de verzameling "sleutels" van 64 kB. Je kunt (in theorie) bijvoorbeeld alle mogelijke reeksen van 65 kB op papier uitschrijven en van iedere reeks een film maken.

Zelfs in theorie niet, want de hoeveelheid papiermoleculen die je daarvoor nodig hebt is veel groter dan het aantal deeltjes in het heelal (dat laatste wordt geloof ik geschat op 10⁸⁰).

In de praktijk is het aantal films dat er bestaat en ooit in de toekomst gemaakt kan worden, veel kleiner dan het aantal combinaties dat je in 64 KB (of ook al in 4 KB) kwijt kunt.

Birthdays are good for you: the more you have, the longer you live.

vrijdag 29 juli 2005 @ 13:40:53 #278

gnomaat

quote:
Op vrijdag 29 juli 2005 13:07 schreef BUG80 het volgende:
Met kijkbaar bedoel ik dat het om echte beelden gaat, geen ruis-achtige verschijnselen. Een wiskundige definitie van kijkbaar is een Nobelprijs waard denk ik.

kijkbaar := comprimeerbaar tot +/- 700 MB

Birthdays are good for you: the more you have, the longer you live.

vrijdag 29 juli 2005 @ 13:44:14 #279

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 13:40 schreef gnomaat het volgende:

[..]

kijkbaar := comprimeerbaar tot +/- 700 MB

Met de huidige technieken, ja.

Ik kan trouwens een hoop niet-kijkbare films maken die comprimeerbaar zijn tot 700 MB, dus dat gaat ook niet helemaal op.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 14:14:13 #280

Barati

quote:
Op vrijdag 29 juli 2005 13:40 schreef gnomaat het volgende:

[..]

Zelfs in theorie niet, want de hoeveelheid papiermoleculen die je daarvoor nodig hebt is veel groter dan het aantal deeltjes in het heelal (dat laatste wordt geloof ik geschat op 10⁸⁰).

In de praktijk is het aantal films dat er bestaat en ooit in de toekomst gemaakt kan worden, veel kleiner dan het aantal combinaties dat je in 64 KB (of ook al in 4 KB) kwijt kunt.

Vandaar mijn toevoeging "in theorie". Ik denk dat je mijn voorbeeld met het papier wel begrijpt...
De verzameling van mogelijke films is vele male groter dan het aantal combinaties die je kunt maken met 64 kB. Het is irrelevant of die films ook allemaal tegelijkertijd zouden kunnen bestaan.
Het is simpel om een programma te schrijven dat b.v. 2^1000000 unieke "kijkbare" films kan genereren (d.w.z. een zo'n film uit deze verzameling genereert).

[ Bericht 1% gewijzigd door Barati op 29-07-2005 14:19:59 ]

vrijdag 29 juli 2005 @ 14:19:47 #281

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 14:14 schreef Barati het volgende:
Het is simpel om een programma te schrijven dat b.v. 2^1000000 unieke "kijkbare" films kan genereren (d.w.z. een zo'n film uit deze verzameling genereert).

Ja, daar heb jij weer een punt. Je zou van een film willekeurig beeldjes kunnen spiegelen, inverteren, enz en dan heb je zo veel meer realisaties. De vraag is: zijn al deze realisaties waarschijnlijk (intuitief zeg je van niet: je gaat niet naar een film zitten kijken waarin willekeurige beeldjes zijn gespiegeld). Een algoritme wat de waarschijnlijkheid van deze realisaties in acht neemt is waarschijnlijk niet te schrijven. In de praktijk, althans.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 14:35:11 #282

Barati

quote:
Op vrijdag 29 juli 2005 14:19 schreef BUG80 het volgende:

[..]

Ja, daar heb jij weer een punt. Je zou van een film willekeurig beeldjes kunnen spiegelen, inverteren, enz en dan heb je zo veel meer realisaties. De vraag is: zijn al deze realisaties waarschijnlijk (intuitief zeg je van niet: je gaat niet naar een film zitten kijken waarin willekeurige beeldjes zijn gespiegeld). Een algoritme wat de waarschijnlijkheid van deze realisaties in acht neemt is waarschijnlijk niet te schrijven. In de praktijk, althans.

Neem een film met een tijdsduur van 1 uur. Deze bevat 24 * 60 * 60 = 86400 beelden. In ieder beeld zou je één pixel iets kunnen wijzigen (het minst significante bit van deze pixel bijvoorbeeld). Het aantal mogelijke gewijzigde films is hiermee groter dan 2^64k. Als het origineel kijkbaar is dan zijn deze gewijzigde films dat ook (bij een kleurendiepte van 24 bit zul je geen verschil merken tussen het origineel en de gewijzigde film)

vrijdag 29 juli 2005 @ 14:38:04 #283

Barati

Er bestaat geen algoritme dat al deze mogelijke gewijzigde films lossless comprimeert tot 64kB

[ Bericht 100% gewijzigd door Barati op 29-07-2005 14:45:47 ]

vrijdag 29 juli 2005 @ 14:45:05 #284

Barati

[ Bericht 100% gewijzigd door Barati op 29-07-2005 14:45:28 ]

vrijdag 29 juli 2005 @ 14:52:36 #285

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 14:35 schreef Barati het volgende:

[..]

Neem een film met een tijdsduur van 1 uur. Deze bevat 24 * 60 * 60 = 86400 beelden. In ieder beeld zou je één pixel iets kunnen wijzigen (het minst significante bit van deze pixel bijvoorbeeld). Het aantal mogelijke gewijzigde films is hiermee groter dan 2^64k. Als het origineel kijkbaar is dan zijn deze gewijzigde films dat ook (bij een kleurendiepte van 24 bit zul je geen verschil merken tussen het origineel en de gewijzigde film)

Ah, there you go, dat lijkt me wel een goed bewijs ja.

Bestaat er eigenlijk een formule waarmee de hoeveelheid "redundantie" in een willekeurig bestand is te berekenen, m.a.w. wat de maximaal haalbare compressie van dat bestand zou zijn?

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 15:05:01 #286

Barati

quote:
Op vrijdag 29 juli 2005 14:52 schreef BUG80 het volgende:

[..]

Ah, there you go, dat lijkt me wel een goed bewijs ja.

Bestaat er eigenlijk een formule waarmee de hoeveelheid "redundantie" in een willekeurig bestand is te berekenen, m.a.w. wat de maximaal haalbare compressie van dat bestand zou zijn?

nee

vrijdag 29 juli 2005 @ 15:08:58 #287

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 15:05 schreef Barati het volgende:

[..]

nee

Ok. Kort en bondig

De vraag of een bestand kan worden gecomprimeerd tot N bytes is alleen te weerleggen met een tegenvoorbeeld, het is niet te bewijzen dat het wel kan zonder de code erbij te geven.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 18:53:48 #288

McCarthy

communistenjager

gaaf topic

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:05:14 #289

McCarthy

communistenjager

quote:
Op donderdag 21 juli 2005 17:18 schreef Danny het volgende:

[..]

heel simpel uitgelegd:
een bestand zet je om in een getal. dit kan gewoon het bestand in binaire stand zijn (nullen en enen), maar ook het bestand in decimale waarden (000-255).
Dat getal is vele miljoenen tot miljarden tekens lang, maar het blijft één enkel getal.

Dat getal ga je vervolgens omzetten in een optelsom vermenigvuldiging van priemgetallen, welke je wiskundig noteert (een paar bytes per priemgetal).
voila, je hebt het bestand gereduceerd tot een paar honderd Kb.
Probleem is dat er enorm veel rekenkracht nodig is om de juiste priemgetallen en formules te vinden.
Heb je dat eenmaal gedaan dan is de omschakeling naar het oorspronkelijke bestand relatief eenvoudig.

De wiskundige notaties worden gewoon voluit neergezet, de optelsommen worden gemaakt en je hebt je bestand weer in binaire/decimale notatie en dus je oorspronkelijke bestand.

(heel simpel gezegd, niet zo makkelijk uit te voeren)

dit klinkt wel leuk

jammer dat factorisatie van grote priemgetallen zo traag gaat

[ Bericht 3% gewijzigd door McCarthy op 29-07-2005 19:15:07 ]

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:22:01 #290

McCarthy

communistenjager

quote:
Op vrijdag 22 juli 2005 16:15 schreef gelly het volgende:
http://www.free-space.us/primer/Applet1.html

Je kunt deze applet beter in een standalone viewer bekijken, zowel firefox als IE zweten nogal als het ingegeven getal erg groot wordt. Het loopt niet vast, al lijkt het wel zo.

1231387

Calculating ...
Calculating ...
Calculating ...
New prime found
Calculating ...
New prime found
Calculating ...
New prime found
Used primes : 8 for 7 decimals
Compression is 114 %

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:24:01 #291

McCarthy

communistenjager

quote:
Op vrijdag 22 juli 2005 16:27 schreef gelly het volgende:

[..]

Ja, ik sla namelijk niet de priemgetallen zelf op, alleen het hoeveelste Mersenne priemgetal het is.

Mersenne

als je een echt krachtige computer hebt zou je natuurlijk ook gewoon de echte priemen kunnen fixen

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:26:49 #292

McCarthy

communistenjager

maar wacht effe, als je met mersenne werkt kan je toch niet elk getal ontbinden in mersenne priem getallen

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:33:08 #293

McCarthy

communistenjager

quote:
Op zaterdag 23 juli 2005 12:05 schreef Pietverdriet het volgende:

[..]

jaja, maar, dat zegt niet zoveel.
Er zijn ook programma´tje die een landschap genereren waar je dan virtueel zeg maar door heen gaat.
Dat is echter geen compressie, maar genereren van beelden.

jpeg werkt met fractals dacht ik

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:41:12 #294

McCarthy

communistenjager

geofysici werken met een compressie factor van 1%
De bestanden die ingepakt worden zijn data van de aarde

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

vrijdag 29 juli 2005 @ 19:45:06 #295

BUG80

Stop making sense

quote:
Op vrijdag 29 juli 2005 19:41 schreef McCarthy het volgende:
geofysici werken met een compressie factor van 1%
De bestanden die ingepakt worden zijn data van de aarde

1% maar?

Maar goed, op de vele terabytes die een gemiddelde seismische meting opleveren scheelt dit aardig wat dollars.

Mijn mixtape: labtones.com/listener/JSP

vrijdag 29 juli 2005 @ 19:48:04 #296

McCarthy

communistenjager

quote:
Op vrijdag 29 juli 2005 19:45 schreef BUG80 het volgende:

[..]

1% maar?

jep

quote:
Maar goed, op de vele terabytes die een gemiddelde seismische meting opleveren scheelt dit aardig wat dollars.

dat was het woord wat ik zocht

Het nationaal product is hetzelfde als een taart waar uiteraard iedereen recht op heeft, als overheden met geld smijten heet het investeren en als bedrijven investeren heet het een sprinkhanenplaag. McCarthy

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

mega-compressie - deel 2 -

» wetenschap, filosofie, levensbeschouwing

» wetenschap, filosofie, levensbeschouwing