no comment
[Re:] [sztanozs:] A Facebook Messenger kiválóan tömörít - BLOGOUT fórum
hozzászólások
Ezek szerint a legtobb uzenet 1 karaktert tartalmaz.
mármint minden 25. üzenet tartalmaz egy unicode karaktert
DeltaPower
(őstag)
Lehet hogy igazuk van, a messenger üzenetek hasznos információtartalma átlagosan tényleg 0,8 bit körül lehet.
#78693120
(aktív tag)
A képtömörítésük tényleg hatékony. Desktopon alig lehet kivenni, hogy mit küldök át az appban.
1 karaktert általában 8 biten tárolnak. (unicode az 16 vagy 32bit)
GSM7 pld 7biten, de csak alap ASCII karaktereket..
Szóval a 0,8bit az egy nyolcad karakter egy nyolcada.
igen, egy 1280x1024 felbontású 32bites képet is biztos 0,8biten tárolnak
A Unicode karakterkészlet is 8 biten reprezentálja a leggyakrabban használt karaktereket, legalábbis, ha az UTF-8 reprezentációt használod. A speciálisabb karakterek persze 16, 24 vagy akár 32 bitesek is lehetnek. Pl emojik.
[ Szerkesztve ]
Akkor ezek szerint egy átlag üzenetben annyi van, hogy "ige"
Amire te gondolsz, az az UTF-8 kódolás. Emellett létezik az UCS-2 meg az UTF-32 is, amiknél minden karakter 16 ill 32 bitet használ, meg ott az UTF-16, ahol a legtöbb karakter 16 bites, de vannak 32 bitesek is (az UCS2 csak az első 64k karaktert tudja ábrázolni).
Az összes közül a legel... rontottabb az UTF-16, a Microsoft Windows természetesen ezt használja mindenhol
[ Szerkesztve ]
Kötekedésception.
A kódolás és reprezentáció jelen esetben ugyanazt jelenti. Az UTF-16 valahol jobb lehet, mert bizonyos karakterhasználat esetén jobb, konkrétan a 3 bájtos UTF-8 karakterek UTF-16 segítségével csak 2 bájtot foglalnak.
Szerintem az UTF-32 inkább az elcseszett, mert semmire se jó, azon kívül, hogy fix 4 bájtos karakterei vannak.
"A kódolás és reprezentáció jelen esetben ugyanazt jelenti."
Viszont te karakterkészletről beszéltél, az meg már más
Az UTF-8 kompatibilis a sima nyolcbites stringekkel, de változó méretű.
Az UTF-32 fix méretű, de nem kompatibilis a nyolcbites stringekkel.
Az UTF-16 meg ügyesen egyesíti ezeknek a hátrányait, mert se nem kompatibilis, se nem fix méretű.
Az Unicode-ról beszéltem úgy, mint a karakterkészlet, az UTF-8 és társai a reprezentáció. Jó igazából a Unicode több, mint karakterkészlet, s az UTF-8 az ennek részhalmaza, ha még pontosabb akarok lenni.
Igen, így is lehet nézni. De van olyan use case, ahol az UTF-16 hasznos lehet.
#92063744
(tag)
A Facebook Messengert tanítják a szakgimikben, egyetemeken informatika szakon.
Az óra címe: Hogyan NE programozz soha!
(természetesen csak viccelek, de egy rakás trágya az egész app, mintha a takarítónő írta volna)
Csak el van cseszve a lábjegyzet. A főbb részen közölt 10KB / 100 üzenet már jóval normálisabb adat. Bár ott meg a kilo-t írhatták volna kis k-val, ha már
Ezzel a hozzászólással magadat és az ismerőseidet sikerült minősítened.
DeltaPower
(őstag)
Kíváncsi lennék mi alapján jutottál erre a következtetésre.
"...a messenger üzenetek hasznos információtartalma átlagosan tényleg 0,8 bit körül lehet."
Ebből én arra következtetek, hogy a neked küldött messenger üzenetek alapján írod ezt. Persze lehet, hogy én értem félre.
DeltaPower
(őstag)
Kisebb részben tényleg, de főképp az internet-szerte megosztott messenger screenshotok alapján, ugyanakkor nekem is vannak olyan notórius ismerőseim, akiknél 1 betűre 2 emotikon jut és feltétlen szükségszerűnek érzik minden egyes üzenetet like jellel nyugtázni.