[Re:] [sztanozs:] A Facebook Messenger kiválóan tömörít - BLOGOUT fórum

üzenetek

hozzászólások


sztanozs
(veterán)
Blog

no comment


Feruendios
(aktív tag)
Blog

Ezek szerint a legtobb uzenet 1 karaktert tartalmaz.
:D


sztanozs
(veterán)
Blog

mármint minden 25. üzenet tartalmaz egy unicode karaktert


DeltaPower
(őstag)

Lehet hogy igazuk van, a messenger üzenetek hasznos információtartalma átlagosan tényleg 0,8 bit körül lehet.


#78693120
(aktív tag)

A képtömörítésük tényleg hatékony. Desktopon alig lehet kivenni, hogy mit küldök át az appban.


Cucuska2
(őstag)
Blog

:C :R


Gdi
(senior tag)
Blog

1 karaktert általában 8 biten tárolnak. (unicode az 16 vagy 32bit)
GSM7 pld 7biten, de csak alap ASCII karaktereket..
Szóval a 0,8bit az egy nyolcad karakter egy nyolcada.


mephi666
(nagyúr)
Blog

igen, egy 1280x1024 felbontású 32bites képet is biztos 0,8biten tárolnak :)


lezso6
(HÁZIGAZDA)
Blog

A Unicode karakterkészlet is 8 biten reprezentálja a leggyakrabban használt karaktereket, legalábbis, ha az UTF-8 reprezentációt használod. A speciálisabb karakterek persze 16, 24 vagy akár 32 bitesek is lehetnek. Pl emojik.

[ Szerkesztve ]


dabadab
(titán)
Blog

Akkor ezek szerint egy átlag üzenetben annyi van, hogy "ige" :D


dabadab
(titán)
Blog

Amire te gondolsz, az az UTF-8 kódolás. Emellett létezik az UCS-2 meg az UTF-32 is, amiknél minden karakter 16 ill 32 bitet használ, meg ott az UTF-16, ahol a legtöbb karakter 16 bites, de vannak 32 bitesek is (az UCS2 csak az első 64k karaktert tudja ábrázolni).

Az összes közül a legel... rontottabb az UTF-16, a Microsoft Windows természetesen ezt használja mindenhol :D

[ Szerkesztve ]


lezso6
(HÁZIGAZDA)
Blog

Kötekedésception. :DDD

A kódolás és reprezentáció jelen esetben ugyanazt jelenti. Az UTF-16 valahol jobb lehet, mert bizonyos karakterhasználat esetén jobb, konkrétan a 3 bájtos UTF-8 karakterek UTF-16 segítségével csak 2 bájtot foglalnak.

Szerintem az UTF-32 inkább az elcseszett, mert semmire se jó, azon kívül, hogy fix 4 bájtos karakterei vannak. :D


dabadab
(titán)
Blog

"A kódolás és reprezentáció jelen esetben ugyanazt jelenti."

Viszont te karakterkészletről beszéltél, az meg már más :)

Az UTF-8 kompatibilis a sima nyolcbites stringekkel, de változó méretű.
Az UTF-32 fix méretű, de nem kompatibilis a nyolcbites stringekkel.

Az UTF-16 meg ügyesen egyesíti ezeknek a hátrányait, mert se nem kompatibilis, se nem fix méretű.


lezso6
(HÁZIGAZDA)
Blog

Az Unicode-ról beszéltem úgy, mint a karakterkészlet, az UTF-8 és társai a reprezentáció. Jó igazából a Unicode több, mint karakterkészlet, s az UTF-8 az ennek részhalmaza, ha még pontosabb akarok lenni. :D

Igen, így is lehet nézni. De van olyan use case, ahol az UTF-16 hasznos lehet.


D1Rect
(félisten)
Blog

Biztos azt is a T-Systems fejleszti.


#78693120
(aktív tag)

:DD


#92063744
(tag)

A Facebook Messengert tanítják a szakgimikben, egyetemeken informatika szakon.

Az óra címe: Hogyan NE programozz soha!

(természetesen csak viccelek, de egy rakás trágya az egész app, mintha a takarítónő írta volna)


apatyas
(Korrektor)
Blog

Csak el van cseszve a lábjegyzet. A főbb részen közölt 10KB / 100 üzenet már jóval normálisabb adat. Bár ott meg a kilo-t írhatták volna kis k-val, ha már ;]


Bjørgersson
(félisten)
Blog

Ezzel a hozzászólással magadat és az ismerőseidet sikerült minősítened. :D


DeltaPower
(őstag)

Kíváncsi lennék mi alapján jutottál erre a következtetésre. :U


Bjørgersson
(félisten)
Blog

"...a messenger üzenetek hasznos információtartalma átlagosan tényleg 0,8 bit körül lehet."

Ebből én arra következtetek, hogy a neked küldött messenger üzenetek alapján írod ezt. Persze lehet, hogy én értem félre. :)


DeltaPower
(őstag)

Kisebb részben tényleg, de főképp az internet-szerte megosztott messenger screenshotok alapján, ugyanakkor nekem is vannak olyan notórius ismerőseim, akiknél 1 betűre 2 emotikon jut és feltétlen szükségszerűnek érzik minden egyes üzenetet like jellel nyugtázni.


Ygg
(senior tag)

AÚ...
Ez így enyhén szólva érdekes...

üzenetek