neprihlásený Pondelok, 13. januára 2025, dnes má meniny Rastislav
Google zrýchľuje svoje stránky vlastným rozšírením HTTP protokolu

Webové servery najpopulárnejšieho vyhľadávača Google podporujú zaujímavé rozšírenie protokolu HTTP, ktoré spoločnosť pre tento roky sa nemeniaci protokol vyvinula na konci minulého roka. Rozšírenie umožňuje pri rovnakom obsahu webových stránok prenášať menej dát, čo stránky Google zrýchľuje a to špeciálne na pomalšom pripojení alebo pripojení s horšou odozvou. Vyhľadávač Google so zrýchleným prenosom je možné zatiaľ využívať len z prehliadačov Chrome a prípadne Internet Explorera po doinštalovaní Google Toolbaru.

DSL.sk, 17.2.2009


Mimoriadne zaujímavé rozšírenie SDCH protokolu HTTP, aplikačného protokolu používaného na prenos webových stránok protokolom TCP/IP, podporuje spoločnosť Google na webových serveroch tohto najpopulárnejšieho vyhľadávača.

SDCH

Cieľom rozšírenia Shared-Dictionary Compression over HTTP, SDCH, je prenášať čo najmenšie množstvo dát pri rovnako veľkých webových stránkach.

SDCH tak plní rovnakú úlohu ako štandardy gzip a deflate pre komprimovanie obsahu prenášaného po HTTP. Rozšírenia Gzip respektíve deflate aplikujú bežnú ZIP kompresiu na jednotlivých prenášaných stránkach, dokážu tak využiť nadbytočnosť HTML a opakovanie sa rovnakých respektíve podobných textov v jednej stránke a túto zmenšiť.

Veľká nadbytočnosť existuje pri webových stránkach ale aj pri opakovanom zobrazovaní podobných stránok z rovnakého webu, v ktorých sa opakuje rovnaká alebo podobná štruktúra a množstvo spoločného HTML kódu. Pri komplikovanejších aplikáciách sa táto nadbytočnosť rieši iba prenosom dát pomocou napríklad Ajax technológie, bežné webové stránky je ale neekonomické prerábať na Ajax technológiu.

A práve túto nadbytočnosť odstraňuje už na úrovni protokolu HTTP technológia SDCH. SDCH umožňuje webovému serveru poslať webovému prehliadaču jednorázovo tzv. slovník obsahujúci opakujúci sa HTML kód a následne vo webových stránkach používať iba odkazy na úseky HTML z tohto slovníka.

Slovník nemá žiadnu špecifickú štruktúru, ide o textový súbor, v ktorom sa ideálne nachádza všetok opakujúci sa HTML kód alebo akýkoľvek iný obsah nachádzajúci sa priamo v stránkach, napríklad Javascript, CSS a podobne. Pri dobre zvolenom slovníku sa stránky prenášajú ako unikátne dáta s minimom nadbytočných dát opakujúcich sa na rozličných stránkach.

Nahrádzanie kusov HTML kódu vo webových stránkach za odkazy do slovníka pre danú webovú stránku sa optimálne realizuje automaticky až na úrovni webového servera, programovanie webových stránok sa tak žiadnym spôsobom nemení.

SDCH je navyše možné zároveň kombinovať s GZIP, keď sa najskôr webová stránka zmenší pomocou SDCH a následne skomprimuje pomocou ZIP komprimácie. Takúto kombináciu podporujú aj webové servery vyhľadávača Google.

Implementácia SDCH

Webový prehliadač alebo iný HTTP klient informuje server o podpore štandardu SDCH zahrnutím kódovania "sdch" do HTTP hlavičky Accept-Encoding.

Webový server podporujúci SDCH informuje klienta podporujúceho SDCH o dostupnosti slovníkov HTTP hlavičkou Get-Dictionary, kde uvádza URL adresu slovníka respektíve viacerých slovníkov určených pre danú doménu.

Podobne ako cookie aj SDCH slovníky sú obmedzené na doménu a cestu a majú časovú platnosť. Ak časová platnosť nie je určená, štandardná časová platnosť je 30 dní. Webový prehliadač si slovníky stiahne, uloží a môže používať po dobu platnosti od času stiahnutia.

Slovníky sa jednoznačne identifikujú pomocou SHA-256 kontrolnej sumy obsahu slovníka.

Webový prehliadač, ktorý má stiahnutý slovník alebo viacero slovníkov platných pre danú doménu, môže oznámiť všetky takéto slovníky webovému serveru pomocou HTTP hlavičky Avail-Dictionary, v ktorej uvádza zoznam všetkých ním stiahnutých a dostupných slovníkov pre túto doménu.

Webový server môže následne v zaslanom HTTP dokumente použiť kódovanie obsahu pomocou SDCH a odkazovať sa na obsah zo slovníkov, ktoré má klient k dispozícii.

Zasielaný dokument sa kóduje odkazmi do slovníka pomocou štandardu VCDIFF, RFC 3284, rozšíreného o prelínanie inštrukcií a dát pre možnosť priebežného kódovania a dekódovania a o kontrolné sumy zabezpečujúce integritu dát.

Podpora SDCH, výsledky

Google poskytuje open source implementáciu používaného upraveného kódovania VCDIFF s názvom open-vcdiff, podľa dostupných informácií zatiaľ ale nie sú k dispozícii implementácie pre najpoužívanejšie webové servery.

SDCH podporujú produkčné webové servery samotného vyhľadávača Google, na anglickej verzii stránok a rovnako napríklad aj na slovenských stránkach Google.sk. V čase publikovania článku slovenský Google používal slovník stiahnuteľný tu, po stiahnutí si je ho možné pozrieť ako bežný textový súbor.

Čo sa týka prehliadačov, SDCH je podporované a používané v súčasných verziách prehliadača Chrome, oproti štandardným inštaláciám ostatných prehliadačov tak Chrome pri vyhľadávaní na stránkach Google prenáša menej dát. Podpora SDCH je implementovaná aj v poslednom Google Toolbare pre Internet Explorer, nenachádza sa ale v Google Toolbare pre Firefox.

Efektívnosť technológie sme testovali pri vyhľadávaní slova krypton na Google.sk. Slovník jednorázovo stiahnutý webovým prehliadačom pre Google.sk má veľkosti 42.8 KB.

Testované boli štyri scenáre, vyžiadanie si výsledkov vyhľadávania z HTTP klienta bez podpory GZIP a SDCH, z klienta bez podpory GZIP a s dostupným SDCH slovníkom aktuálne používaným na google.sk, z klenta s podporou GZIP a bez podpory SDCH a klienta s podporou GZIP a s dostupným SDCH slovníkom aktuálne používaným na google.sk.


Tabuľka preneseného množstva bajtov a dosahovanej úspory pri hľadaní kryptonu na google.sk



V tabuľke je uvedené množstvo bajtov HTTP odpovede, ktoré zaslali servery vyhľadávača Google, a ktorá sa dekóduje samozrejme vždy na ten istý respektíve takmer taký istý HTML dokument s výsledkami vyhľadávania pre výraz krypton.

Ako ukazuje test, SDCH znižuje na minimalistických stránkach google.sk množstvo prenesených dát o 30%, čo môže pozorovateľne urýchliť browsovanie cez pomalšie napríklad mobilné pripojenie. Na stránkach s výrazne väčším množstvom nemeniacich sa dát a s bohatším formátovaním ako na stránkach vyhľadávača Google by pravdepodobne úspora bola ešte vyššia.


Ďalšie informácie k SDCH: špecifikácia SDCH, diskusná skupina o SDCH , špecifikácia VCDIFF, open source implementácia VCDIFF.


      Zdieľaj na Twitteri


Považujete SDCH za zaujímavú inováciu? (hlasov: 322)

Áno      89%
Nie      11%


Najnovšie články:

Prvý štart rakety New Glenn konkurujúcej SpaceX sa má uskutočniť v pondelok
Nvidia a MediaTek spolu vyvinuli CPU pre PC, Nvidia ho chce masovo presadiť
Notebook s rozťahovacím displejom má OLED od Samsungu, zverejnil ďalšie parametre
Podľa šéfa Nvidie sú užitočné kvantové počítače vzdialené dekády
Nový radič umožní rýchlejšie a výrazne väčšie SSD pre PCI Express 5.0
Ďalší let výrazne upgradnutej Starship sa má uskutočniť v pondelok
Prehrávač videa VLC podporuje generovanie titulkov pomocou AI
Uvedený Raspberry Pi 5 s až 16 GB RAM
Japonci vypustili do vesmíru prvý satelit z dreva
Štát potvrdil rozsiahly útok na kataster, zostáva nefunkčný


Diskusia:
                               
 

hlavne nech urobia chrome pre Linux :)
Odpovedať Známka: 2.7 Hodnotiť:
 

Chrome by sa dal nazvat enklavou, operacnym systemom nad nativnym os urceny pre web applikacie... Chyba ti?

Po kratkodobom testovani dost nestabilnej verzie som pochopil ze to nebude nic pre mna. MFF postacuje.
Odpovedať Známka: -4.0 Hodnotiť:
 

tak skusk opat testovat ... od tej doby sa uz beta zmenila na finalnu verziu a aj z tej je posledna verzia len par dni dozadu ... mne vyhovuje a hlavne nepada a aj rychlost ujde, pamat zere ako o dusu ale kedze jej mam dost 4GB tak ma to nejak zvlast netrapi :-)


Odpovedať Hodnotiť:
 

Google vseobecne prinasa zaujimave inovacie. Len obcas zabudaju na povod... aby sa z nich raz nestal Microsoft II.
Odpovedať Známka: 0.7 Hodnotiť:
 

Google je novy Skynet... minule som si uvedomil, kolko vlastne o mne uz vie a zhrozilo ma to: maily, kalendar, historiu searchov, polohu. informacie su moc a koncentracia moci je potencialne nebezpecna.
Odpovedať Známka: 5.6 Hodnotiť:
 

nevies o com hovoris
Odpovedať Známka: -8.3 Hodnotiť:
 

Vie o com hovori. Pre mna je nepochopitelne ze vela firiem pouziva gmail nad svojou domenou 2. urovne.

A google calendar etc... Buducnost by sme mali hladat skor v projektoch ako je EyeOS a vyrobit si vlastny cloud.
Odpovedať Známka: 8.7 Hodnotiť:
 

vela firiem ma gmail zakazany vo firewale
Odpovedať Známka: -6.7 Hodnotiť:
 

Mali by sme rozlisovat medzi webovou aplikaciou gmail a servermai "gmail".

Ked ma nejaka firma bloknute url gmailu alebo ich IPcky, jedna sa o snahu zabranit zamestnancom citat si osobne emaily v praci.

Kebyze bloknu servre gmailu na branach, firemny mail server by z gmailu nebol schopny prijmat spravy, co by asi nebolo moc dobre ze...

Vela firiem ale pouziva gmail pre svoju domenu 2. urovne [example.org],DNS MX zaznam maju nastaveny gmail. To je pre mna nepochopitelne.
Odpovedať Známka: 6.0 Hodnotiť:
 

> Vela firiem ale pouziva gmail pre svoju domenu 2. urovne [example.org],DNS MX zaznam maju nastaveny gmail. To je pre mna nepochopitelne.

Co je na tom pre Teba nepochopitelne?
Najma pri mensich firmach - nulove naklady, realne 100% dostupnost, lepsi webmail nepoznam, stale sa inovuje ...
Vies zalohovat!

Jedine, co mas je privacy issues:
a) alebo sa neobavas = OK
b) alebo sa obavas, ale co moze na firmu predavajucu plastove okna//repasuje tonery/baterie// v SR Google vytrubit? Preposiela OBJ/FA na DU? Aj keby, ake nepodvadzas = OK. Preposiela kontakty konkurencii? Za par drobnych si GG neznici meno!
c) suhlasim v pripade vacsich firiem, resp. so specialnymi sortimentom

Praveze (ak sa uz niekto boji), tak skor odhalenia sukromia/sukr. kontaktov/mailov, ako odhalenia mailov murara, SZCO so zakaznikmi ...

Odpovedať Známka: 8.3 Hodnotiť:
 

Suhlasim ... a dodam ... kto sa boji si šifruje maily
Odpovedať Známka: 10.0 Hodnotiť:
 

doména info + mail hosting = 42 €, to snaď mohol zvládnuť aj SZČO

každá informácia má svoju hodnotu a aj svoju cenu
vieš ako rád by som oslovil zákazníkov s nižšou cenou ako konkurencia, ale nie z nízkou cenou, aby som mal zisk!!!
Odpovedať Hodnotiť:
 

Preco platit 42E, ked za $7 moze SZCO mat .com domenu - lepsie na SEO, coolovejsie ...
s DNS hostingom
s hostingom na par HTML a obrazkov - vizitka a ponukame ...
s extra super spica GMAIL mailhostingom

A ako mu moze GMAIl ublizit - preda jeho udaje a zakaznikov inemu SZCO za par supiek?
Bude ho spehovat a posielat CIA/FBI/NSA/Danovy urad, kolko predal plastovych okien a kolkokrat vymaloval byt? Kolkokrat z toho bez ucasti statu?
BLBOST!
Stredna/vacsia firma - moze sa obavat, ale maly clovek, co ma mail skor pre paradu, alebo ma shop a predava Linux tricka a vlastna_tvorba_CDcka ...

Odpovedať Hodnotiť:
 

no vies pouzit to vo firmenom prostredi v case ak je GMial v Beta verzii :-) je sprostost admina ... minule som cital zaujimavy blog jednej firmy ktora po roku testovania chcela presjt na ostro na GMail a po nielkolkych dnoch nedostuponosti sluzby a nikoho zodpovedneho na supporte to vzdali a vysledok bol ze uz nikdy viac Google vo firmenom prostredi ;-)))
Odpovedať Hodnotiť:
 

Prepac, ze ty nevies o com hovori, zato my uz nemozeme...
Odpovedať Známka: -3.3 Hodnotiť:
 

Vidis aky si hlupy. Ja mam vsetko doma na HDD, cookies mazem raz za tri dni. Nechapem ludi preco svoje meily ukladaju na servre niekde v USA, ked velky HDD dnes stoji menej ako 100€.
Odpovedať Hodnotiť:
 

Asi nemozes byt konkretnejsi ohladne tych obcasov. Dalsi mudrlant co vsetko vie a vsade bol.
Odpovedať Známka: -5.0 Hodnotiť:
 

Pravdaze mozem. Google bol priekopnik a povodne masovo podporoval open source a free sw. Podporovali mrte projektov etc... Lenze cim dalej tym viac na to zabudaju. Android je dobry priklad. OPEN SOURCE... To hej. Ale dlhu dobu neboli zdrojaky verejne. Taktiez sa oficialnym sposobom uid 0 nestanes, potrebujes ho exploitnut co sa javi byt tazsie ako na iPhone... A je toho mrte viac. Google je v podstate SaaS prowider ktory nedava toho vela spat.
Odpovedať Známka: 6.0 Hodnotiť:
 

Bez urazky, ale zhrniem to takto: nikoho kto pouziva v argumentacii slovo mrte nemozem brat vazne.
Odpovedať Známka: 0.0 Hodnotiť:
 

to si mrte povedal
Odpovedať Známka: -3.3 Hodnotiť:
 

rms... Skvela prezyvka... nebodaj si fanusik Stallmana? :) To by si mal presne vediet co je Goolag zac.
Odpovedať Hodnotiť:
 

Aby sa z tvojej firmy raz nestal Microsoft II. Jaaaaj vlastne o to sa bat nemusime ty ani zlomok z toho co ma MS $ nikdy mat nebudes.
Odpovedať Známka: -10.0 Hodnotiť:
 

Zato ty mi pripadáš akoby tvoj jazyk nahrádzal toaletný papier hošíkom z MS...
Odpovedať Známka: 10.0 Hodnotiť:
 

Iba chcem k clanku podotknut, ze aspon 2x je tam napisane namiesto SDCH skratka SDHC (co je skratka SDHC kariet) tak si to moze autor pripadne doopravit.
Odpovedať Známka: 10.0 Hodnotiť:
 

google nas ma vo svojej moci,
planeta zem sa stale toci,
ich servre bezia vo dne v noci,
google je silny jak v diable 2 runy,
vie prepocitat eura na koruny,
ma vlastnu elektraren ktora funguje na morske vlny,
ziadnen programator v googli neni blby,
ked ho bolia kolena vygoogli si 'bolest klby'
v googli zistis pocasie, navody, aj o cestovnom ruchu,
jedno vyhladavanie v google vypusti niekolko CO2 do vzduchu.
v buducnosti deti z marsu sa na dejepise budu ucit o google earthe,
ale na otazku 'kde je earth?' odpoved znie "nikde!"
google znici svet - planety zem niet,
tretia svetova vojna kvoli googlu vznikla,
nova obyvana planeta je cervena jak cvikla.
Odpovedať Známka: 8.2 Hodnotiť:
 

pretoze rokefeler google odkupil,
ludi svojim cipom do hlavy otupil,
cip zasielal info o vsetkom do databazy,
ze kto si kolko vyhonil a kto mal v zuboch kazy,
a zly ještěř posielal divny kod ludom do hlavy,
ti mali kvoli tomu cipu stavy,
konali nie z vlastnej vole,
ludom boli pridelene role...

A dalej sa mi uz nechce rapovat more :)

vsetci ludia su na facebooku,
FBI ich ma v notebooku,
jak kuzelnik zajacov vo svojom klobuku.
Odpovedať Známka: 7.4 Hodnotiť:
 

fakt pekne :) akurat som si neuvedomil ze rapujes ;), celu tu dobu som si myslel ze basnis :D
Odpovedať Známka: 10.0 Hodnotiť:
 

gramaticky rym nic moc :(
Odpovedať Známka: -10.0 Hodnotiť:
 

Po druhom riadku mi doslo ze je to rap, tak som si to cele cital s petrzalskym akcentom :D
Odpovedať Známka: 8.8 Hodnotiť:
 

Niektore slohy maju nespravny pocet slov - ale kedze je to rap, tak vpohode.. :P

Inak, zhrnul si tam celkom pekne fakty (len si teraz davaj pozor na FBI, CIA, NSA, Obamu... Obamu nie :) ).. ;]
Odpovedať Známka: 10.0 Hodnotiť:
 

Z Barracka nemam Obavu
On je len babka
Odpovedať Známka: 10.0 Hodnotiť:
 

pekne, pekne... a este aj pravdivy rap :)

btw. rap a pc, hmmm to mi pripomina track marpo - emotrix (ft. gipsy) ale lyrics co su na internete stoja za hov... ehm ...prd!
ked niekto napise v prepise textu "fairelbol" namiesto firewall, to je uz slusna sila :D
..ja viem, troska od temy..
Odpovedať Hodnotiť:
 

Ale dobre :]
Mas to z vlastnej hlavy? Ak nie, nacim citovat!
Odpovedať Známka: 3.3 Hodnotiť:
 

len chromy
a levy :D [ie] :D
Odpovedať Známka: 5.6 Hodnotiť:
 

Este mi chyba patch pre FireFox
Nie v GG toolbar (ktory si nikdy nikam nedam! - co ponuka advanced userovi??), ale priamo FF s podporou sdch
Odpovedať Hodnotiť:
 

"SDCH je navyše možné zároveň kombinovať s GZIP, keď sa najskôr webová stránka zmenší pomocou SDCH a následne skomprimuje pomocou ZIP komprimácie."

Myslim ze vo vyssie uvedenom texte je chyba. GZIP pokial viem nepouziva komprimaciu ZIP. Skor ide o kompresny algoritmus DEFLATE. Navyse ZIP umoznuje pouzivat rozne komprimacne algoritmy - DEFLATE, BZip2, PPMd+, LZMA a dalsie. GZIP myslim pracuje len s DEFLATE.
http://en.wikipedia.org/wiki/Gzip
http://en.wikipedia.org/wiki/ZIP_file_format
http://en.wikipedia.org/wiki/DEFLATE

Inak dobry clanok, dakujem za viacere pre mna nove informacie.
Odpovedať Známka: 10.0 Hodnotiť:
 

dufam, ze toto FF nikdy nebude podporovat... bola by to len dalsia vec, ktorou bude zasierat pamat a on uz teraz nevie co so sebou. Ani jemalloc nepomoze...
Odpovedať Známka: -10.0 Hodnotiť:
 

Vseobecne optimalizacia ma zmysel len ak prinesie realne uspory. Inak to je len zbytocne skomplikovanie systemu.
Ked si prinos tychto slovnikov porovname so standardne pouzivanym a podporovanym deflate, tak to je ZANEDBATELNE (a to do porovnania nezahrnyuli velkost samotnych slovnikov). Zanedbatelne to je hlavne ak si uvedomime ze HTTP/text tvori len zlomok prenosov, vacsinu zaberaju obrazky, flash a pod.
Zbytocne to komplikuje a zatazuje aj samotny server ktory musi vyrabat za behu pokial mozno optimalne slovniky. Je to len taka slabsia predkompresia.
Odpovedať Známka: -10.0 Hodnotiť:
 

Asi ste nečítali celý článok alebo nepochopili tú technológiu. Skúsim ozrejmiť:

1, Slovník sa nevytvára za behu, vytvorí sa napríklad raz za mesiac a dajú sa do neho napríklad všetky kusy HTML/Javascript/CSS kódu, ktoré sa objavujú na daných stránkach.

2, Za behu sa kóduje webová stránka pomocou statického slovníka, čo samozrejme zvyšuje nárok na výkon servera. HW výkon je dnes ale so 4-jadrovými procesormi relatívne lacný, ak navyše okrem úspory bandwidthu prináša vyššiu vnímanú rýchlosť stránok.

3, Úspora nie je zanedbateľná, je na úrovni 30% aj na minimalistických stránkach Google. Ako je možné vidieť v tabuľke, tá úspora je dosahovaná aj v prípade používania gzip.

4, 30% na HTML/ostatný textový obsah je obrovská úspora. Závisí samozrejme na type webových stránok, službe streamujúcej video to môže byť jedno, vyhľadávaču, klasickým spravodajským webom, portálom, akýmkoľvek informačným webom už nie.
Odpovedať Známka: 10.0 Hodnotiť:
 

Cital. Mal som na mysli ze server musi sledovat kod (dynamicky) vygenerovanych stranok a podla toho robit slovniky. CPU sa zrychluju a rovnako sa zrychluju pripojenia. Dnes nema zmysel optimalizovat veci pre modemy lebo to je tak 1% userov.
Nejaky vyznam to ma na strankach ako je google, kde neni nic okrem textu a kde chodi clovek pravidelne a nevadi prvotne stahovanie slovnikov. Ale neverim ze nieco prevratne. JS a CSS su aj tak stale tie iste a browser ich cachuje. Text sa meni podla toho co na tom googli vyhladavam. Takze je to len taka barlicka na zlepsenie vysledkov deflatu zapamatanim dlhych html tagov. Ci ma nieco 6 KB alebo 4,7 je jedno, aj tak to pojde mozno v jednom pakete (nechce sa mi hladat ake velke su default pakety), v kazdom pripade si myslim ze nic ocami pozorovatelne.

A ktory bezny web obsahuje tolko textu aby bol rozdiel postrehnutelny?
Uz samotny deflate je velky skok vo velkosti HTML a napriek tomu sa velmi nepouziva. Jednoducho konecny rozdiel je minimalny.
Odpovedať Hodnotiť:
 

S touto technologiu google aspon usetri nejaky ten svoj bandwidth, kedze nebude musiet userom posielat tolko dat
Odpovedať Hodnotiť:
 

Analýza generovaných stránok nie je nutne potrebná pre dobré výsledky, o tom je práve SDCH. Ten slovník nemusí byť nič optimálne, stačia všetky texty z HTML štruktúry, Javascriptu, CSS, atď, čo sa môžu objaviť v stránke, a vyzerá to, že to funguje dobre. Optimalizácia je samozrejme možná, ale zrejme pri výrazne rôznorodých dátach nič podstatné neprinesie. V slovníku Google nie sú žiadne dáta v zmysle najhľadanejších výrazov a ich výsledkov a podobne. Je nepravdepodobné, že Google nafukuje svoje stránky len aby ukázal, že SDCH je účinné, a zároveň sa dá prepokladať, že používa externý Javascript a CSS najlepšie ako sa dá, takže tá úspora 30% je reálna.

Hlavne pre veľké weby to nie je jedno, či mesačne platia za bandwidth X alebo 70% z X, či im stačí sieť a linka s kapacitou X alebo s kapacitou 70% z X.
Odpovedať Hodnotiť:
 

Medzi 6.7 KB a 4.7 KB je podstatný rozdiel aj pre užívateľa, špeciálne na pomalšom spojení. Je to minimálne o dva pakety naviac a podľa TCP/IP stackov a dĺžky otvorenia používaného TCP/IP spojenia (u keep-alive spojení) to môže znamenať o 2 * RTT dlhšie načítanie, pri mobilnom pripojení to je pomerne dosť.
Odpovedať Hodnotiť:
 

Stale to vidite ciernobielo, resp. bielo :). Stale zanedbavate prenos slovnikov (i ked len raz za mesiac), + navyse prenos hashov slovnikov zrejme v kazdom requeste. Uz teraz v kazdom requeste googlu (aj na obrazky) ide asi 600 bajtov cookiesov, k tomu sa pridaju hashe slovnikov, co je s ich cookiesmi zbytocny balast pre usera navyse drahsim smerom, kedze vacsina pripojeni ma vyrazne horsi upload ako download.
Nechce sa mi teraz hladat info o deflate, ale mozno ucinnejsie by bolo standardizovat modernejsiu kompresiu ako robit barlicku k deflate (skrabat sa lavou nohou za pravym uchom) a vysledok by mohol byt rovnaky.
Odpovedať Známka: -2.0 Hodnotiť:
 

Nie je to zázrak, ale je to zaujímavá technológia.

Asi stále ale nechápate alebo nechcete pochopiť jej princíp. Deflate/Gzip dokáže využiť iba nadbytočnosť v jednom vracanom HTTP dokumente, nadbytočnosť v používaní HTML jazyka a vôbec textu namiesto efektívneho binárneho kódovania. SDCH využíva nadbytočnosť v tom, že rovnaké dáta sa prenášajú viacnásobne v rozličných dokumentoch, čo nemá gzip/deflate ako využiť ani zistiť, keďže pracuje iba s jedným dokumentom.

Ako vidíte z výsledku, sdch a gzip sú úplne nezávislé a použitie sdch vôbec nezhoršuje kompresný pomer dosahovaný gzip, dokonca ho o percento zlepšuje. Z toho vyplýva aj matematicky, ak je to tažké pochopiť čo to znamená konkrétne, že tie dve kompresie odstraňujú úplne odlišné nesúvisiace nadbytočnosti.

Prenášaná kontrolná hash je tuším osemznakový reťazec, plus desať znakov HTTP hlavičky...

Slovník v tomto prípade má 43 KB, prenášaný gzipom 7.5 KB. Od štyroch (6.7 KB - 4.7 KB) uskutočnených vyhľadávaní už šetríte...
Odpovedať Hodnotiť:
 

chapem ze ide o nadbytocnost v ramci viacerych suborov, to ale nevylucuje ze lepsi kompresny algoritmus to mozno dokaze stlacit o 30% viac aj v ramci jedneho suboru. A chcel som ukazat ze ked uz chcu setrit tak mohli aj na inych miestach.

Odpovedať Hodnotiť:
 

Určite by bolo dobre, keby sa našiel ešte lepší kompresný algoritmus, s tým sa dá len súhlasiť.

Zatiaľ ale asi nič rádovo lepšie ako gzip/deflate s relatívne nízkymi nárokmi na výpočtový výkon nie je a dá sa predpokladať, že keby aj bolo, stále by bol kompresný pomer nezávislý alebo takmer nezávislý na použití SDCH alebo niečoho podobného.

Takže SDCH má a zrejme by aj stále malo zmysel, je škoda neodstrániť takúto nadbytočnosť, ak to ide ľahko.
Odpovedať Hodnotiť:
 

5, Či sa tá technológia hromadne presadí, ťažko povedať. Pravdepodobnejšie asi nie. Na druhej strane tým, že to podporujú na Google.com to majú vymyslené dobre. Browsery, ktoré nechcú byť pomalšie ako Chrome, to dorobia, následne to budú podporovať browsery dosť veľa užívateľov a budú mať dôvod to podporovať aj ďalšie weby.
Odpovedať Hodnotiť:
 

Vyzera to dobre, vsak, ale tymto sposobom vznikali a vznikaju "nadstandardne" rozsirenia pre (nielen) IE zo strany Microsoftu, vdaka comu je (nielen) IE tym cim je a taky aky je. Zeby toto boli zaciatky druhej fazy (Extend) EEE techniky (Embrace, Extend, Extinguish) zo strany Google ? Da sa len predpokladat ciel takehoto postupu. Proprietary gHTTP protocol ? Vyzera to ako silna kava, ale myslim, ze google je na taketo manipulovanie dost velky. Cas ukaze. Len aby potom uz nebolo neskoro. :)
Odpovedať Známka: -5.0 Hodnotiť:
 

Ja ze sa konecne naucili pouzivat tabulky.. a to je len screnshot z excelu :)
Odpovedať Známka: 10.0 Hodnotiť:

Pridať komentár