neprihlásený Utorok, 22. apríla 2025, dnes má meniny Slavomír
Google prešiel na nový index, výsledky budú aktuálnejšie

DSL.sk, 9.6.2010


Spoločnosť Google dnes oznámila dokončenie nasadzovania nového systému indexovania webového obsahu Caffeine, ktorého test avizovala v auguste minulého roka.

Hlavnou zmenou oproti doteraz používanému systému indexovaniu webových stránok je zvýšenie aktuálnosti výsledkov vyhľadávania a objavenie sa publikovaných informácií vo výsledkoch vyhľadávania skôr ako tomu bolo v minulosti, podľa spoločnosti budú výsledky "o 50% aktuálnejšie".

Doteraz spoločnosť mala web a index rozdelený na niekoľko vrstiev, pričom každá sa aktualizovala s rozličnou rýchlosťou. Obnoviť hlavnú vrstvu indexu trvalo podľa spoločnosti niekoľko týždňov. Aktualizovať vrstvu indexu navyše vyžadovalo analyzovať celý web.

Pri novom spôsobe indexovania je web analyzovaný po malých častiach a index je aktualizovaný priebežne, nové informácie sa v ňom majú objavovať v rádoch sekúnd po nájdení robotmi.

Nový spôsob indexovania navyše umožňuje spoločnosti výrazne zväčšiť index.

Databáza Caffeine má stotisíc terabajtov, denne sú do nej pridávané stovky terabajtov. Každú sekundu spracuje nový systém indexovania stovky tisícov stránok.


      Zdieľaj na Twitteri



Najnovšie články:

Číňania predstavili ešte rýchlejšie nabíjanie elektromobilov, lepšie sodíkové batérie
Uvedená SD karta s rýchlosťou 1.6 GB/s
Satelity Amazonu pre službu satelitného pripojenia budú vypustené až na konci mesiaca
Pripravuje sa ďalší Star Wars film, s Ryanom Goslingom
Používanie HDD má oveľa menšie emisie ako SSD, tvrdí Seagate
Vydané Ubuntu 25.04, s oficiálnou verziou aj pre ARM notebooky
Intel predáva polovicu výrobcu FPGA čipov Altera
Astronómovia tvrdia, že objavili možné znaky života na inej planéte
Digitálnym rádiom sa v Česku začali vysielať tri významné komerčné stanice
Sonda Lucy sa tento týždeň priblíži k asteroidu


Diskusia:
                               
 

fuu tak to je ina databaza...
Odpovedať Známka: 8.4 Hodnotiť:
 

nechcel by som fixupovat koruptnutu 100 tisic terovu databazu (ale je zrejme rozclenena na plno kuskov a urovni)
Odpovedať Známka: 7.5 Hodnotiť:
 

:D
Odpovedať Známka: 8.5 Hodnotiť:
 

tipujem ze tam pouzivaju nejake nosql databazy (tusim ze ich implementacia sa vola BigTable alebo tak nejak )
Odpovedať Známka: 8.6 Hodnotiť:
 

Zaujimalo by ma ako v nej dokazu vyhladavat.
Odpovedať Známka: 8.9 Hodnotiť:
 

podla mna tam je len Chuck Norrisove telefonne cislo a jednoducho sa ho opytaju... preto zabera 100 Petabajtov...
Odpovedať Známka: 8.6 Hodnotiť:
 

Skus do googlu napisat "find chuck norris" a daj hladat pomocou "Skusim stastie"
Odpovedať Známka: 6.0 Hodnotiť:
 

Skor napis do googlu chuck norris search a hned prvy link :)
Odpovedať Známka: -1.4 Hodnotiť:
 

ja viem, ale takto je to vacsia sranda...
Odpovedať Známka: 8.0 Hodnotiť:
 

while (hladana_polozka != polozka.i){
i++;
}
Odpovedať Známka: 5.8 Hodnotiť:
 

edit: polozka[i]

( IT faux pas :( )
Odpovedať Známka: 7.4 Hodnotiť:
 

100 bodov mas. :D
Odpovedať Známka: 8.7 Hodnotiť:
 

a ked taka nieje, tak hlada do nekonecna?
i je vzdy od 0?
Odpovedať Známka: 0.0 Hodnotiť:
 

Neviem, skus skompilovat a potom napis co sa stalo.
Odpovedať Známka: 10.0 Hodnotiť:
 

neinicializoval si i :)
Odpovedať Známka: 10.0 Hodnotiť:
 

a vlastne ani nedefinoval ani nedeklaroval :), ale ak islo vylucne o cyklus, tak potom inicializacia nie je podstatna, ale nemusi byt od 0.
Odpovedať Hodnotiť:
 

databáza indexov sa zoradí pomocov tzv quicksort (asi najrýchlejší triediací algoritmus vôbec) a potom sa v nej vyhľadá za pomoci quick search (polynomické delenie)- tieto metódy využívyjú rekurzie...

Odpovedať Známka: -2.5 Hodnotiť:
 

v priemere najrychlejsi pri velkom pocte poloziek v subore
Odpovedať Známka: -3.3 Hodnotiť:
 

predpokladam ze pouzivaju dake prehladavacie stromy nieco taketo http://en.wikipedia.org/wiki/B_tree
Odpovedať Hodnotiť:
 

zabudni na B-Tree a skus pouzit na to google :-) alebo toto:

http://en.wikipedia.org/wiki/BigTable
http://www.baselinemag.com/c/a/ Infrastructure/How-Google-Works-1/
http://blogoscoped.com/archive/2005-10-23-n61.html
http://labs.google.com/papers/bigtable.html

Odpovedať Hodnotiť:
 

Prosím veľmi pekne, prestaňte przniť slovenčinu! Buď je niečo aktuálne, alebo neaktuálne. Nestupňujte slovo aktuálny!
Odpovedať Známka: -6.4 Hodnotiť:
 

si husty?
Odpovedať Známka: 7.1 Hodnotiť:
 

si hustejší?
Odpovedať Známka: 7.4 Hodnotiť:
 

si najhustejsi
Odpovedať Známka: 7.4 Hodnotiť:
 

si Chuck Norris?
Odpovedať Známka: 10.0 Hodnotiť:
 

som dlskár
Odpovedať Známka: -6.4 Hodnotiť:
 

som?
Odpovedať Známka: -1.4 Hodnotiť:
 

teda myslim
Odpovedať Známka: 2.0 Hodnotiť:
 

while (myslim)
som = true;
vek++;
myslim = func(vek);
)
Odpovedať Známka: 2.0 Hodnotiť:
 

dnesna predpoved pocasia je aktualnejsia ako ta vcerajsia, to znamena ze dnesna je aktualna a vcerajsia neaktualna, ale stale je aktualnejsia ;)
Odpovedať Známka: 9.3 Hodnotiť:
 

principalne s tebou suhlasim, ale pravidla slovenciny su take...co si pametam zo skoly
Odpovedať Známka: -8.7 Hodnotiť:
 

si z toho pametania celý pometený, pometenejší,vymetený
Odpovedať Známka: 8.2 Hodnotiť:
 

ja si pamätam ze slovo PAMäť sa pise s ä ...
Odpovedať Známka: 10.0 Hodnotiť:
 

Ja pouzivam aj optimalny, optimalnejsi ;)
Odpovedať Známka: 0.0 Hodnotiť:
 

ty si asi nestudoval automatizaciu a riadenie co?
Odpovedať Známka: 3.3 Hodnotiť:
 

podla mna je normalne v hovorovej reci pouzivat aktualnejsi, optimalnejsi...
predsa sme ludia, nie automaty
Odpovedať Známka: 1.4 Hodnotiť:
 

ty si este nedostal chip??? divne..
Odpovedať Známka: 10.0 Hodnotiť:
 

Najlepsie na tom je, ze ked som do slex.sk zadal slovo "przniť", tak jeho prvy vyznam znamena: "pohlavne zneucťovať, zneužívať"...
Odpovedať Známka: 7.1 Hodnotiť:
 

Neviem o tom, že by sa slovo aktuálny nemalo stupňovať. Pri slove ideálny, ktoré znamená najlepší, teda je už vystupňované, to chápem. Slovo aktuálny má, ako som podľa slovníkov našiel, význam naliehavý, časový. Teda v tom nevidím problém. Máte nejaké podklady, ktoré potvrdzujú Vaše slová?
Odpovedať Hodnotiť:
 

Sklonovat slovo aktualny byt bezne pouzivane. To slovo nebyt v slovnik slovensky jazyk, ale byt pouzivany napriklad na web JULS: http://goo.gl/tkvp
A ja mysliet, ze JULS by nepisat nespisovne na vlasny web.

:-))
Odpovedať Hodnotiť:
 

ale no tak, sme na IT serveri, nemozete napisat ze ma 100 Peta Bajtov?
Odpovedať Známka: 8.8 Hodnotiť:
 

Povodne chceli napisat 0,1 ET, ale bolo velke podozrenie ze ET si nikto nevysvetli ako exabajt, ale ako nieco uplne ine :-)
Odpovedať Známka: 7.5 Hodnotiť:
 

err.. asi si myslel EB :D
Odpovedať Známka: 10.0 Hodnotiť:
 

ja som si pod tym predstavil desatinu ET-ho z filmu "ET volá domov" :D
Odpovedať Známka: 6.0 Hodnotiť:
 

ja zas Eržiku Tomanovie :))
Odpovedať Známka: -1.1 Hodnotiť:
 

aj tak je to databaza plna porna.. po jeho odfiltrovani by sa ich databaza zmestila na dve dvd-cka :o)
Odpovedať Známka: 10.0 Hodnotiť:
 

Este som sa nevysporiadal s tou minulou zmenou a uz do toho zase kafraju. Neviem preco ale z nicoho nic mi zacalo do vysledkov site:SK davat stranky ktore dal niekto prelozit google translatorom. A dnes tie obrazky ma dorazili. Koncim idem na Bing. howgh;amen;end
Odpovedať Známka: -10.0 Hodnotiť:
 

Klamár!
Odpovedať Známka: 5.0 Hodnotiť:

Pridať komentár