
neprihlásený
|
Piatok, 1. mája 2026, dnes je Sviatok práce |
|
|
Google začína indexovať aj webové formuláre
DSL.sk, 13.4.2008
|
|
Spoločnosť Google aktuálne informovala o rozšírení množstva indexovaných informácií o automatické prehľadávanie stránok získaných po odoslaní formulárov na webových stránkach.
Doteraz zostávali stránky s informáciami, ku ktorým sa bolo možné dostať len cez webové formuláre, pre hlavnými vyhľadávačmi skryté.
Indexovanie webových formulárov odštartoval Google postupne pred niekoľkými mesiacmi. Textové políčka dopĺňa výrazmi generovanými z textov stránok, na ktorých sa formulár nachádza, u políčok typu checkbox a radio a výberu z viacerých preddefinovaných možností SELECT tagom volí a skúša jednotlivé možnosti.
Ak výslednú stránku získanú odoslaním formulára vyhodnotí prehľadávací robot Google ako platnú, zaradí ju do indexu.
Google zatiaľ informácie dostupné cez formuláre indexuje len na časti stránok a to iba v prípade GET formulárov. Indexované nie sú ani formuláre obsahujúce políčko s heslom ani políčka, ktoré by podľa vyhodnotenia Google mohli byť napríklad prihlasovacím menom alebo iným jednoznačným ID.
Prehľadávací robot rešpektuje súbor robots.txt a výsledné stránky po odoslaní formulára nezaindexuje ani v prípade, že ich robots.txt nezakazuje indexovať ale zakazuje indexovať samotnú stránku s formulárom.
Podľa Google cez formuláre by malo byť dostupné veľké množstvo nových informácií, ktoré boli doteraz vyhľadávačom nedostupné. O aké množstvo v porovnaní s doterajším množstvom indexovaných informácií by malo ísť ale spoločnosť nespresnila, podľa niektorých odhadov je ale množstvo informácií dostupných cez HTTP a nezaindexovaných vyhľadávačmi výrazne väčšie ako množstvo informácií zaindexovaných vyhľadávačmi.
Najnovšie články:
Diskusia:
| |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| |
Trochu drze
Od reg.: Uhlik
|
Pridané:
13.4.2008 13:01
>Prehľadávací robot rešpektuje súbor robots.txt
>a výsledné stránky po odoslaní formulára
>nezaindexuje ani v prípade, že ich robots.txt
>nezakazuje indexovať ale zakazuje indexovať
>samotnú stránku s formulárom.
To mi pride trochu drze, pretoze ak zakazem stranku s formularom, tak si nezelam, aby ho vobec odosielal a nie ze len ho po odolani nezaindexuje ... Moze to skreslit statistiky vyhladavania, ak na stranke pouziva formular vyhladavania GET metodu alebo ak je niekto lama a ma cez GET rieseny formular na knihu navstev alebo nieco podobne, tak tam bude mat kopu spamu od Googlu aj napriek nastaveniu robots.txt, aj ked na druhej strane je velmi malo pravdepodobne, ze by taka lamka mala vobec nastaveny robots.txt :) ...
|
| |
Re: Trochu drze
Od: sup2
|
Pridané:
13.4.2008 20:44
Preco by mal byt niekto lama zato ze pouziva GET? Myslis si, ze pouzivanie GET nema zmysel? Robil si uz WAP stranky? ak ano skusil si poslat nieco POSTom a nasledne to presmerovat HEAD requestom? Este k tomu si na tejto stranke s s telefonom, ktory ma tieto veci dost krkolomne osetrene (niektore nokie). Stane sa to, ze ti telefon zacne vyhadzovat varovnu hlasku a nepohnes sa dalej.
Ja kde sa len da pouzivam POST, ale v niektorych situaciach to nejde, takze by som tieto "lamy" nezatracoval za nieco o com nemas ponatia.
Imho, skus nieco vyhladat priamo cez google a pozri URL, to su lamy co? tiez pouzivaju GET...
S prvym nazorom suhlasim, tiez si nezelam aby google generoval plno jaloveho trafficu odosielanim mojich formularov, ale myslim si, ze to nejako osetria proti odosielaniu na rozne fora, atd. V opacnom pripade by google posobil podobne ako spambooty, ktorych je neurekom a proti ktorym sa vie branit aj hocijaka lama captcha obrazkami.
|
| |
Re: Trochu drze
Od: D0391
|
Pridané:
13.4.2008 20:57
Lama je ten, co pouziva GET tam kde sa to nema ... niektori nevedia rozlisit kedy pouzit GET a kedy POST
Ak niekto pouzije GET pri zasielani prispevku do diskusneho fora pripadne pri web-to-email formulari, tak je to jednoznacne LAMA s velkym L
|
| |
afaik
Od: remuf
|
Pridané:
13.4.2008 13:06
Zaindexovane su priblizne 3 percenta zo stranok "na povrchu" webu a okolo 0,1 percenta "z hlbin" webu. ;-)
|
| |
Re: afaik
Od reg.: triggerhippik
|
Pridané:
13.4.2008 13:33
je ich ovela viac ty tulen, kolkokrat si uz hladal nieco napr. v cinstine?
|
| |
Re: afaik
Od reg.: 807_7_
|
Pridané:
13.4.2008 13:51
alebo v Svahliščine?
|
| |
Re: afaik
Od reg.: Danone
|
Pridané:
13.4.2008 14:01
Svahilcine si chcel povedat ty konov brat.
|
| |
Re: afaik
Od reg.: 807_7_
|
Pridané:
13.4.2008 20:07
Kazdi normalni pochopil
|
| |
Re: afaik
Od: 345353
|
Pridané:
14.4.2008 1:39
Ze si konov brat?
|
| |
Re: afaik
Od reg.: Kveri
|
Pridané:
13.4.2008 17:13
a to mas odkial take vysoke cisla? podla mna to nie je ani 1%
|
| |
Re: afaik
Od: remuf
|
Pridané:
13.4.2008 17:54
Samozrejme ze to spolu nie je ani 1 percento. Za tzv povrch webu sa povazuje asi tak 0,1 - 0,5 percenta vsetkeho obsahu na webe.
Aj ked treba poznamenat ze data/informacie ktore su na povrchu su casto viac relevantne resp aktualne.
|
| |
fgxjghk
Od reg.: SonnY(The One)
|
Pridané:
13.4.2008 14:52
Super, dalsi spambot. Len to sme potrebovali.
|
| |
Re: fgxjghk
Od reg.: K-NinetyNine
|
Pridané:
13.4.2008 20:26
"Indexované nie sú ani formuláre obsahujúce políčko s heslom ani políčka, ktoré by podľa vyhodnotenia Google mohli byť napríklad prihlasovacím menom alebo iným jednoznačným ID."
v komentoch, forach a pod je prezyvka, co sa da povazovat za ID, pri formularoch odosielajucich e-mail (objednavkove formulare a podobne) je takych ID poli viac, cize toto google neodosiela!!!
nevravim, je mozne ze sa moze objavit zo zaciatku nejake promile specifickych pripadov ked to robi neplechu ale promile je prilis male cislo a casom si myslim ze aj toto sa spravi...
|
| |
zdroj
Od: anonym123465
|
Pridané:
13.4.2008 23:13
takato sprava vychadza kazdy rok.. Odkial mate zdroj? Takato informacia by bola urcite na oficialnom google webmaster blogu.
|
| |
Re: zdroj
Od reg.: Redakcia DSL.sk
|
Pridané:
14.4.2008 10:23
Zdroj je v článku nalinkovaný a jasne označený "Spoločnosť Google aktuálne informovala...", linka smeruje práve na Webmaster Central Blog...
|
| |
\"Spambot\"
Od reg.: _Kozec_
|
Pridané:
14.4.2008 9:40
Naozaj neviem, co sa rozculujete. GoogleBot sa sam identifikuje cez User-agent header a nieje problem jeho "prispevky" vyfiltrovat.
|
Pridať komentár
|
|
|
|