DSL.sk - Google začína indexovať aj webové formuláre

neprihlásený

Streda, 1. júla 2026, dnes má meniny Diana

Google začína indexovať aj webové formuláre

DSL.sk, 13.4.2008

Spoločnosť Google aktuálne informovala o rozšírení množstva indexovaných informácií o automatické prehľadávanie stránok získaných po odoslaní formulárov na webových stránkach.

Doteraz zostávali stránky s informáciami, ku ktorým sa bolo možné dostať len cez webové formuláre, pre hlavnými vyhľadávačmi skryté.

Indexovanie webových formulárov odštartoval Google postupne pred niekoľkými mesiacmi. Textové políčka dopĺňa výrazmi generovanými z textov stránok, na ktorých sa formulár nachádza, u políčok typu checkbox a radio a výberu z viacerých preddefinovaných možností SELECT tagom volí a skúša jednotlivé možnosti.

Ak výslednú stránku získanú odoslaním formulára vyhodnotí prehľadávací robot Google ako platnú, zaradí ju do indexu.

Google zatiaľ informácie dostupné cez formuláre indexuje len na časti stránok a to iba v prípade GET formulárov. Indexované nie sú ani formuláre obsahujúce políčko s heslom ani políčka, ktoré by podľa vyhodnotenia Google mohli byť napríklad prihlasovacím menom alebo iným jednoznačným ID.

Prehľadávací robot rešpektuje súbor robots.txt a výsledné stránky po odoslaní formulára nezaindexuje ani v prípade, že ich robots.txt nezakazuje indexovať ale zakazuje indexovať samotnú stránku s formulárom.

Podľa Google cez formuláre by malo byť dostupné veľké množstvo nových informácií, ktoré boli doteraz vyhľadávačom nedostupné. O aké množstvo v porovnaní s doterajším množstvom indexovaných informácií by malo ísť ale spoločnosť nespresnila, podľa niektorých odhadov je ale množstvo informácií dostupných cez HTTP a nezaindexovaných vyhľadávačmi výrazne väčšie ako množstvo informácií zaindexovaných vyhľadávačmi.

Najnovšie články:

	Vo Veľkom hadrónovom urýchľovači sa zvýši množstvo zrážok, bude odstavený štyri roky
	WhatsApp spúšťa používateľské mená namiesto zdieľania čísla, dajú sa rezervovať
	Elektrárne začali štvrtý blok Mochoviec napĺňať jadrovým palivom
	Na Slovensku namerané historické teploty, Slovenský hydrometeorologický ústav má rozsiahly IT výpadok
	Cena elektriny v SR zajtra prekročí 75 centov za kWh
	Telekom vypne 2G sieť, alarmy budú mať smolu
	Maximálna spotreba nových Intel CPU má byť až 474 Wattov
	SpaceX si postaví plynovod na tankovanie Starship
	Apple výrazne zdražila počítače a tablety
	SpaceX plánuje byť mobilným operátorom z vesmíru

Diskusia:

Trochu drze
Od reg.: Uhlik | Pridané: 13.4.2008 13:01

>Prehľadávací robot rešpektuje súbor robots.txt
>a výsledné stránky po odoslaní formulára
>nezaindexuje ani v prípade, že ich robots.txt
>nezakazuje indexovať ale zakazuje indexovať
>samotnú stránku s formulárom.

To mi pride trochu drze, pretoze ak zakazem stranku s formularom, tak si nezelam, aby ho vobec odosielal a nie ze len ho po odolani nezaindexuje ... Moze to skreslit statistiky vyhladavania, ak na stranke pouziva formular vyhladavania GET metodu alebo ak je niekto lama a ma cez GET rieseny formular na knihu navstev alebo nieco podobne, tak tam bude mat kopu spamu od Googlu aj napriek nastaveniu robots.txt, aj ked na druhej strane je velmi malo pravdepodobne, ze by taka lamka mala vobec nastaveny robots.txt :) ...

Odpovedať Známka: -2.0 Hodnotiť:

Re: Trochu drze
Od: sup2 | Pridané: 13.4.2008 20:44

Preco by mal byt niekto lama zato ze pouziva GET? Myslis si, ze pouzivanie GET nema zmysel? Robil si uz WAP stranky? ak ano skusil si poslat nieco POSTom a nasledne to presmerovat HEAD requestom? Este k tomu si na tejto stranke s s telefonom, ktory ma tieto veci dost krkolomne osetrene (niektore nokie). Stane sa to, ze ti telefon zacne vyhadzovat varovnu hlasku a nepohnes sa dalej.
Ja kde sa len da pouzivam POST, ale v niektorych situaciach to nejde, takze by som tieto "lamy" nezatracoval za nieco o com nemas ponatia.
Imho, skus nieco vyhladat priamo cez google a pozri URL, to su lamy co? tiez pouzivaju GET...
S prvym nazorom suhlasim, tiez si nezelam aby google generoval plno jaloveho trafficu odosielanim mojich formularov, ale myslim si, ze to nejako osetria proti odosielaniu na rozne fora, atd. V opacnom pripade by google posobil podobne ako spambooty, ktorych je neurekom a proti ktorym sa vie branit aj hocijaka lama captcha obrazkami.

Odpovedať Známka: 10.0 Hodnotiť:

Re: Trochu drze
Od: D0391 | Pridané: 13.4.2008 20:57

Lama je ten, co pouziva GET tam kde sa to nema ... niektori nevedia rozlisit kedy pouzit GET a kedy POST
Ak niekto pouzije GET pri zasielani prispevku do diskusneho fora pripadne pri web-to-email formulari, tak je to jednoznacne LAMA s velkym L

Odpovedať Známka: 6.0 Hodnotiť:

afaik
Od: remuf | Pridané: 13.4.2008 13:06

Zaindexovane su priblizne 3 percenta zo stranok "na povrchu" webu a okolo 0,1 percenta "z hlbin" webu. ;-)

Odpovedať Hodnotiť:

Re: afaik
Od reg.: triggerhippik | Pridané: 13.4.2008 13:33

je ich ovela viac ty tulen, kolkokrat si uz hladal nieco napr. v cinstine?

Odpovedať Hodnotiť:

Re: afaik
Od reg.: 807_7_ | Pridané: 13.4.2008 13:51

alebo v Svahliščine?

Odpovedať Hodnotiť:

Re: afaik
Od reg.: Danone | Pridané: 13.4.2008 14:01

Svahilcine si chcel povedat ty konov brat.

Odpovedať Známka: 6.7 Hodnotiť:

Re: afaik
Od reg.: 807_7_ | Pridané: 13.4.2008 20:07

Kazdi normalni pochopil

Odpovedať Známka: -7.1 Hodnotiť:

Re: afaik
Od: 345353 | Pridané: 14.4.2008 1:39

Ze si konov brat?

Odpovedať Známka: 6.0 Hodnotiť:

Re: afaik
Od reg.: Kveri | Pridané: 13.4.2008 17:13

a to mas odkial take vysoke cisla? podla mna to nie je ani 1%

Odpovedať Známka: 3.3 Hodnotiť:

Re: afaik
Od: remuf | Pridané: 13.4.2008 17:54

Samozrejme ze to spolu nie je ani 1 percento. Za tzv povrch webu sa povazuje asi tak 0,1 - 0,5 percenta vsetkeho obsahu na webe.

Aj ked treba poznamenat ze data/informacie ktore su na povrchu su casto viac relevantne resp aktualne.

Odpovedať Hodnotiť:

fgxjghk
Od reg.: SonnY(The One) | Pridané: 13.4.2008 14:52

Super, dalsi spambot. Len to sme potrebovali.

Odpovedať Známka: 0.0 Hodnotiť:

Re: fgxjghk
Od reg.: K-NinetyNine | Pridané: 13.4.2008 20:26

"Indexované nie sú ani formuláre obsahujúce políčko s heslom ani políčka, ktoré by podľa vyhodnotenia Google mohli byť napríklad prihlasovacím menom alebo iným jednoznačným ID."

v komentoch, forach a pod je prezyvka, co sa da povazovat za ID, pri formularoch odosielajucich e-mail (objednavkove formulare a podobne) je takych ID poli viac, cize toto google neodosiela!!!

nevravim, je mozne ze sa moze objavit zo zaciatku nejake promile specifickych pripadov ked to robi neplechu ale promile je prilis male cislo a casom si myslim ze aj toto sa spravi...

Odpovedať Známka: 3.3 Hodnotiť:

zdroj
Od: anonym123465 | Pridané: 13.4.2008 23:13

takato sprava vychadza kazdy rok.. Odkial mate zdroj? Takato informacia by bola urcite na oficialnom google webmaster blogu.

Odpovedať Hodnotiť:

Re: zdroj
Od reg.: Redakcia DSL.sk | Pridané: 14.4.2008 10:23

Zdroj je v článku nalinkovaný a jasne označený "Spoločnosť Google aktuálne informovala...", linka smeruje práve na Webmaster Central Blog...

Odpovedať Hodnotiť:

\"Spambot\"
Od reg.: _Kozec_ | Pridané: 14.4.2008 9:40

Naozaj neviem, co sa rozculujete. GoogleBot sa sam identifikuje cez User-agent header a nieje problem jeho "prispevky" vyfiltrovat.

Odpovedať Hodnotiť:

Pridať komentár