Mimoriadne zaujímavý projekt reCAPTCHA predstavila vo štvrtok Carnegie Mellon University z Pittsburghu.
reCAPTCHA je implementáciou známého kontrolného mechanizmu CAPTCHA napríklad proti spamovaniu diskusií webových serverov, pri ktorom musí užívateľ rozpoznať z obrázka a zapísať v textovej podobe zhluk písmen, aby sa zabránilo prispievaniu spambotom.
Na rozdiel od bežných CAPTCHA implementácií reCAPTCHA negeneruje písmená náhodne, ale využíva prácu návštevníkov webových stránok na digitalizáciu skenovaných starších kníh.
V systéme reCAPTCHA totiž musí užívateľ prepísať dve slová, jedno zatiaľ neznáme pochádzajúce zo zoskenovaných kníh. Keďže systém nepozná prepis tohto slova, druhé je slovo s už známym prepisom, aby systém mohol overovať správnosť prepisu. Ktoré slovo je kontrolné nie je možné z obrázku rozlíšiť a tak sa užívateľ nemôže vyhnúť prepisu zatiaľ neznámeho slova, ktoré sa na kontrolu nepoužíva.
Každé neznáme slovo bude použité u viacerých užívateľov, aby sa vylúčil omyl pri prepise.
reCAPTCHA box použitý na stránke
Podľa tlačovej správy univerzity sa denne na celom Internete používa CAPTCHA približne 60 miliónov krát, čo predstavuje pri desiatich sekundách na jeden prepis približne 150 000 hodín práce.
Službu reCAPTCHA pomocou dostupného API môžu používať zdarma web stránky pre ochranu proti spambotom, ich návštevníci budú súčasne prispievať k digitalizácii kníh. V súčasnosti sú v projekte digitalizované anglické knihy z archive.org.
Počet slov priemernej knihy sa pohybuje na úrovni 80 000. Ak je každé slovo pre kontrolu prepisované priemerne dvakrát, za deň by všetkých 60 miliónov prepisov pomocou rozličných CAPTCHA systémov umožnilo zdigitalizovať rádovo 360 kníh.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
rE3wZ
Od: rE3wZ
|
Pridané:
25.5.2007 11:53
No... myslim ze toto je jednoznacne plus v tejto sfere. Spojene prakticke s uzitocnym.
Iba ze par ludi dostane vypoved :)
|
|
doktor
Od: doktor
|
Pridané:
25.5.2007 12:16
a urcite to funguje aj v OPERE
|
|
wave
Od: wave
|
Pridané:
25.5.2007 12:38
najzaujimavejsia vec tento tyzden...
len ci nieje to skenovanie a dalsia uprava "fotky" narocnejsia ako samotne naskenovanie a rozpoznavanie celich stranok v specialnych programoch.. napriklad MSword :D
|
|
tom
Od: tom
|
Pridané:
25.5.2007 12:41
nie je. posekanie na riadky a priblizne oblasti slov sa da spravit 20 riadkovym programom automaticky bez problemov
najma stare knihy mozes OCR-kovat ale len rucne, ked automatika ti mozno aj tretinu slov nerozpozna
|
|
crusty
Od: crusty
|
Pridané:
25.5.2007 13:43
presne, oskenovať je to veľmi jednoduché..myslím, že toto je perfektný nápad a fakt veľmi to pomôže
|
|
wave
Od: wave
|
Pridané:
25.5.2007 16:06
oK... :)
s tou tretinou slov si to celkom trafil :P
|
|
qaws
Od: qaws
|
Pridané:
25.5.2007 13:45
Tu je vidiet, ze prve slovo je oscanovane ;-).
|
|
aaaaa
Od: aaaaa
|
Pridané:
25.5.2007 14:03
trt
obe slova su oskenovane
ale jedno z ich uz je "zname" v digitalnej podobe (uz je overene).
|
|
Beli
Od: Beli
|
Pridané:
25.5.2007 14:12
LOL
|
|
Uhlik
Od: Uhlik
|
Pridané:
25.5.2007 14:15
a budu tie knihy potom dostupne zadarmo na webe alebo len niekomu usetria uzivatelia pekny balik penazi ? ...
|
|
Pa3k
Od: Pa3k
|
Pridané:
25.5.2007 14:38
LOL, vcelku dobra pripomienka :) ale tak zas sa nemozme na vsetko pozerat iba z tejto stranky... teba to nezabije, pretoze by si tam tak ci tak nieco zadaval a ked to niekomu pomoze... snad sa to vrati niekomu inemu.
Inak, ako uz bolo spomenute, asi najlepsia sprava tohto tyzdna, velmi uzitocna vec. spojenie "uzitocneho a uzitocneho" :)
btw - mali by o takom niecom pouvazovat aj ludia, ktori zastresuju zlaty fond zo sme.sk - btw - je to ozaj vynikajuci projekt - vcera som cital mamku postkovu :) aj som celkom pochopil preco od nas chceli na ZS ci SS aby sme si to precitali :)
|
|
wave
Od: wave
|
Pridané:
25.5.2007 16:05
na webe je vsetko zadarmo :D
|
|
Propediotika
Od: Propediotika
|
Pridané:
25.5.2007 19:27
Pripoji sa k pouzivaniu tohto systemu aj server dsl.sk ? :)
|
|
Bozz
Od: Bozz
|
Pridané:
25.5.2007 21:39
no to by aj mna zaujimalo a bol by som velmi rad...
|
|
pravda
Od: pravda
|
Pridané:
26.5.2007 16:51
x-krat sme tu uz viaceri ziadali od adminov dsl.sk aby zaviedli nejaku formu ochrany proti spambotom. a stale nic. a teraz citam clanok kde to je spominane. je mi na smiech z celeho dsl.sk . uz sa uvedomte a rieste uz konecne spambotov.dakujem ja a urcite aj ostatni citatelia ktorych uz nebavi citat v diskusiach debilne spambot prispevky.
|
|
Bozz
Od: Bozz
|
Pridané:
27.5.2007 13:22
OMG ty ich citas? :D
|
|
Bozz
Od: Bozz
|
Pridané:
27.5.2007 12:29
Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera ! Opera !
|
|
Moshennic
Od: Moshennic
|
Pridané:
18.7.2007 11:39
<a href=http://www.exchange-on-line.com> Ěîřĺííčę. Âńĺ âčäű ěîřĺííč÷ĺńňâŕ. Îáěŕí íŕ ýëĺęňđîííűő âŕëţňŕő. </a>
Ęîíňŕęňű: info@exchange-on-line.com director22@yandex.ru Alpk83@yahoo.com
|
|
Moshennic
Od: Moshennic
|
Pridané:
18.7.2007 13:19
<a href=http://www.exchange-on-line.com> Ěîřĺííčę. Âńĺ âčäű ěîřĺííč÷ĺńňâŕ. Îáěŕí íŕ ýëĺęňđîííűő âŕëţňŕő. </a>
Ęîíňŕęňű: info@exchange-on-line.com director22@yandex.ru Alpk83@yahoo.com
|
|
Moshennic
Od: Moshennic
|
Pridané:
18.7.2007 16:17
<a href=http://www.exchange-on-line.com> Ěîřĺííčę. Âńĺ âčäű ěîřĺííč÷ĺńňâŕ. Îáěŕí íŕ ýëĺęňđîííűő âŕëţňŕő. </a>
Ęîíňŕęňű: info@exchange-on-line.com director22@yandex.ru Alpk83@yahoo.com
|