Spoločnosť Google vyvinula algoritmus, ktorý dokáže s mimoriadne vysokou úspešnosťou rozpoznávať zle čitateľný text a je účinný na obchádzanie systémov CAPTCHA pre odlíšenie ľudí od softvérových robotov aj rozpoznanie čísiel domov zo snímok ulíc.
Google to oznámil v stredu.
Spoločnosť sa vývojom efektívneho algoritmu na čítanie textu zaoberala najmä kvôli svojim mapovým produktom, pre ktoré pomocou algoritmov detekuje čísla domov z panoramatických snímok ulíc Street View a následne tak pozná presnú polohu jednotlivých adries.
Nový algoritmus, ktorý vyvinula v uplynulom roku, využíva neurónovú sieť. Kým predchádzajúce podobné algoritmy fungovali v troch oddelených fázach a realizovali postupne lokalizáciu, segmentáciu a nakoniec rozpoznávanie, algoritmus Google integruje všetky tieto kroky a jeho neurónová sieť pracuje priamo nad pixelmi analyzovaných obrázkov.
Po natrénovaní táto sieť dosahuje viac ako 90% úspešnosť rozpoznávania čísiel domov zo Street View snímok.
Na rozpoznávanie čísiel domov Google využíva od marca 2012 aj užívateľov jeho CAPTCHA systému reCaptcha, v ktorom musí užívateľ prepísať dva texty. Jeden musí byť pre overenie užívateľa prevádzkovateľovi systému známy, druhý môže byť ale zatiaľ nerozpoznaný text. Pôvodne sa reCaptcha využíval na rozpoznávanie textov z kníh nerozpoznateľných spoľahlivo OCR softvérom.
Čísla domov úspešne rozpoznané algoritmom (obrázok: Google)
Nový algoritmus je okrem rozpoznávania čísiel domov zároveň mimoriadne úspešný aj na rozpoznanie textu v systémoch CAPTCHA, ktorý je úmyselne deformovaný pre sťaženie jeho rozpoznania softvérom a ktorý sa používa napríklad na ochranu služieb pred spamermi. U známych umelo deformovaných textov, ktoré Google do konca októbra minulého roka používal u svojho systému reCaptcha využívaného aj mnohými inými stránkami, dosiahol algoritmus úspešnosť 99.8%.
Texty z reCaptcha úspešne rozpoznané algoritmom (obrázok: Google)
V októbri spoločnosť reCaptcha zmenila s odvolaním sa na všeobecné zlepšenie algoritmov umelej inteligencie v poslednom období. Texty ale nesťažila ale naopak prekvapivo zjednodušila s tým, že zlepšila respektíve pridala ďalšie spôsoby rozpoznania softvérových robotov, napríklad analýzy interakcie užívateľa s CAPTCHA.
Zároveň niekoľko dní po zmene americký startup Vicarious oznámil vyvinutie algoritmu, ktorý rieši viaceré populárne systémy CAPTCHA pre odlíšenie ľudí od softvérových robotov s úspešnosťou "do 90%".
Google popisuje nový algoritmus v tomto odbornom článku.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
cislo
Od: nonke
|
Pridané:
17.4.2014 8:56
na nasom baraku isto ze nie, lebo ani nemame cislo na nej :D
|
|
algoritmus
Od: lal
|
Pridané:
17.4.2014 9:04
som myslel ze tie cisla domov sme im prepisovali my v ramci re-captcha..
|
|
Re: algoritmus
Od: lawl
|
Pridané:
17.4.2014 9:28
v tom pripade bude minimalne polovica cisel "penis" alebo "nigger".
|
|
Re: algoritmus
Od: vgrdghhbh
|
Pridané:
17.4.2014 13:10
Nigger bol niekedy zakazany (raz som mal v obrazku naozaj nigger a ani toho to nevzalo).
|
|
Re: algoritmus
Od: Cpx
|
Pridané:
17.4.2014 13:21
Neviem ako ty ale ja stale pisem jksdivhi nigger a vzdy to zoberie ako spravnu moznost. Nigger everything!
|
|
Re: algoritmus
Od: Janka12
|
Pridané:
17.4.2014 11:28
prepisovali, preto ta uspesnost iba 90% :)
|
|
Re: algoritmus
Od: Mumsitio
|
Pridané:
17.4.2014 12:42
Ja som nikdy nedaval spracne data na tie cisla. Ale vzdy som tam pisal zle cisla. Ale zatial mi to vzdy preslo.
|
|
Re: algoritmus
Od: Cpx
|
Pridané:
17.4.2014 13:22
Nejde o to ci das zle cislo, ide o to aby vsetci davali rovnaku blbost, napriklad cislo domu je 98 a ty das ze nigger. Ked kazdy bude pisat nigger na vsetko, tak mozu vzniknut zaujimave vysledky. :D
|
|
Re: algoritmus
Od: nobl nigga
|
Pridané:
17.4.2014 13:46
aj vznikli - v niektorych publikaciach si mal rozne zaujimave 'nigger' spojenia. potom prisla cenzura.
|
|
Re: algoritmus
Od: xvzf
|
Pridané:
17.4.2014 17:18
tak myslim ze aj na to maju nejaku detekciu ;)
|
|
Great thinikng! That
Od: Alisha
|
Pridané:
5.7.2014 15:18
Great thinikng! That really breaks the mold!
|
|
gfss Ee
Od: SDffdgth
|
Pridané:
17.4.2014 9:22
"účinný na obchádzanie systémov CAPTCHA pre odlíšenie ľudí od softvérových robotov" preto radsej do formularov na web dam otazku treti den v tyzdni a podobne, namiesto captchy.
|
|
Re: gfss Ee
Od: dimitrij
|
Pridané:
17.4.2014 9:37
zoznam otazok mas uzavrety? lebo captach ma extremne vela kombinacii, tolko otazok ty nenapises.
|
|
Re: gfss Ee
Od: dimitrij
|
Pridané:
17.4.2014 9:37
sorry za preklep v slove captcha
|
|
Re: gfss Ee
Od: Roztopasniik
|
Pridané:
17.4.2014 11:38
Neprepacim.
|
|
Re: gfss Ee
Od reg.: yanick
|
Pridané:
17.4.2014 13:24
Nepresorrym, dam viac korenia
|
|
Re: gfss Ee
Od: fiko nevolik
|
Pridané:
17.4.2014 9:38
lenze ta otazka je na chuja potom, lebo nie vsade zacina tyzden rovnakym dnom.
|
|
Re: gfss Ee
Od: p12
|
Pridané:
17.4.2014 11:17
To nevadi, ale na strane servera vies vyratat, ze aky den je prvy den v tyzdni v danom tyzdni, a uzivatel vie vyratat tiez. Asi je to uz potom dost tazko rozoznatelne cez captcha solvery.
|
|
slusne
Od: meno uz je zaregistrovane
|
Pridané:
17.4.2014 9:44
Bistu, to je ten algoritmus v rieseni captche 2x lepsi, nez ja :D
|
|
Re: slusne
Od reg.: Twixie
|
Pridané:
17.4.2014 23:47
Osobne mám na reCaptcha úspešnosť tak cca 60%. To už je skôr ochrana pred luďmi ako ochrana pred robotmi.
|
|
odveci
Od reg.: ccccc
|
Pridané:
17.4.2014 9:51
nejake api by nebolo odveci :)
|
|
bikjulovinoviak
Od: sparta999
|
Pridané:
17.4.2014 11:00
system PITCHA neojebe nikto, ani gugel s jeho agoritmáma, tento system vyvinul Janko Oresak z juznych Vestenic a pri tvorbe tohto algoritmu sa nechal inspirovat prirodow
|
|
Re: bikjulovinoviak
Od: Dávač dnuka
|
Pridané:
17.4.2014 11:05
A maslovú cicinu s lekvárom by si nechcel?
|
|
Re: bikjulovinoviak
Od reg.: joziiiiii
|
Pridané:
17.4.2014 11:16
tag to jie gravina aja to rososnam
|
|
Re: bikjulovinoviak
Od: sparta999
|
Pridané:
17.4.2014 11:35
to je bozie, sami inteligenti, ked to takto pojde dalej Slovensko sa pretransmutuje na kralovstvo troch prutoch svatoplukovoch a setci budeme stastni
|
|
Re: bikjulovinoviak
Od: Majky333
|
Pridané:
17.4.2014 11:44
Ale treba uznať že na dsl.sk je jediné fórum, ktoré sa dá čítať. Skôr mi to pripadá že sa tu zišla väčšina skutočných inteligentov, ktorým nerobí problém urobiť si prču aj zo seba samých... :)
|
|
Re: bikjulovinoviak
Od reg.: yanick
|
Pridané:
17.4.2014 13:22
Sak baca Ondro z Juznych Vestenic hovoriu, ze si na velku noc si da velkonocneho barana ... chlapi k krcme hovorili, ze ovca je lepsia ako koza ... ale barana??
|
|
Deteguje
Od: Mr.G
|
Pridané:
17.4.2014 13:17
Už by sa to v redakcii mohli naučiť písať - deteguje.
|
|
Re: Deteguje
Od: AceRunner
|
Pridané:
29.4.2014 17:44
To iste - Ty detegtiv!
|
|
hmmm?
Od: pavol f
|
Pridané:
17.4.2014 16:15
Nerozumiem vobec o co tu ide. Posledne roky musim vsade pisat nejake blbosti aby som sa pohol dalej. Potom kukam ze to koli ochrane pred robotmi. Moze mi to niekto vysvetlit? Sak neni matrix. Moji roboti mi doma vysavaju a sekaju kapustu, ze by chodili na internet pochybujem. Alebo ide o ochranu pred tymi japonskymi co aj tancuju? Nechapem. Sak ked ten chudak chce poslat mail tak nech posle ne? Sak by mu to aj tak trvalo hodinu ked tak na nich kukam... Zbytocna paranoja podla mna
|
|
Re: hmmm?
Od reg.: yanick
|
Pridané:
17.4.2014 17:12
No sak, ale mas k domu dovedene kolajnice, aby ti mohli vozik kapustu vo vagonoch?
Povysavaju, dosekaju kapustu a potom sa nudia. A ked si neni doma, tak vypisuju po forach, ze "Kupte si viagru", vraj emancipacia, aj oni chcu zarabat, pche.
Ale najhorsie je to, ze pretoze vacsina pochadza z Ciny, tak sudruhovia setrili na RAM-ke a chudak robot zabudne, za uz na forum napisal, tak napise znova a znova a znova.
Potom su toho plne fora a ja som si musel kupit uz 8. garaz, aby som mal tu viagru kde skladovat. Ide to celkom do penazi, ale skusim zavolat do Malajzie, vraj maju volnu hangar, tak skusim kupit :-)
|
|
Re: hmmm?
Od reg.: yanick
|
Pridané:
17.4.2014 17:18
A ked nepredaju, tak vsetku zakopem do zakladov sikmej veze v Pise ... aspon sa stopori a taliani budu mat Burj Khalifa v Pise, kua
|