Spoločnosť Google, ktorá čoraz intenzívnejšie využíva metódy umelej inteligencie a strojového učenia, aktuálne využila takéto technológie na výrazné zlepšenia čítania komiksov na mobilných zariadeniach.
Komiksy sú typicky kreslené na stranách formátu až cca 18 cm x 27 cm a pri zobrazovaní na bežných mobilných zariadeniach, najmä smartfónoch ale aj menších tabletoch, sú tak texty v bublinách vzhľadom na ich malú veľkosť slabo čitateľné až nečitateľné.
Užívatelia ich bežne tak čítajú nepohodlne so zoomovaním a posúvaním sa po jednej stránke bez toho, aby videli celý obrázok.
Google teraz nasadil technológiu strojového učenia, ktorá v obrázkoch komiksov identifikuje jednotlivé bubliny s textom a užívateľovi ich postupne pri čítaní zväčšuje. Naraz je zväčšená jedna bublina, pričom posúvať sa na ďalšie je možné tlačidlom hlasitosti.
Bublina s textom identifikovaná a zväčšená novou technológiou Bubble Zoom, kliknite pre zväčšenie (obrázok: Google)
Technológia bola pod označením Bubble Zoom pridaná do aplikácie Google Play Books pre čítanie kníh na Androide. Google detaily použitej technológie nezverejnil, veľmi častou metódou strojového učenia používanou aj v Google sú ale neurónové siete. Oznámenie Google naznačuje ich použitie aj v tomto prípade, keď hovorí o natrénovaní systému na identifikáciu bublín. Či je identifikácia bublín následne realizovaná priamo v aplikácii alebo na serveroch spoločnosti Google neuvádza.
Ukážka fungovania Bubble Zoom (video: Google)
Technológia je zatiaľ funkčná pre anglické verzie komiksov od Marvelu a DC, do budúcnosti Google ale avizuje jej rozšírenie na ľubovoľné komiksy vrátane japonských komiksov manga.
Na čoraz intenzívnejšie využívanie umelej inteligencie spoločnosťou Google sme upozornili už v máji, keď spoločnosť jasne deklarovala ako dôležité technológie do budúcnosti technológie umelej inteligencie a strojového učenia. Google si dokonca na akceleráciu výpočtov vyvinul vlastný procesor pre umelú inteligenciu, Tensor Processing Unit, TPU.
Re: to vazne
Od: karolkooooo
|
Pridané:
22.7.2016 12:30
Na to treba umelu inteligenciu??? Nemyslim si, ze je tazke nakodit algoritmus, ktory najde elipsu s ciernym okrajom, bielym pozadim a vnutri je nejaky text...
Re: to vazne
Od: knjiCdo
|
Pridané:
22.7.2016 18:24
Jak som písal nižšie, nie vždy je to elipsa, nie vždy je to biele pozadie, nie vždy je to čierny hrubý okraj. Ale to všetko mimo, pozeral si to video? Podľa tej ukážky ten algoritmus aj sleduje poradie bublín v akom majú byť zobrazované. Nie je to len o tom nájsť tie dialógy, ale aj vyberať tie správne. Všeobecne by sa dal použiť algoritmus že prvý z hora zľava, ale nie vždy. Tiež je dobré spomenúť, že komix môže byť aj čiernobiely, a potom v spojení s ostatnými problémami je to zložité pre bežné algoritmy. NN sú rýchle a veľmi presné, dá sa to do určitej mieri spraviť aj bez NN, ale bude to zložitejšie, pomalšie a nepresnejšie, tak prečo?
Nejde na to takyto jednoduchy algoritmus?
Od: aaaaaaaaaaaaaaa
|
Pridané:
22.7.2016 10:54
Na toto podla mna neuronky nie su treba. V komixoch, ktore poznam, su to jedine biele casti okrem rozdeleni obsahujuce nieco cierne (pismena). Naviac maju specificky tvar.
Algoritmus by som popisal jednoducho - postupuj z laveho horneho rohu po riadkoch, pokym nenajdes bielu farbu. Tento bod si zapamataj a pomocou upraveneho flood fillu najdi ohranicenie tejto oblasti - flood fill bude postupovat len tam, kde biely pixel susedi s pixelom inej farby (o trochu pokrocilejsie by bolo, ze je to susedstvo vo vzdialenosti viac pixelov). Ak je okraj na okraji obrazku, tak ho vyrad a celu oblast floodfillni na inu farbu, nech nezavadzia, lebo ide o oddelovac.
Ak nie je na okraji obrazku, tak oblast zvnutra floodfilluj ako pravdepodobnu bublinu, kde bude floodfill postupovat len po bielej a ciernej (prip. aj tmavosedej - kvoli antialiasingu komixov). Ak floodfill obsahuje vsetky vnutorne body, potom ide o bublinu a priprav jej zvacsovanie (hranice uz mame).
Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: aaaaaaaaaaaaaaaaaaaa
|
Pridané:
22.7.2016 10:55
Casova narocnost - pri najhorsom pre kazdy pixel flood fill, ale raz spracovane oblasti by sme si mohli ukladat do disjoint setu, kde operacia amortizovane trva O(alfa(n)), kde alfa je inverzna Ackermannova funkcia.
Pri "s" susediacich pixeloch by sa lookup pouzival pri kazdom pristupe k tomu bodu, co znamena jeden pristup na prvotne prechadzanie a potom amortizovane O(s*alfa(n)) pristupov od susedov. Join by sa pouzival pri najdeni noveho nezaujimaveho pixela v ramci floodfillu, ale to sa stane vzdy najviac raz, to sa strati v konstante.
Pisem "zvnutra flood fillovat" - to pre ucely komixov staci zobrat priemer max a min suradnic bubliny, to sa zvlada v konstantom case.
Takze by som to cele zvladol v O(n*s*alfa(n)), co je pri konstantom s O(n*alfa(n)).
Priestorova narocnost - O(n) na ulozenie pola, disjoint set nebude vacsi ako O(n), takze O(n).
A teraz mi tu najdite chyby alebo naco je treba umela inteligencia.
Re: Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: knjiCdo
|
Pridané:
22.7.2016 11:50
No neviem, ja si myslím, že aj v bežných komixoch sa často vyskytuje biela farba v ohraničených oblastiach s textom bez toho aby to bola bublina s textom, ako nápisy, text na papieri, ceduľky a podobne. ďalšia vec je, že bublina s textom nie je vždy ohraničená ako "bublina" niekedy môže text len tak poletovať v priestore bez zmeny pozadia alebo ohraničenia (ale to skôr pre menej podstatné informácie) a posledne si myslím, že Google zvažuje to rozšíriť pre širšie spektrum komixov, napríklad aj pre mangu. Mangy sú skoro vždy úplne čiernobiele tak vizuálne rozpoznávanie tu určite porazí floodfill selekciu. Samozrejme ešte neviem ako na tieto príklady reaguje google a tvoj algoritmus by určite fungoval na *väčšinu* prípadov.
Re: Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: knjiCdo
|
Pridané:
22.7.2016 11:54
--> ešte by som dodal, že NN siete sú rýchle a pokiaľ nepoužili rekurzívne siete tak myslím že je komplexita len O(n) podľa počtu vrstiev a neurónov v každej. čo môže byť pomalšie ako floodfill pre malé oblasti, ale má to skvelú škálovateľnosť na veľké oblasti (npr. väčšie rozlíšenie alebo ako som spomínal, čiernobiele komixy).
čo myslíš ty?
Re: Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: Jojojoj
|
Pridané:
22.7.2016 11:51
To znie vsetko pekne a realne, aj ked asi polovici z toho velmi nerozumiem. Ale treba brat do uvahy aj to ze znie lepsie ked povies "Mam umelu inteligenciu co mi cita komiksy", ako "Mam appku co mi cita komiksy". To potom nemas ten UltraHD 8K TurboAI pocit.