neprihlásený Nedeľa, 5. júla 2026, dnes má meniny Cyril, Metod
Google Docs pridal OCR rozpoznávanie slovenského textu

DSL.sk, 1.3.2011


Spoločnosť Google v pondelok oznámila rozšírenie funkčnosti svojho webového kancelárskeho balíka Google Docs o OCR rozpoznávanie textu v ďalších jazykoch vrátane slovenčiny.

Google Docs podporuje OCR, Optical Character Recognition, od júna minulého roka pre päť svetových jazykov, angličtinu, španielčinu, nemčinu, taliančinu a francúzštinu.

Od pondelka pribudla podpora ďalších 29 jazykov vrátane slovenského a českého.

OCR rozpoznanie textu na obrázku, priamo v obrázkových súboroch alebo PDF, si je možné zvoliť pri nahrávaní súboru, zároveň si je potrebné vybrať jazyk dokumentu. Google Docs v takomto prípade vytvorí z nahrávaného súboru textový dokument, do ktorého umiestni samotný nahraný obrázok a pod neho rozpoznaný text.

Podľa nášho testu je pre dosiahnutie dostatočne kvalitného výsledku potrebné nahrať obrázky s dostatočne vysokým DPI, text s menším rozlíšením funkcia nerozpoznáva príliš kvalitne. Na ukážkovom screenshote sa nachádza text rozpoznaný na naskenovanom obrázku s 300 DPI v pôvodnom rozlíšení.

Zväčšiť Zväčšiť
Zapnutie OCR a ukážka kvality rozpoznaného textu, kliknite pre zväčšenie



Okrem pridania podpory nových jazykov Google podľa svojho oznámenia u OCR zlepšil aj rozpoznávanie a prenos formátovania textu do výsledného textového dokumentu.

Do budúcnosti avizuje zlepšenie rýchlosti aj presnosti rozpoznávania.



Najnovšie články:

Veľký výrobca LiFePO4 uviedol úložisko postavené na sodíkových článkoch
Začal postapokalyptický seriál od Apple
Pohybový senzor v lopte rozhodol o postupe na MS vo futbale
Intel výrazne zvýšil ceny najnovších desktopových procesorov
V Poľsku budú mať 2.4 GWh a v Nemecku 5.7 GWh batériové úložiská, na Slovensku máme 20 MWh
Konkurent Starlinku má už dosť satelitov pre spustenie služby
Pokuta 4.1 miliardy pre Google za zneužívanie Androidu platí, rozhodol najvyšší európsky súd
Nová verzia OpenWrt opravuje vážne zraniteľnosti, odporúčané upgradovať
Používanie Blu-ray skončí aj na hry pre PlayStation
IBM vyvinula výrobu 0.7-nm čipov


Diskusia:
                               
 

super
Odpovedať Známka: 8.9 Hodnotiť:
 

Aby nebola nuda, tak skusim -

"hnusni google, vsade sa serje, pomali nas kce sledovat us aj na hajsli, nekceme ziadne rosposnavanje slovenciny, cudzje nekceme, svoe si nedame!!! fuck of hnusna korporacija!"
Odpovedať Známka: -8.3 Hodnotiť:
 

teba by ani v sucanoch nechceli, taky si dement
Odpovedať Známka: 7.9 Hodnotiť:
 

nechces, nepuzivaj ... je to jednoduche ...
Odpovedať Známka: 8.9 Hodnotiť:
 

aby nebola nuda, tak aspon bude trapne ticho po tvojom prispevku, blahozelam.
Odpovedať Známka: 8.0 Hodnotiť:
 

Dúfam, že si to písal štýlom aby to Google nerozpoznal a nezavolal na teba Chucka Norrisa. Ak píšeš takto stále tak myslím, že už ti ani Chuck nepomôže :-(
Odpovedať Známka: 8.5 Hodnotiť:
 

Chlapce, mas obrovsku smolu. Tvoj slaboduchy prispevok uz stihol nas velky Google uspesne zaindexovat... :-)
Odpovedať Známka: 10.0 Hodnotiť:
 

heh, fakt: http://goo.gl/kJLvf
Odpovedať Hodnotiť:
 

... je 2MB
"Tento súbor nebolo možné importovať pomocou optického rozpoznávania znakov, pretože jeho veľkosť presahuje limit 2 MB."
Odpovedať Známka: 10.0 Hodnotiť:
 

Limit čoho je 2 MB ?
Obrázku, či výsledného textu?
Odpovedať Hodnotiť:
 

Teraz som si vsimol pod vyberom suborov na odovzdanie "Typy súborov a limity veľkosti":
- Dokumenty max 1MB jeden subor
- Prezentacie max 10MB jeden subor
- Tabulky max 20MB na subor
- Nejake kresby (.wmf) max 2MB na subor
- PDF/obrazky max 2MB na subor ("Grafika sa nekonvertuje, len text. Najlepšie výsledky dosiahnete, ak začnete s obrazovými súbormi s vysokým rozlíšením.")
Odpovedať Známka: 10.0 Hodnotiť:
 

Znamená to, že v reCAPTCHA sa konečne budeme môcť dočkať aj lahôdok ako „chuj“, „kokotský“ a podobne?

Odpovedať Hodnotiť:
 

... prípadne budeme musieť hádať, čo sa skrýva pod tými (nerozlúštiteľnými) začiernenými údajmi z akože „zverejnených“ faktúr, ktoré si internetom posadnutí pravičiari budú držať v Google Docs...

Odpovedať Známka: -10.0 Hodnotiť:

Pridať komentár