neprihlásený Piatok, 10. januára 2025, dnes má meniny Dáša
Prehrávač videa VLC podporuje generovanie titulkov pomocou AI

Značky: VLC

DSL.sk, 9.1.2025


Tvorcovia populárneho multimediálneho multiplatformového prehrávača multimédií VLC pripravujú podporu generovania titulkov k prehrávanému videu pomocou metód umelej inteligencie, pričom už majú k dispozícii evidentne fungujúcu verziu a aktuálne ju demonštrujú na výstave spotrebnej elektroniky CES.

Funkčnosť využíva bližšie nešpecifikovaný open source AI model bežiaci lokálne na počítači s prehrávačom.

Podporuje vytváranie titulkov z hovoreného slova vo videu v príslušnom jazyku a zároveň preklad týchto titulkov do iných jazykov, pričom má byť podporovaných viac ako sto jazykov.

Bližšie detaily zatiaľ tvorcovia neoznámili a nie je jasné ako kvalitná je funkčnosť v súčasnom stave, aký výpočtový AI výkon a aký hardvér potrebuje.

Zároveň nie je jasné, odkedy by funkčnosť mala byť sprístupnená a podporovaná v oficiálnej verzii VLC.

Tvorcovia VLC tiež na CES oznámili dosiahnutie okrúhlej hranice 6 miliárd stiahnutí ich prehrávača.


      Zdieľaj na Twitteri



Najnovšie články:

Uvedený Raspberry Pi 5 s až 16 GB RAM
Japonci vypustili do vesmíru prvý satelit z dreva
Štát potvrdil rozsiahly útok na kataster, zostáva nefunkčný
DisplayPort bude mať novú verziu, umožní monitor pripojiť oveľa dlhším káblom
Priestupný rok 2024 spôsobil na konci roka vážny problém satelitom
Uvedený nový Snapdragon X pre lacnejšie PC a prvé mini desktopy s týmito CPU
Kataster vôbec nefunguje ani dnes, úrad príčiny stále nevysvetlil
Lenovo uviedlo notebook s rozťahovacím displejom, kompaktný ale drahý. Video
Kataster nehnuteľností nefunguje cez Internet ani fyzicky, údajne bol terčom útoku
Nové HDMI 2.2 dvojnásobne zrýchli na 96 Gbps a zlepší synchronizáciu zvuku


Diskusia:
                               
 

Pozerať film s titulkami je hotové nešťastie.
Odpovedať Známka: -4.0 Hodnotiť:
 

taky shogun, dark alebo cien anos de soledad bez titulkov... no neviem co by si z toho mal
Odpovedať Hodnotiť:
 

Jasne, ty tupelo. Ten tvoj dabing, to je urcite lepsie ako original zvuk. Nestastie je tvoja hlava.
Odpovedať Hodnotiť:
 

Ak funguju ako autogenerovane na youtube, tak to bude bieda. Ten speech to text model velmi kontext hovoreneho slova neriesi.
Odpovedať Hodnotiť:
 

Aj ked integracia do prehravaca je samozrejme komfortnejsia, tak aj doteraz sme sa mohli hrat s takymi vecami. Faster Whisper XXL tool, Large V2 alebo V3 model, pyannote_v3 VAD, kim_vocal_v2 extraction model a vysledok je az strasidelne presny.
Na RTX 3080 to ma rychlost 2-3x realtime (cize 45 min. diel serialu to pochrume za 15-20 minut).
Vysledne titulky sa daju prehnat cez Subtitle Edit, ktory je free ma nejake automaticke opravy (titulky zobrazene prilis kratko, prilis dlhe riadky, atd).
Odpovedať Hodnotiť:
 

Ako by riesili zle zrozumitelne slova ako napr. Tu: https://dopice.sk/thK
Odpovedať Hodnotiť:
 

Ked nepocitam uvodnu vravu vo videu, tak typek za pultom povie vetu a nasledne sa tam 7x povie They took our jobs. Ten posledny typek je hodne uz zmuchalny. Ako si s tym poradi ML? See for yourself:
[00:03.800 --> 00:10.040] Und jetzt tauchen diese Leute aus der Zukunft auf und bieten an, die gleiche Arbeit für praktisch nichts zu übernehmen.
[00:10.280 --> 00:11.660] Sie klauen unsere Jobs!
[00:11.800 --> 00:13.060] Sie klauen unsere Jobs!
[00:13.200 --> 00:14.400] Sie klauen unsere Jobs!
[00:14.500 --> 00:15.780] Sie klauen unsere Jobs!
[00:15.820 --> 00:17.220] Sie klauen unsere Jobs!
[00:17.340 --> 00:18.800] Sie klauen unsere Jobs!
[00:19.020 --> 00:20.160] Sie klauen unsere Jobs!
Odpovedať Hodnotiť:

Pridať komentár