neprihlásený
|
Piatok, 10. januára 2025, dnes má meniny Dáša |
|
Prehrávač videa VLC podporuje generovanie titulkov pomocou AI
Značky:
VLC
DSL.sk, 9.1.2025
|
|
Tvorcovia populárneho multimediálneho multiplatformového prehrávača multimédií VLC pripravujú podporu generovania titulkov k prehrávanému videu pomocou metód umelej inteligencie, pričom už majú k dispozícii evidentne fungujúcu verziu a aktuálne ju demonštrujú na výstave spotrebnej elektroniky CES.
Funkčnosť využíva bližšie nešpecifikovaný open source AI model bežiaci lokálne na počítači s prehrávačom.
Podporuje vytváranie titulkov z hovoreného slova vo videu v príslušnom jazyku a zároveň preklad týchto titulkov do iných jazykov, pričom má byť podporovaných viac ako sto jazykov.
Bližšie detaily zatiaľ tvorcovia neoznámili a nie je jasné ako kvalitná je funkčnosť v súčasnom stave, aký výpočtový AI výkon a aký hardvér potrebuje.
Zároveň nie je jasné, odkedy by funkčnosť mala byť sprístupnená a podporovaná v oficiálnej verzii VLC.
Tvorcovia VLC tiež na CES oznámili dosiahnutie okrúhlej hranice 6 miliárd stiahnutí ich prehrávača.
Najnovšie články:
Diskusia:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
želanie je kvalitný klasický český dabing
Od: Jamrich
|
Pridané:
9.1.2025 23:05
Pozerať film s titulkami je hotové nešťastie.
|
|
Re: želanie je kvalitný klasický český dabing
Od: somktosom
|
Pridané:
10.1.2025 0:19
taky shogun, dark alebo cien anos de soledad bez titulkov... no neviem co by si z toho mal
|
|
Re: želanie je kvalitný klasický český dabing
Od: Giud
|
Pridané:
10.1.2025 0:52
Jasne, ty tupelo. Ten tvoj dabing, to je urcite lepsie ako original zvuk. Nestastie je tvoja hlava.
|
|
Re: želanie je kvalitný klasický český dabing
Od: Hroch_asdf
|
Pridané:
10.1.2025 1:02
Ak funguju ako autogenerovane na youtube, tak to bude bieda. Ten speech to text model velmi kontext hovoreneho slova neriesi.
|
|
Sme robili aj doteraz
Od: Lviiis
|
Pridané:
10.1.2025 0:58
Aj ked integracia do prehravaca je samozrejme komfortnejsia, tak aj doteraz sme sa mohli hrat s takymi vecami. Faster Whisper XXL tool, Large V2 alebo V3 model, pyannote_v3 VAD, kim_vocal_v2 extraction model a vysledok je az strasidelne presny.
Na RTX 3080 to ma rychlost 2-3x realtime (cize 45 min. diel serialu to pochrume za 15-20 minut).
Vysledne titulky sa daju prehnat cez Subtitle Edit, ktory je free ma nejake automaticke opravy (titulky zobrazene prilis kratko, prilis dlhe riadky, atd).
|
|
Re: Sme robili aj doteraz
Od: Hroch_asdf
|
Pridané:
10.1.2025 1:07
Ako by riesili zle zrozumitelne slova ako napr. Tu: https://dopice.sk/thK
|
|
Re: Sme robili aj doteraz
Od: Lviiis
|
Pridané:
10.1.2025 1:41
Ked nepocitam uvodnu vravu vo videu, tak typek za pultom povie vetu a nasledne sa tam 7x povie They took our jobs. Ten posledny typek je hodne uz zmuchalny. Ako si s tym poradi ML? See for yourself:
[00:03.800 --> 00:10.040] Und jetzt tauchen diese Leute aus der Zukunft auf und bieten an, die gleiche Arbeit für praktisch nichts zu übernehmen.
[00:10.280 --> 00:11.660] Sie klauen unsere Jobs!
[00:11.800 --> 00:13.060] Sie klauen unsere Jobs!
[00:13.200 --> 00:14.400] Sie klauen unsere Jobs!
[00:14.500 --> 00:15.780] Sie klauen unsere Jobs!
[00:15.820 --> 00:17.220] Sie klauen unsere Jobs!
[00:17.340 --> 00:18.800] Sie klauen unsere Jobs!
[00:19.020 --> 00:20.160] Sie klauen unsere Jobs!
|
Pridať komentár
|
|
|
|