Extreure els subtitols de la TDT en format SRT ( MANUAL )

Manuals i tutorials.

Moderadors: Petiso, Ayu

Avatar de l’usuari

Autor del tema
shinnosuke
Entrades: 1635
Membre des de: dv. feb. 01, 2008 1:14
Ubicació: Manresa
Status: Desconnectat

Extreure els subtitols de la TDT en format SRT ( MANUAL )

#1

Entrada Autor: shinnosuke » ds. març 12, 2011 22:23

M'explicaré tan bé com pugui en pocs pasos s'aconsegueix obtenir un fitxer SRT amb els subtítols que hem capturat si el nostre gravador té aquesta opció de gravar els subtítols.

Primer de tot hem de tindre la versió del projectx actualitzada, si es té una versió anterior, no funcionarà de cap manera, ja que la versió nova que necessitem genera 2 fitxers amb les extensions sup.sub sup.idx i en total es té 3 fitxers que aquest últim és un sup .

Primer és de tot comprobar quina versió tenim
Ens anem Help i Last Version
Hem de tindre la versió tal com surt a la imatge.
Imatge
Si teniu la mateixa versió, perfecte llavors ens anem al següent pas.

Anem al menú
PreSettngs després a subtitle
Hem de tindre configurat tal com surt a la imatge, la part esquerra on diu ' subtitle ' no cal que sigui igual, el que ens interesa és la part dreta on posa DVB Teletext (demultiplex) llavors hem de tindre exactament igual que a la imatge, segons com es demuxi els subtitols amb la opció " simulate DVB Subpictures IRD color model: ens pot generar diferents tipus de lletres colors fons i veure's coses rares com no mostrar correctament la lletra, si es demuxés diferent i s'afegeix al suprip entendrà que encara que hi hagi la lletra " A " afegida a aquesta 'base de dades' per ell és diferent, per això sempre haurém de demuxar el mateix format, recomano que sigui YLE copiant igual que a la imatge, no hauriem de tindre problemes.

Imatge

Ha d'haber el que està encerclat en vermell, si això no hi és no es generarán els fitxers
sup.sub sup.idx i no podrem demuxar els subs ja que fa falta aquests fixers.
Sobre tot ha d'haber el mateix que a la imatge, si falta
Farem el pas que haguem de fer, editar el tros que volem demuxar, es demuxarà tantes pistes d'àudio i subtítols tingui el canal i es genarà els fitxers amb les extension sup.sub sup.idx i un tercer fitxer .sup o sigui que hem de tindre els 3 fitxers i amb el mateix nom tots 3, els fitxers us sortirà com si fos un bloc de notes, arxiu de text.

Imatge

Un cop tinguem els 3 fitxers, obrim el suprip, seguim els pasos a la imatge
Imatge

Un cop cliquem a START
ens sortirà aquesta imatge ( A )
Imatge

Anem picant les lletres que ens en surti, si surten paraules com
" casa " " ossa " " ça " també les escrivim tal com surt, ara bé ens sortirà sempre caràcters una mica " estranys " com passa a la imatge " B ", com no sabem quina lletra és exactament, us recomano posar la lletra que millor es vegi, com és en aquest cas una " i " dins d'un parèntisis o asteriscs com millor volgueu, d'aquesta manera, quan ja tinguem tots els subs fets, haurém de repassar per si hi han errors que sempre n'hi hauràn, un corrector català, si trobem una falta i ens surt una paraula amb el parèntisi o asterisc segons el que haguem posat sabrem quina lletra és la que correspón, pot ser que ens surti una paraula incorrecte per altres subtítols, però de moment, sabent la lletra amb el corrector ortogràfic, ens anem a
characters matrix i edit view characters matrix
com ens surt a aquesta imatge,

Imatge
I veurem les lletres que haurem posat, incloses les lletres " estranyes ", un cop haguem fet el corrector, avans de continuar busquem aquesta lletra i la modifiquem per no fer-nos un embolic.

Sempre desarem el fitxer per anant afegint noves lletres de nous subtitols, si ja tenim un fitxer generat amb unes lletres com en aquest exemple, a la imatge
Imatge
i cerquem el fitxem que hem desat, després cliquem a START i automàticament, el suprip ens afegirà les lletres que trobi a la ' base de dades ' si ens demanen noves lletres, caràcters com " & % / " ho posem, posem les noves lletres, desem i aixi d'aquesta manera arribarà a un punt crec jo, que ja no ens demanaria més lletres, però com això no ho sé, en principi sempre ens demanarà noves lletres podem afegir tots els caràcters frases curtes que volguem, com més sigui aquesta " base de dades " gran, menys feina tindrem en picar cada lletra, i el procés de passar el fitxer a " SRT " serà molt ràpid.

Espero que ho hagueu entès, i m'hagi explicat lo més bé possible, quasevol dubte que tingueu m'ho dieu, sobre tot alhora de demuxar sempre en el mateix format, si no el procès automàtic que els subtítols apareguin sense fer res, no funcionarà ja que cada demuxació diferent, el suprip ho detecta diferent per molt que les dues lletres siguin igual.


A la carpeta intercanvi, trobareu un fitxer que es diu
basededadessubtitols.sum
amb molts caràcters posats, si voleu fer la vostre base de dades, cap problema, si voleu fer proves baixeu-vos aquest fitxer l'obrir i ell mateix per art de màgia, us anirà apareixent els subtítols.

En alguns casos pot aparèixer una finestra com aquesta, s'haurà de teclejar el text manualment, no sé per què surt, però és així.

Imatge

Una cosa molt important, en cas que no aparegui res s'haurà de clicar a change text color d'aquesta manera, veurem el subtítol que no es veu, seleccionar dos colors, els colors no afecta per res els subs només es per veure-ho millor,
escriure el subtitol, i després clicar a donde, el subtítol, evidenment s'haurà d'escriure a un bloc de notes, després fer un copy-paste i amb això tindrem aquest subtítol que està invisible, si heu començat a fer proves i us heu menjat aquest pas, doncs és una cosa que he vist i que no he dit i ara us ho dic.
Aquesta imatge estarà tot més clar.
Imatge

Demano disculpes, però fent això hauriem de tindre tots els subs del video, això si s'haurà de corregir el text amb el word o una altra èina i tot estarà be.
Salut !!!!!!!!!
shinnosuke l’ha editat per darrera vegada el dia: dg. març 20, 2011 21:02, en total s’ha editat 1 vegada.



Avatar de l’usuari

naroatna
Entrades: 21177
Membre des de: ds. des. 30, 2006 23:43
Ubicació: Figueres - Alt Empordà
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#2

Entrada Autor: naroatna » dg. març 13, 2011 12:15

Primer de tot moltes gràcies pel teu manual Shinnosuke !! :D

He comprovat i vist que faig servir la mateixa versió del ProjectX, però no trobo opció per poder marcar precisament el que dius que és imprescindible i has encerclat en vermell, potser em falta marcar alguna altra opció d'alguna altra pestanya o alguna cosa que s m'escapa i ara mateix no sé veure: :roll:

[hide]Imatge[/hide]

I un altra cosa encara, això del "bei SUP-EXPORT" s'ha d'afegir a Val: :?:

A veure si podem aconseguir tornar a obtenir els subtítols de les gravacions ben aviat. Moltes gràcies de nou per la teva ajuda. :wink:

Fins aviat!
Imatge

Moltes gràcies!

Avatar de l’usuari

conradtgn
Entrades: 4525
Membre des de: dt. gen. 22, 2008 17:24
Ubicació: Tarragona
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#3

Entrada Autor: conradtgn » dc. març 16, 2011 20:03

A mi també em surt com a la naroatna... Tenint exactament la mateixa versió.
M'he baixat altra vegada la versió i l'he compilat de nou, i res, que no em surt igual que tu shinnosuke.

Podem fer una cosa, ens pots passar la teva carpeta del ProjectX en un .zip, shinnosuke? Així ho tindrem igual :D

a10 i merci pel manual!
Imatge

Avatar de l’usuari

Petiso
Site Admin
Site Admin
Entrades: 16297
Membre des de: dv. oct. 06, 2006 13:13
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#4

Entrada Autor: Petiso » dc. març 16, 2011 20:30

Imatge Imatge

Avatar de l’usuari

conradtgn
Entrades: 4525
Membre des de: dt. gen. 22, 2008 17:24
Ubicació: Tarragona
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#5

Entrada Autor: conradtgn » dc. març 16, 2011 20:57

Merci! A la següent captura el provo!

a10!
Imatge

Avatar de l’usuari

Autor del tema
shinnosuke
Entrades: 1635
Membre des de: dv. feb. 01, 2008 1:14
Ubicació: Manresa
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#6

Entrada Autor: shinnosuke » dc. març 16, 2011 21:47

Acabo de veure els missatges!!

Demano disculpes conradtgn!!!



Me'l baixaré a veure si és el mateix que faig servir, si no ho és, el modifico i us dic el nom del rar per què ho tingueu tots.

Salut!!

Avatar de l’usuari

naroatna
Entrades: 21177
Membre des de: ds. des. 30, 2006 23:43
Ubicació: Figueres - Alt Empordà
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#7

Entrada Autor: naroatna » dc. març 16, 2011 22:05

Doncs ja m'he instal·lat aquesta nova versió i va... perfecte !! :D

Moltes gràcies mestre Petiso ! :wink:
Imatge

Moltes gràcies!

Avatar de l’usuari

r5004
Entrades: 14638
Membre des de: dc. nov. 01, 2006 8:08
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#8

Entrada Autor: r5004 » dg. març 20, 2011 19:37

He estat fent proves amb la captura d'avui de l'Apm Extra i me'n he adonat d'això (amb una mostra de 1 minut d'"El temps", així que potser al aplicar-ho a un ripeig "real" sorgeix algun problema):

Tal com diu en Shinnosuke, amb YLE en la configuració del ProjectX,
Imatge
els subtítols surten així al SubRip:
Imatge


En canvi, si posem NRK en comptes de YLE:
Imatge

Això fa que el SubRip no confongui tantes vegades, dues o més lletres com a un sol caràcter. En teoria, ha de facilitar encara més el ripeig del subtítols (agafant l'exemple que he posat, és més provable que torni a sortir una "B" que una "Bo").

I gràcies pel manual, Shinnosuke! Imatge Imatge
"Hi ha gent a qui no li agrada que es parle, s'escriga o es pense en català. És la mateixa gent a qui no li agrada que es parle, s'escriga o es pense."
Imatge

Avatar de l’usuari

Autor del tema
shinnosuke
Entrades: 1635
Membre des de: dv. feb. 01, 2008 1:14
Ubicació: Manresa
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#9

Entrada Autor: shinnosuke » dg. març 20, 2011 21:34

De res r5004, és un plaer ajudar i per fi saber la manera de extreure els subs que després que TV3 deixessin emetre per teletext, ja no ens hem posat a sobre la manera de extreure els subs, però tot és possible, si es fa com he posat el manual, no hauria de donar problemes i obir el fitxer .SUP si s'obrís un altre fitxer que no fos el .SUP passaria coses com aquestes....

Imatge

L'únic inconvenient, què dóna el subrip que s'ha d'escriure els subs manualment, però això són 5-10 minuts, depèn dels subs què apareguin, si no apareix res perfecte, però bé no hi ha cap manera.

Si algú tenia pensat alguna manera diferent, doncs que ho digui.

Si algú, captura algun programa o sèrie de zero, i no 'té ganes' de passar els subs a SRT per "mandra" o el que sigui , que m'ho digui, m'envii un privat i em passi els 3 fitxers que el projectx demuxa, i jo li passo el SRT ja fet i corregit, només s'haurà de comprobar que tot estigui bé i els subs apareguin.

No tinc cap problema d'ajudar i donar-vos un cop de mà en aquest tema dels subs!!!

Gràcies!
Salut !!!!!!!!

Avatar de l’usuari

naroatna
Entrades: 21177
Membre des de: ds. des. 30, 2006 23:43
Ubicació: Figueres - Alt Empordà
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#10

Entrada Autor: naroatna » dl. març 21, 2011 2:07

Tinc una peli a mitges (Tres colors - Blanc) en principi muntada DVD+dvbrip però pendent dels subtítols forçats. La v.o. és en polonès/francès. Doblatge de Tv3 al català quan parlen en polonès i només subtítols incrustats pel francès (per la qual cosa són força extensos). :roll:

No sé si seria possible obtenir-los també del ProjectX, com ara s'obtenen els diversos àudios d'una emissió, però a mi només m'han sortit els subtítols sencers i prou. Si algú sap si hi ha alguna opció a veure si ho pogués explicar sisplau. Gràcies! :)

Fins aviat!
Imatge

Moltes gràcies!

Avatar de l’usuari

conradtgn
Entrades: 4525
Membre des de: dt. gen. 22, 2008 17:24
Ubicació: Tarragona
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#11

Entrada Autor: conradtgn » dl. març 21, 2011 11:57

Si els subtítols estan incrustats "hardsub" al vídeo, pel que sé, ja no es poden extreure com una pista a part donat que formen part de la pista de vídeo.

Hi ha una forma que és fent un OCR al vídeo, amb el SubRip: http://zuggy.wz.cz/guides/video.htm (seguint les fotos sembla fàcil)
Aquí s'n diu alguna cosa: http://forum.videohelp.com/threads/3064 ... hardsub%29
Tot i que amb aquest mètode també els hauràs de passar per un corrector i/o revisar-los a fons :wink:

L'altra forma és fent-ho manualment, amb algun editor de subtítols i anar transcrivint-los :(

a10!
Imatge

Avatar de l’usuari

r5004
Entrades: 14638
Membre des de: dc. nov. 01, 2006 8:08
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL

#12

Entrada Autor: r5004 » ds. des. 31, 2011 20:10

He trobat una versió més recent del ProjectX, la 0.91.00.02, que sembla que millora una mica això dels subtítols.
Els millors resultats els he aconseguit modificant això a la configuració del Projectx i a la finestra d'entrada de caràcters del SubRip.

Imatge

Imatge

La resta és el mateix que va explicar en Shinnosuke. Si algú troba una configuració més òptima... que ho xerri... :mrgreen: :D
"Hi ha gent a qui no li agrada que es parle, s'escriga o es pense en català. És la mateixa gent a qui no li agrada que es parle, s'escriga o es pense."
Imatge


efi135
Entrades: 105
Membre des de: dj. gen. 21, 2016 15:13
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL )

#13

Entrada Autor: efi135 » dg. maig 01, 2016 7:40

shinnosuke ha escrit:M'explicaré tan bé com pugui en pocs pasos s'aconsegueix obtenir un fitxer SRT amb els subtítols que hem capturat si el nostre gravador té aquesta opció de gravar els subtítols.

Primer de tot hem de tindre la versió del projectx actualitzada, si es té una versió anterior, no funcionarà de cap manera, ja que la versió nova que necessitem genera 2 fitxers amb les extensions sup.sub sup.idx i en total es té 3 fitxers que aquest últim és un sup .

Primer és de tot comprobar quina versió tenim
Ens anem Help i Last Version
Hem de tindre la versió tal com surt a la imatge.
Imatge
Si teniu la mateixa versió, perfecte llavors ens anem al següent pas.
Quina ràbia, no veig cap imatge. En fi, sóc nou en això i el problema que tinc es que quan intento treure els subtítols sempre em dona aquest error.

-> Filetype is TS (generic PES Container)
-> demux
-> Service ID 0x0325
-> PMT 0x006E refers to these usable streams:
Video:
PID: 0x006F(MPEG-2)
Audio:
PID: 0x0070{cat}(Mpg1)
PID: 0x0071{v.o}(Mpg1)
PID: 0x0072{a.d}(Mpg1)
Teletext:
PID: 0x0073(cat_i100 )
Subpict.:
PID: 0x0074(cat_0x10_p1_a1 )
PID: 0x0075(eng_0x10_p1_a1 )

!> PID 0x0000 (PAT) (0 #1) -> ignored
!> PID 0x006E (PMT) (188 #2) -> ignored
ok> PID 0x006F has PES-ID 0xE0 (MPEG Video) (376 #3)
ok> PID 0x0070 has PES-ID 0xC0 (MPEG Audio) (564 #4)
ok> PID 0x0071 has PES-ID 0xC1 (MPEG Audio) (752 #5)
ok> PID 0x0072 has PES-ID 0xC2 (MPEG Audio) (940 #6)
ok> PID 0x0073 has PES-ID 0xBD (private stream 1) (TTX) (489552 #2605)
ok> PID 0x0074 has PES-ID 0xBD (private stream 1) (SubID 0x20) (1680344 #8939)
ok> PID 0x0075 has PES-ID 0xBD (private stream 1) (SubID 0x20) (1680532 #8940)
--> PID 0x1FFF => stuffing packet -> ignored
packs: 12749648 100% 2418878688

++> Mpg Video: PID 0x006F / PesID 0x1E0 / SubID 0x00 :
-> Video: fr-ct-1p-cg-og-dg -> 0-0-0-0-0-0

--> using faked PTS for following data:
-> temp. Filesize < 10 Bytes
++> stream omitted: PID 0x0070 / PesID 0xC0 / SubID 0x00 :

--> using faked PTS for following data:
-> temp. Filesize < 10 Bytes
++> stream omitted: PID 0x0071 / PesID 0xC1 / SubID 0x00 :

--> using faked PTS for following data:
-> temp. Filesize < 10 Bytes
++> stream omitted: PID 0x0072 / PesID 0xC2 / SubID 0x00 :

++> Teletext: PID 0x0073 / PesID 0xBD / SubID 0x10 :

++> Subpicture: PID 0x0074 / PesID 0xBD / SubID 0x20 :
Multicolor OFF / switches 00000000
-> selected DVB subpicture color model: YLE ; fixed to page id:
-> export format: sup
-> temp. file: 04-29_29_04_16 21_20 (03).sp (7104679 bytes)
!> 2 PTSs discarded in stream
-> Subpicture PTS: first packet 00:00:09.923, last packet 01:40:42.425
-> adjusting subpicture at its own timeline
-> source is DVB Subtitle...
!> decoding error: 8, Region_Id 1 (pts 36517601)
>>> process stopped...

!> an error has occured.. (please inform the authors at 'forum.dvbtechnics.info')
java.lang.ArrayIndexOutOfBoundsException
at java.lang.System.arraycopy(Native Method)
at net.sourceforge.dvb.projectx.subtitle.DVBSubpicture.prepare_output(DVBSubpicture.java:379)
at net.sourceforge.dvb.projectx.subtitle.DVBSubpicture.page_composition(DVBSubpicture.java:470)
at net.sourceforge.dvb.projectx.subtitle.DVBSubpicture.Subtitle_Segment(DVBSubpicture.java:309)
at net.sourceforge.dvb.projectx.subtitle.DVBSubpicture.decodeDVBSubpicture(DVBSubpicture.java:270)
at net.sourceforge.dvb.projectx.subtitle.Subpicture.decode_picture(Subpicture.java:1205)
at net.sourceforge.dvb.projectx.subtitle.Subpicture.decode_picture(Subpicture.java:1172)
at net.sourceforge.dvb.projectx.parser.StreamProcessSubpicture.processStream(StreamProcessSubpicture.java:491)
at net.sourceforge.dvb.projectx.parser.StreamProcessSubpicture.<init>(StreamProcessSubpicture.java:143)
at net.sourceforge.dvb.projectx.parser.StreamProcess.process(StreamProcess.java:103)
at net.sourceforge.dvb.projectx.parser.StreamProcess.<init>(StreamProcess.java:61)
at net.sourceforge.dvb.projectx.parser.StreamParserBase.createStreamProcess(StreamParserBase.java:616)
at net.sourceforge.dvb.projectx.parser.StreamParserBase.processNonVideoElementaryStreams(StreamParserBase.java:564)
at net.sourceforge.dvb.projectx.parser.StreamParserBase.processNonVideoElementaryStreams(StreamParserBase.java:495)
at net.sourceforge.dvb.projectx.parser.StreamParserBase.processElementaryStreams(StreamParserBase.java:485)
at net.sourceforge.dvb.projectx.parser.StreamParserTS.parseStream(StreamParserTS.java:1270)
at net.sourceforge.dvb.projectx.parser.StreamParser.parseStream(StreamParser.java:92)
at net.sourceforge.dvb.projectx.parser.MainProcess.processCollection(MainProcess.java:1025)
at net.sourceforge.dvb.projectx.parser.MainProcess.startProcessing(MainProcess.java:352)
at net.sourceforge.dvb.projectx.parser.MainProcess.run(MainProcess.java:144)

-> we have 5 warnings/errors.

Avatar de l’usuari

r5004
Entrades: 14638
Membre des de: dc. nov. 01, 2006 8:08
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL )

#14

Entrada Autor: r5004 » dg. maig 01, 2016 8:42

Extreure subtítols de la tdt és una feina farragosa (jo fa temps que no ho toco), però recordo que provant diferents combinacions de la configuració dels subtítols, obtenies diferents resultats. Prova a tocar opcions de "DVB Subpictures".
Imatge
Hi ha la possibilitat d'extreure aquests subtítols del 3alacarta?
"Hi ha gent a qui no li agrada que es parle, s'escriga o es pense en català. És la mateixa gent a qui no li agrada que es parle, s'escriga o es pense."
Imatge

Avatar de l’usuari

Adrià05
Entrades: 2808
Membre des de: dt. feb. 03, 2015 20:06
Status: Desconnectat

Re: Extreure els subtitols de la TDT en format SRT ( MANUAL )

#15

Entrada Autor: Adrià05 » dg. maig 01, 2016 12:51

Ja no es poden extreure a causa de que no emeten pel Teletext ja...

3alacarta: http://forum.totsrucs.cat/viewtopic.php?f=34&t=20571

Respon