Word error rate
http://dbpedia.org/resource/Word_error_rate
WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática.
rdf:langString
Word Error Rate (WER) és una mesura utilitzada habitualment en l'avaluació de sistemes de reconeixement de la parla o de traducció automàtica. Calcula el nombre mínim d'insercions, esborrats i substitucions d'una paraula per una altra, necessaris per transformar una frase en una altra. Aquesta mesura es basa en la distància d'edició o de Levensthein, amb l'excepció que aquesta última es calcula a nivell de lletra i WER ho fa a nivell de paraula. on Per trobar el valor mínim de WER entre dos frases s'utilitza un algorisme de programació dinàmica.
rdf:langString
Hitz errore-tasa (Ingelesez, Word Error Rate edo WER) ahots-hautematearen edo itzulpengintza-automatikoko sistemen portaeraren neurketa metodo arrunta da. Errendimendua neurtzeko zailtasun orokorra aitortzen den hitz sekuentzian erreferentziaren sekuentzian luzapen desberdina izan daitekeela uste da (ustez zuzena). WER tik dator, hitz-mailan lan egiten duena, fonema- mailaren ordez. WER sistema, sistema baten hobekuntzak ebaluatzeko edota sistema ezberdinak alderatzeko tresna baliagarria da. Hala ere, neurketa mota honek ez du xehetasunik eskaintzen erroreen akatsen izaerari buruz; beraz, esfortzu gehiago beharrezkoa da errore-iturri nagusia(k) identifikatzeko eta edozein ikerketa-esfortzutan zentratzeko .
rdf:langString
Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance de la parole. Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Plus le taux est faible (minimum 0.0) plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions. où :
rdf:langString
Word error rate (WER) is a common metric of the performance of a speech recognition or machine translation system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence (supposedly the correct one). The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. The WER is a valuable tool for comparing different systems as well as for evaluating improvements within one system. This kind of measurement, however, provides no details on the nature of translation errors and further work is therefore required to identify the main source(s) of error and to focus any research effort.
rdf:langString
rdf:langString
Word Error Rate
rdf:langString
Hitz errore-tasa
rdf:langString
Word Error Rate
rdf:langString
Taux d'erreur de mots
rdf:langString
Word error rate
xsd:integer
5190349
xsd:integer
939575741
rdf:langString
Word Error Rate (WER) és una mesura utilitzada habitualment en l'avaluació de sistemes de reconeixement de la parla o de traducció automàtica. Calcula el nombre mínim d'insercions, esborrats i substitucions d'una paraula per una altra, necessaris per transformar una frase en una altra. Aquesta mesura es basa en la distància d'edició o de Levensthein, amb l'excepció que aquesta última es calcula a nivell de lletra i WER ho fa a nivell de paraula. En tasques tant de traducció automàtica com de reconeixement de la parla, es calcula WER entre la frase generada pel sistema i una frase de referència correcta. on
* S és el nombre de substitucions,
* B és el nombre d'esborrats,
* I és el nombre d'insercions,
* N és el nombre de paraules que té la frase de referència. Per trobar el valor mínim de WER entre dos frases s'utilitza un algorisme de programació dinàmica. Si considerem que són les primeres paraules de la frase generada i les primeres de la frase de referència: on és 1 si les paraules i són diferents i 0 si són iguals.
rdf:langString
Hitz errore-tasa (Ingelesez, Word Error Rate edo WER) ahots-hautematearen edo itzulpengintza-automatikoko sistemen portaeraren neurketa metodo arrunta da. Errendimendua neurtzeko zailtasun orokorra aitortzen den hitz sekuentzian erreferentziaren sekuentzian luzapen desberdina izan daitekeela uste da (ustez zuzena). WER tik dator, hitz-mailan lan egiten duena, fonema- mailaren ordez. WER sistema, sistema baten hobekuntzak ebaluatzeko edota sistema ezberdinak alderatzeko tresna baliagarria da. Hala ere, neurketa mota honek ez du xehetasunik eskaintzen erroreen akatsen izaerari buruz; beraz, esfortzu gehiago beharrezkoa da errore-iturri nagusia(k) identifikatzeko eta edozein ikerketa-esfortzutan zentratzeko . Arazo hau, hasieran ezagutzen den hitz-sekuentzia erreferentziaren (ahozko) hitz-sekuentziarekin lerrokatuz konpontzen da, horretarako kate dinamikoaren lerrokatzea erabiltzen da. Gai honen azterketa, "perpausaren eta hitzaren erroreen arteko korrelazioa adierazten duen botere legea" izena duen teorian ikusi daiteke. Hitzen errore-tasa kalkulatzeko, honela kalkulatu daiteke: non
* S ordezkapenen kopurua da,
* D ezabatze kopurua da,
* I txertaketa kopurua da,
* C hitz zuzenen kopurua da,
* N, (N = S + D + C) erreferentziaren hitz kopurua da. "Ezabatzea" eta "txertaketa" atzean dagoen intuisioa da nola heltzen garen erreferentzia batetik hipotesi batera. Beraz, "Hau da wikipedia" erreferentzia badaukagu eta "Hau _ wikipedia" hipotesia, ezabaketa deituko diogu. Hizketa-hautemate sistema baten errendimendua jakinarazten denean, batzuetan, hitz zehaztasuna (Ingelesez, Word accuracy edo WAcc) erabiltzen da horren ordez: non
* H, N-(S+D) den, ongi ezagutu diren hitz kopurua. I= 0 baldin bada, orduan, WAcc, zuzen ezagututako 'H' hitzen tasa bat , 'N'-ren hitz guztien kopurura atzera-egitearen (informazio-berreskuratzea) baliokidea izango da. Kontuan izan N, erreferentziaren hitz kopurua dela eta, hitzaren errore-tasa 1.0 baino handiagoa izan daiteke eta, beraz, hitzaren zehaztasuna 0.0 baino txikiagoa izan daiteke.
rdf:langString
WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática.
rdf:langString
Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance de la parole. Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Plus le taux est faible (minimum 0.0) plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions. Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par : où :
* est le nombre de mots de référence,
* est le nombre de substitutions (mots incorrectement reconnus),
* est le nombre de suppressions (mots omis),
* est le nombre d'insertions (mots ajoutés),
* est le nombre de mots correctement reconnus. Le taux de reconnaissance de mots, ou word accuracy (WAcc) en anglais, est défini ainsi : Ce taux de reconnaissance peut être négatif.
rdf:langString
Word error rate (WER) is a common metric of the performance of a speech recognition or machine translation system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence (supposedly the correct one). The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. The WER is a valuable tool for comparing different systems as well as for evaluating improvements within one system. This kind of measurement, however, provides no details on the nature of translation errors and further work is therefore required to identify the main source(s) of error and to focus any research effort. This problem is solved by first aligning the recognized word sequence with the reference (spoken) word sequence using dynamic string alignment. Examination of this issue is seen through a theory called the power law that states the correlation between perplexity and word error rate. Word error rate can then be computed as: where
* S is the number of substitutions,
* D is the number of deletions,
* I is the number of insertions,
* C is the number of correct words,
* N is the number of words in the reference (N=S+D+C) The intuition behind 'deletion' and 'insertion' is how to get from the reference to the hypothesis. So if we have the reference "This is wikipedia" and hypothesis "This _ wikipedia", we call it a deletion. When reporting the performance of a speech recognition system, sometimes word accuracy (WAcc) is used instead: Note that since N is the number of words in the reference, the word error rate can be larger than 1.0, and thus, the word accuracy can be smaller than 0.0.
xsd:nonNegativeInteger
7005