Lemmatisation
http://dbpedia.org/resource/Lemmatisation an entity of type: Abstraction100002137
La lematització és l'acció i efecte de lematitzar, procés pel qual en un recull lexicogràfic totes les realitzacions en què es pot presentar una mateixa paraula resten associades al seu lema o forma canònica, que esdevindrà única entrada i síntesi referencial per a totes les formes possibles d'aquest mot.
rdf:langString
Lemmatizátor je nástroj (např. počítačový program), který vytvoří (vyhledá v databázi) k určitému tvaru slova základní tvar, tzv. lemma.Doplňkovou funkcí lemmatizátoru jsou informace o (např. jmenných a slovesných) k danému tvaru.Např. pro tvar „barvě“ lemmatizátor vrátí tvar „barva“, případně doplňkovou informaci podstatné jméno, ženský rod, jednotné číslo, 3./6. pád. Lemmatizace se např. využívá se pro vyhledávání ve fulltextových databázích. Pro fulltextové vyhledávání se ovšem využívají i podobně strukturovaná data sloužící k automatické kontrole pravopisu (např. slovníky pro hunspell).
rdf:langString
La lemmatisation désigne un traitement lexical apporté à un texte en vue de son classement dans un index ou de son analyse. Ce traitement consiste à appliquer aux occurrences des lexèmes sujets à flexion (en français, verbes, substantifs, adjectifs) un codage renvoyant à leur entrée lexicale commune (« forme canonique » enregistrée dans les dictionnaires de la langue, le plus couramment), que l'on désigne sous le terme de lemme.
rdf:langString
Лемматиза́ция — процесс приведения словоформы к лемме — её нормальной (словарной) форме.
rdf:langString
La lematización es un proceso lingüístico que consiste en, dada una forma flexionada (es decir, en plural, en femenino, conjugada, etc), hallar el lema correspondiente. El lema es la forma que por convenio se acepta como representante de todas las formas flexionadas de una misma palabra. Es decir, el lema de una palabra es la palabra que nos encontraríamos como entrada en un diccionario tradicional: singular para sustantivos, masculino singular para adjetivos, infinitivo para verbos. Por ejemplo, decir es el lema de dije, pero también de diré o dijéramos; guapo es el lema de guapas; mesa es el lema de mesas.
rdf:langString
Lematizazioa hitz bati dagokion oinarrizko lortzean datza. Prozesu honek hitzari perpaus baten dagokion definitzeko beharra du, eta beraz, hizkuntzaren gramatikaren ezagutza beharrezkoa du. Hizkuntza askotan hitzaren bukaeran moldaketak izaten dituzte. Adibidez, euskaraz, eman aditza aldaera ezberdinetan ager daiteke, hala nola ematen, emateko, emango, emanen edo emandako. Oinarrizko forma, eman, hiztegi batean agertuko litzatekeen hori, 'lema' dela esan ohi da. Oinarrizko forma hau batekin bateratzean lexema izena hartzen du. Adibidez:
rdf:langString
Lemmatisation (or lemmatization) in linguistics is the process of grouping together the inflected forms of a word so they can be analysed as a single item, identified by the word's lemma, or dictionary form.
rdf:langString
La lemmatizzazione è il processo di riduzione di una forma flessa di una parola alla sua forma canonica (non marcata), detta lemma.Nell'elaborazione del linguaggio naturale, la lemmatizzazione è il processo algoritmico che determina automaticamente il lemma di una data parola. Il processo può coinvolgere altre attività di elaborazione del linguaggio, quali ad esempio l'analisi morfologica e grammaticale.
rdf:langString
rdf:langString
Lematització
rdf:langString
Lemmatizátor
rdf:langString
Lematización
rdf:langString
Lematizazio
rdf:langString
Lemmatisation
rdf:langString
Lemmatisation
rdf:langString
Lemmatizzazione
rdf:langString
Лемматизация
rdf:langString
詞形還原
xsd:integer
504223
xsd:integer
1107111115
rdf:langString
La lematització és l'acció i efecte de lematitzar, procés pel qual en un recull lexicogràfic totes les realitzacions en què es pot presentar una mateixa paraula resten associades al seu lema o forma canònica, que esdevindrà única entrada i síntesi referencial per a totes les formes possibles d'aquest mot.
rdf:langString
Lemmatizátor je nástroj (např. počítačový program), který vytvoří (vyhledá v databázi) k určitému tvaru slova základní tvar, tzv. lemma.Doplňkovou funkcí lemmatizátoru jsou informace o (např. jmenných a slovesných) k danému tvaru.Např. pro tvar „barvě“ lemmatizátor vrátí tvar „barva“, případně doplňkovou informaci podstatné jméno, ženský rod, jednotné číslo, 3./6. pád. Lemmatizace se např. využívá se pro vyhledávání ve fulltextových databázích. Pro fulltextové vyhledávání se ovšem využívají i podobně strukturovaná data sloužící k automatické kontrole pravopisu (např. slovníky pro hunspell).
rdf:langString
La lematización es un proceso lingüístico que consiste en, dada una forma flexionada (es decir, en plural, en femenino, conjugada, etc), hallar el lema correspondiente. El lema es la forma que por convenio se acepta como representante de todas las formas flexionadas de una misma palabra. Es decir, el lema de una palabra es la palabra que nos encontraríamos como entrada en un diccionario tradicional: singular para sustantivos, masculino singular para adjetivos, infinitivo para verbos. Por ejemplo, decir es el lema de dije, pero también de diré o dijéramos; guapo es el lema de guapas; mesa es el lema de mesas. Lematizar implica estandarizar, desambiguar, segmentar y, en caso de usar programas de lematización automática, también etiquetar. La lematización puede realizarse automáticamente mediante programas de análisis morfológico. Hay diversos grados de lematización posible: podemos hacer una lematización puramente morfológica, o bien hacer una lematización sintáctica que tenga en cuenta el contexto en el que aparece la palabra. Por ejemplo, en un análisis morfólogico la palabra ama tendría dos lemas: el sustantivo ama y el verbo amar. Sin embargo, en un contexto sintáctico (es decir, en una oración), podemos desambiguarlo y optar por un único lema. Así, en El ama de llaves abrió la puerta, ama es sustantivo, mientras que en María ama a Pedro, ama es del verbo amar. Para poder hacer este tipo de lematización es necesario, por lo tanto, hacer un análisis sintáctico. La lematización es una tarea propia de la Lingüística Computacional, y es útil en la tecnología aplicada a buscadores, traductores automáticos, extracción de información y demás herramientas vinculadas al Procesamiento del Lenguaje Natural.
rdf:langString
Lematizazioa hitz bati dagokion oinarrizko lortzean datza. Prozesu honek hitzari perpaus baten dagokion definitzeko beharra du, eta beraz, hizkuntzaren gramatikaren ezagutza beharrezkoa du. Hizkuntza askotan hitzaren bukaeran moldaketak izaten dituzte. Adibidez, euskaraz, eman aditza aldaera ezberdinetan ager daiteke, hala nola ematen, emateko, emango, emanen edo emandako. Oinarrizko forma, eman, hiztegi batean agertuko litzatekeen hori, 'lema' dela esan ohi da. Oinarrizko forma hau batekin bateratzean lexema izena hartzen du. Lematizazioak lotura handia du stemming kontzeptuarekin. Ezberdintasun nagusia stemmer batek hitzarengan testuinguruaren ezagutzarik gabe eragitean datza, eta beraz, ezin da esanahi ezberdinak dituzten hitzak ezberdindu. Hala eta guztiz ere, stemmer-ak errazagoak dira sortzeko, azkarrago funtzionatzen dute eta baliteke bere mugek garrantzirik ez izatea hainbat aplikaziorentzako. Adibidez: 1.
* "hobe" hitzak "ongi" du bere lema, baina stemming-ak ez du hori antzematen, lematizazioak bai ordea. 2.
* "ekarriko" hitzak "ekarri" du bere lema, bai stemmer eta bai lematizatzaileak antzematen dutelarik.
rdf:langString
La lemmatisation désigne un traitement lexical apporté à un texte en vue de son classement dans un index ou de son analyse. Ce traitement consiste à appliquer aux occurrences des lexèmes sujets à flexion (en français, verbes, substantifs, adjectifs) un codage renvoyant à leur entrée lexicale commune (« forme canonique » enregistrée dans les dictionnaires de la langue, le plus couramment), que l'on désigne sous le terme de lemme.
rdf:langString
Lemmatisation (or lemmatization) in linguistics is the process of grouping together the inflected forms of a word so they can be analysed as a single item, identified by the word's lemma, or dictionary form. In computational linguistics, lemmatisation is the algorithmic process of determining the lemma of a word based on its intended meaning. Unlike stemming, lemmatisation depends on correctly identifying the intended part of speech and meaning of a word in a sentence, as well as within the larger context surrounding that sentence, such as neighboring sentences or even an entire document. As a result, developing efficient lemmatisation algorithms is an open area of research.
rdf:langString
La lemmatizzazione è il processo di riduzione di una forma flessa di una parola alla sua forma canonica (non marcata), detta lemma.Nell'elaborazione del linguaggio naturale, la lemmatizzazione è il processo algoritmico che determina automaticamente il lemma di una data parola. Il processo può coinvolgere altre attività di elaborazione del linguaggio, quali ad esempio l'analisi morfologica e grammaticale. In molte lingue, le parole appaiono in diverse forme flesse. Per esempio, in italiano il verbo camminare può apparire come cammina, camminò, camminando e così via. La forma canonica, camminare, è il lemma della parola ed è la forma di riferimento per cercare la parola all'interno di un dizionario. La combinazione della forma canonica con la relativa parte del discorso è chiamata il lessema della parola.
rdf:langString
Лемматиза́ция — процесс приведения словоформы к лемме — её нормальной (словарной) форме.
xsd:nonNegativeInteger
6446