Lemma

 

  1. Was ist ein Lem­ma?
  2. Lem­ma­ti­sie­rung
  3. War­um ist das Lem­ma für die Com­pu­ter­lin­gu­is­tik wich­tig?

 

Was ist ein Lemma?

 

Als Lem­ma wird in der Lin­gu­is­tik und in der Lexi­ko­gra­phie die Form eines Wor­tes ver­stan­den, unter der sie in einem Wör­ter­buch ein­ge­tra­gen ist. Ein Lem­ma ist sozu­sa­gen das Stich­wort in dem jewei­li­gen Nach­schla­ge­werk. Hilf­reich ist dies, da nicht alle mög­li­chen Wort­for­men eines Wor­tes einen eige­nen Ein­trag in einem Lexi­kon bekom­men. Zum Bei­spiel sind lau­fe, läufst, lau­fen, läuft For­men von ein und der­sel­ben Grund­form: lau­fen; lau­fen ist dabei das Lem­ma.

Der Begriff des Lem­mas hängt eng zusam­men mit dem des Lexems. Ein Lexem ist ein seman­ti­sches Kon­zept, das beim Ord­nen von flek­tier­ten Wort­for­men hel­fen soll. Als flek­tiert gilt ein Wort, wenn es durch gram­ma­ti­ka­li­sche Anpas­sung nicht mehr in sei­ner Grund­form steht. Also immer dann, wenn es kon­ju­giert oder auch dekli­niert wur­de. So bil­den zum Bei­spiel die kon­ju­gier­ten Wort­for­men gebe, gibst, gibt, gebt, geben, gab, gabst, gaben, gäbe, gäbest, gäbet, gäben, gege­ben, gib zusam­men das Lexem GEBEN. Das Lexem kann man sich dem­nach als Abs­trak­ti­on aus der Men­ge der mög­li­chen For­men eines Wor­tes vor­stel­len.

Wie unter­schei­den sich jetzt aber Lexe­me und Lem­ma­ta? Eine Unter­schei­dung gelingt über die Betrach­tung im funk­tio­nel­len Kon­text. Denn tat­säch­lich wird, je nach Spra­che, oft­mals das Lexem auch als Lem­ma genutzt. Ein Lem­ma defi­niert sich also vor allem über sei­ne Eigen­schaft, das Stich­wort in einem Wör­ter­buch oder Lexi­kon zu sein.

 

Lemmatisierung

 

Der Vor­gang, der fest­legt, wel­ches Lem­ma für den jewei­li­gen Begriff genutzt wird, heißt Lem­ma­ti­sie­rung. Dabei ist die Fest­le­gung die­ser Grund­form prin­zi­pi­ell belie­big, unter­liegt aber gewis­sen Kon­ven­tio­nen. Im Deut­schen hat es sich durch­ge­setzt Ver­ben im Infi­ni­tiv Prä­sens Aktiv (z.B. lau­fen) zu zitie­ren, Nomen wer­den für gewöhn­lich im Nomi­na­tiv Sin­gu­lar zitiert (z.B. Lauf). In ande­ren Spra­chen kön­nen aber durch­aus ande­re Kon­ven­tio­nen für die Bil­dung von Lem­ma­ta gel­ten.

 

Warum ist das Lemma für die Computerlinguistik wichtig?

 

In der Com­pu­ter­lin­gu­is­tik ist die Lem­ma­ti­sie­rung unter ande­rem hilf­reich, um Aus­sa­gen dar­über tref­fen zu kön­nen, wie häu­fig ein Wort in einem Text vor­kommt. Das wie­der­um kann in einem spä­te­ren Schritt dafür wich­tig wer­den, wenn die Maschi­ne in einer seman­ti­schen Ana­ly­se Inhal­te erfas­sen und ein­ord­nen will.

Die Anle­gung eines Lem­ma-Lexi­kons ist grund­le­gend hier­für, da die Zahl der Wort­for­men durch Fle­xi­on bedeu­tend grö­ßer ist als die Anzahl der zuge­hö­ri­gen Wör­ter. Fol­gen­des Bei­spiel soll das ver­deut­li­chen:

Als wir durch den Wald lie­fen habe ich ihr gesagt, dass ich von allem auf und davon lau­fen will. Sie lach­te nur und sag­te: ‘Du läufst nie­mals davon.’ Doch da war ich schon los­ge­rannt und lief und lief, bis mei­ne Bei­ne mich nicht mehr tra­gen konn­ten.”

Hier fin­den wir fünf syn­tak­ti­sche Wör­ter mit vier ver­schie­de­nen Wort­for­men vor (liefen/laufen/läufst/lief/lief). Ohne die Anla­ge eines Lexi­kons wür­de die Maschi­ne nicht erken­nen, dass es sich im fol­gen­den Bei­spiel wie­der­ho­lend um flek­tier­te For­men des Wor­tes lau­fen han­delt. Ledig­lich die bei­den Vari­an­ten lief wür­den als iden­tisch erkannt wer­den.

Ver­fügt die Maschi­ne aber über ein Lem­ma Lexi­kon, das ihr ermög­licht die Begrif­fe zu sor­tie­ren und als flek­tier­te For­men des glei­chen Begriffs zu erken­nen, ist das eine wich­ti­ge Vor­aus­set­zung für eine seman­ti­sche Text-Ana­ly­se.

 

 

Quel­len:

  • Gall­mann, Peter: Wort, Lexem und Lem­ma. In: Augst, Ger­hard / Scha­eder, Burk­hard: Recht­schreib­wör­ter­bü­cher in der Dis­kus­si­on. Geschich­te – Ana­ly­se – Per­spek­ti­ven. Frank­furt am Main / Bern / New York / Paris, 1991: Peter Lang (= Theo­rie und Ver­mitt­lung der Spra­che, 13). Sei­ten 261–280.
  • Haß-Zum­kehr, Ulri­ke: Das Wort in der Kor­pus­lin­gu­is­tik. In: von Ágel, Vilmos/Gardt, Andreas/ Haß-Zum­kehr, Ulrike/Roelcke, Thors­ten (Hrsg.): «Das Wort. Sei­ne struk­tu­rel­le und kul­tu­rel­le Dimen­si­on. Fest­schrift für Oskar Reich­mann zum 65. Geburts­tag. Tübin­gen: Nie­mey­er, 2001. S. 45–70.
  • Haus­ser, Roland: Grund­la­gen der Com­pu­ter­lin­gu­is­tik. Mensch-Maschi­ne-Kom­mu­ni­ka­ti­on in natür­li­cher Spra­che. Ber­lin, Hei­del­berg, New York, 2000. S. 274–277.
  • Glück, Hel­mut: etz­ler Lexi­kon Spra­che. Zwei­te, über­ar­bei­te­te und erwei­ter­te Auf­la­ge». Stuttgart/Weimar, 2000. S. 403 u. 407.
  • Mei­bau­er, Jörg: Ein­füh­rung in die ger­ma­nis­ti­sche Lin­gu­is­tik. 2. Aktua­li­sier­te Auf­la­ge. Stuttgart/Weimar, 2002, S. 17ff.