Les lemmes expliqués

En morphologie et lexicologie, forme d'un mot qui apparaît au début d'une entrée de dictionnaire ou de glossaire: a mot-clé.

Le lemme, dit David Crystal, est "essentiellement une représentation abstraite, englobant toutes les variations lexicales formelles qui peuvent s'appliquer" (Dictionnaire de linguistique et de phonétique, 2008).

Le lemme expliqué par Malliday et Yallop

"Le lemme est la forme de base sous laquelle le mot est entré [dans un dictionnaire] et attribué sa place: généralement, la" racine ", ou la forme la plus simple (nom singulier, verbe présent / infinitif, etc.). D'autres formes peuvent ne pas être saisis s'ils sont prévisibles (comme le pluriel ours, non donné ici); mais les formes passées irrégulières des verbes sont données (irrégulières dans le sens où elles ne suivent pas le modèle par défaut -ed) et il y a également une indication sous Couper que le t doit être doublé dans l'orthographe des formes fléchies comme Coupe. Une forme irrégulière peut apparaître comme un lemme distinct, avec références croisées. Ce dictionnaire [les deux volumes Nouveau dictionnaire anglais Oxford plus court, 1993] a une telle entrée pour porté v. Pennsylvanie. pple et ppl a. de BEAR v., indiquant que porté est le participe passé et l'adjectif participatif du verbe ours."

(M. A. K. Halliday et Colin Yallop, Lexicologie: une brève introduction. Continuum, 2007)

Lemmes et lexèmes

"Le terme conventionnel lemme est actuellement utilisé dans la recherche sur les corpus et les études psycholinguistiques comme quasi-synonyme de lexème. Mais le lemme ne peut pas être confondu avec les lexèmes. Par exemple, les éditeurs du Corpus national britannique avertir les utilisateurs que des éléments tels que les verbes à particule, c'est-à-dire les verbes contenant deux ou trois parties comme s'avérer, ou hâte de, que les lexicologues traitent comme des unités lexicales, on ne peut y accéder que par des lemmes séparés. Dans le cas de s'avérer, il contient deux lemmes, et dans celui de hâte de, Trois. De plus, la distinction homonymique n'est pas toujours établie par les éditeurs de listes contenant des lemmes (Leech, Rayson et Wilson 2001).
"Cependant, un lemme ressemble au concept de lexème à d'autres égards. Les corpus linguistiques permettent deux recherches de base, dont l'une produit des listes de mots lemmatisées, c'est-à-dire des listes de mots contenant des lemmes, et une autre contenant des listes de mots non emmatisées, c'est-à-dire des listes de mots contenant formes de mots…
"Enfin, les mots-clés de dictionnaire ne peuvent pas toujours être identifiés par des lexèmes. Par exemple, le mot-clé bulle, dans un dictionnaire comme le OALD [Oxford Advanced Learner's Dictionary] contient des informations sur le nom bulle et le verbe bulle dans la même entrée. Pour un lexicologue, il s'agit de deux lexèmes différents. "
(Miguel Fuster Márquez, "Lexicologie anglaise." Travailler avec les mots: une introduction à la linguistique anglaise, éd. par Miguel Fuster et Antonia Sánchez. Universitat de València, 2008)

Le statut morphologique des lemmes

"Quel est le statut morphologique des lemmes? Plusieurs hypothèses ont été avancées, par exemple:

1) que chaque «mot» (forme libre), y compris les formes flexionnelles et les formations de mots, a sa propre entrée et correspond à un lemme; un plus faible est
2) que tous les mots n'ont pas leur propre entrée, c'est-à-dire que les formes d'inflexion `` régulières '' et peut-être les formations de mots constituent une partie de l'entrée de la base et sont accessibles via cette base;
3) que les tiges ou les racines, plutôt que les formes autonomes, forment le lemme, indépendamment du fait que d'autres formes dérivées de celles-ci soient "régulières" ou non. "

(Amanda Pounder, Processus et paradigmes dans la morphologie de la formation des mots. Mouton de Gruyter, 2000)

Mesure de la fréquence du lemme

"[T] voici un problème avec la fréquence des mots dans la mesure où la mesure correcte de la fréquence n'est pas claire. Il existe plusieurs façons de compter la fréquence des mots et celles-ci ne sont pas neutres en théorie
"Un exemple est la fréquence du lemme; c'est la fréquence cumulative de toutes les fréquences de forme de mots des mots dans un paradigme flexionnel. La fréquence du lemme du verbe Aidez-moi, par exemple, est la somme des fréquences de forme de mot de aide, aide, aide et portion. Dans les comptes rendus du traitement du langage dans lequel les formes d'inflexion régulières sont décomposées et mappées sur les morphèmes de racine, nous nous attendrions à ce que la fréquence de la racine soit plus critique pour déterminer les latences de réponse que la fréquence de forme de mot et donc la fréquence du lemme jouerait un rôle important.
"Les comptes dans lesquels d'autres formes complexes sont également décomposées (par exemple, les inflexions, les dérivations et les composés) mettront plutôt l'accent sur la fréquence cumulative du morphème, qui est la somme des fréquences de tous les mots complexes dans lesquels un morphème racine apparaît. Par exemple, le fréquence des morphèmes cumulés de Aidez-moi serait la somme de la fréquence du lemme de Aidez-moi ainsi que les fréquences de lemme serviable, impuissant, impuissant etc. Une autre mesure, la taille de la famille, est le nombre de types de mots dans lesquels un morphème se produit, plutôt que le nombre de jetons qu'il contient. Le mot Aidez-moi a une famille de dix personnes. "
(Michael A. Ford, William D. Marslen-Wilson et Matthew H. Davis, «Morphologie et fréquence: méthodologies contrastées». Structure morphologique dans le traitement du langage, éd. par R. Harald Baayen et Robert Schreuder. Mouton de Gruyter, 2003)