Définition et exemples de linguistique de corpus

Linguistique du corpus est l’étude de la langue basée sur de grandes collections d’utilisation de la langue corpus (ou corpus) - bases de données informatisées créées pour la recherche linguistique. Aussi connu sous le nom études basées sur des corpus.

La linguistique de corpus est considérée par certains linguistes comme un outil ou une méthodologie de recherche, et par d'autres comme une discipline ou une théorie à part entière. Kuebler et Zinsmeister concluent que "la réponse à la question de savoir si la linguistique de corpus est une théorie ou un outil est simplement qu'elle peut être les deux. Cela dépend de la façon dont la linguistique de corpus est appliquée" (Linguistique de corpus et corpus annotés linguistiquement, 2015).

Bien que les méthodes utilisées en linguistique de corpus aient été adoptées pour la première fois au début des années 1960, le terme linguistique du corpus n'apparut que dans les années 80.

Exemples et observations

  • "[C] Linguistique orpus est… une méthodologie, comprenant un grand nombre de méthodes connexes qui peuvent être utilisées par des chercheurs de nombreuses tendances théoriques différentes. D'un autre côté, on ne peut nier que la linguistique de corpus est également fréquemment associée à une certaine vision de la langue. Au centre de cette perspective se trouve que les règles du langage sont basées sur l'utilisation et que des changements se produisent lorsque les locuteurs utilisent le langage pour communiquer entre eux. L'argument est que si vous êtes intéressé par le fonctionnement d'une langue particulière, comme l'anglais, c'est une bonne idée d'étudier la langue utilisée. Une façon efficace de le faire est d’utiliser la méthodologie du corpus… »(Hans Lindquist, Linguistique de corpus et description de l'anglais. Edinburgh University Press, 2009)
  • "Les études sur les corpus ont explosé à partir de 1980, à mesure que les corpus, les techniques et les nouveaux arguments en faveur de l'utilisation des corpus devenaient plus apparents. Actuellement, ce boom se poursuit - et les deux" écoles "de linguistique du corpus grandissent… La linguistique de corpus mûrit méthodologiquement et la gamme de langues abordées par les linguistes de corpus augmente chaque année. »(Tony McEnery et Andrew Wilson, Linguistique du corpus, Edinburgh University Press, 2001)

Linguistique de corpus en classe

  • "Dans le contexte de la classe, la méthodologie de linguistique du corpus est agréable pour les étudiants de tous niveaux, car il s'agit d'une étude «ascendante» de la langue nécessitant très peu d'expertise acquise au départ. Même les étudiants qui viennent à l'enquête linguistique sans appareil théorique apprennent très rapidement à avancer leurs hypothèses sur la base de leurs observations plutôt que des connaissances reçues, et les testent par rapport aux preuves fournies par le corpus. "(Elena Tognini-Bonelli, La linguistique de corpus au travail. John Benjamins, 2001)
  • "Pour faire bon usage des ressources du corpus, un enseignant a besoin d'une orientation modeste aux routines impliquées dans la récupération d'informations du corpus, et - surtout - d'une formation et d'une expérience sur la façon d'évaluer ces informations." (John McHardy Sinclair, Comment utiliser les corpus dans l'enseignement des langues, John Benjamins, 2004)

Analyses quantitatives et qualitatives

  • "Les techniques quantitatives sont essentielles pour les études basées sur des corpus. Par exemple, si vous vouliez comparer l'utilisation de la langue des modèles pour les mots gros et grand, vous auriez besoin de savoir combien de fois chaque mot apparaît dans le corpus, combien de mots différents co-apparaissent avec chacun de ces adjectifs (les collocations) et à quel point chacun de ces collocations est commun. Ce sont toutes des mesures quantitatives…
    "Une partie cruciale de l'approche basée sur le corpus va au-delà des modèles quantitatifs pour proposer des interprétations fonctionnelles expliquant pourquoi les modèles existent. En conséquence, une grande quantité d'efforts dans les études basées sur le corpus est consacrée à expliquer et à illustrer les modèles quantitatifs." (Douglas Biber, Susan Conrad et Randi Reppen, Linguistique de corpus: étude de la structure et de l'utilisation du langage, Cambridge University Press, 2004)
  • "[Dans linguistique du corpus les méthodes quantitatives et qualitatives sont largement utilisées en combinaison. Il est également caractéristique de la linguistique des corpus de commencer par des résultats quantitatifs et de travailler vers des résultats qualitatifs. Mais… la procédure peut avoir des éléments cycliques. En général, il est souhaitable de soumettre les résultats quantitatifs à un examen qualitatif - en essayant d'expliquer pourquoi un modèle de fréquence particulier se produit, par exemple. Mais d'un autre côté, l'analyse qualitative (en utilisant la capacité de l'enquêteur à interpréter des échantillons de langage dans leur contexte) peut être le moyen de classer des exemples dans un corpus particulier par leur signification; et cette analyse qualitative peut alors être l’entrée d’une analyse quantitative supplémentaire, basée sur le sens… "(Geoffrey Leech, Marianne Hundt, Christian Mair et Nicholas Smith, Changement dans l'anglais contemporain: une étude grammaticale. Cambridge University Press, 2012)