Für alle, die im Bereich Natural Language Processing/Natural Language Understanding (NLP/NLU) arbeiten, ist es sehr nützlich, ein formales Verständnis davon zu entwickeln, wie Sprachen strukturiert sind; nicht nur, sie sprechen oder verstehen zu können. Dieser Artikel bietet eine einfache Erklärung der grundlegenden Konzepte der Linguistik, ihrer Entwicklung und der Methoden, mit denen Sprache untersucht wird.
Die Geschichte der Linguistik
Zu Beginn des 20. Jahrhunderts, zwischen 1906 und 1911, hielt Ferdinand de Saussure, ein Schweizer Linguist und Semiotiker, Vorlesungen zur Linguistik an der Universität Genf. 1916, nach Saussures Tod, veröffentlichten seine Studenten Charles Bally und Albert Sechehaye das Werk „Cours de linguistique générale“ (deutsch: „Grundfragen der allgemeinen Sprachwissenschaft“) basierend auf seinen Vorlesungsnotizen. Damit wurde der Grundstein der modernen Linguistik, insbesondere der strukturalistischen Linguistik, gelegt.
Vor Christus
Schon vor Saussure wurde Sprache und ihre Struktur auf unterschiedliche Weise untersucht. Die früheste bekannte systematische Beschreibung stammt aus dem 6. Jahrhundert v. Chr. aus Indien, als Panini rund 4.000 Regeln zur Morphologie des Sanskrit formulierte.
Antikes Griechenland
Im antiken Griechenland erwähnt Platon in seinem Dialog Cratylos, dass Wörter ewige Konzepte seien und in einer Welt der Ideen existieren. Als die Universität von Alexandria um 280 v. Chr. gegründet wurde und Griechisch an Sprecher anderer Sprachen gelehrt wurde, wurde erstmals der Begriff „Grammatik“ (téchnē grammatikḗ, Τέχνη Γραμματική) verwendet, ursprünglich im Sinne von „die Kunst des Schreibens“.
Mittelalter
Im Mittelalter wurde Sprache unter dem Begriff Philologie untersucht. Jacob Grimm schrieb im 18. Jahrhundert die Deutsche Grammatik, die als eines der ersten großen wissenschaftlichen Werke der Linguistik gilt. Wilhelm von Humboldt definierte menschliche Sprache als ein regelbasiertes System, mit dem sich eine unendliche Anzahl von Sätzen mithilfe endlicher grammatischer Regeln bilden lässt.
Die Gegenwart
Zur modernen Linguistik zurückkehrend: Saussure prägte das zentrale Konzept des Zeichens (sign), das sich aus „Signifikat“ und „Signifikant“ zusammensetzt.
- Das Signifikat ist die Idee oder das Konzept, und
- der Signifikant ist die Form, mit der dieses Konzept ausgedrückt wird.
Einfach gesagt: Das Signifikat ist das, was hinter einem Wort steht: die Bedeutung oder Idee. Der Signifikant ist die sprachliche Form, also wie wir diese Bedeutung ausdrücken, zum Beispiel durch geschriebene Buchstaben oder gesprochene Laute.
Für Saussure sollten Zeichen synchronisch untersucht werden, da sie nur im Gegensatz zu anderen Zeichen eindeutig definiert werden können.
Nach dem Strukturalismus entwickelten sich viele linguistische Richtungen weiter. Zwei der wichtigsten sind:
- Generativismus
In der zweiten Hälfte des 20. Jahrhunderts entwickelte Noam Chomsky den Generativismus. Dieser basiert vor allem auf Syntax, bezieht aber auch andere sprachliche Ebenen wie Phonologie und Morphologie ein. Laut Chomsky besteht die erste Aufgabe der Linguistik darin, die Universalgrammatik zu beschreiben: ein Satz syntaktischer Regeln, der allen Menschen gemeinsam ist und allen Sprachen zugrunde liegt. Der Generativismus geht davon aus, dass diese Universalgrammatik angeboren im menschlichen Gehirn verankert ist.
- Funktionalismus
Im Gegensatz zu Chomsky veröffentlichte Michael Halliday 1985 „An Introduction to Functional Grammar“. Hallidays Ansatz basiert auf sozialer Interaktion und umfasst ein breites Spektrum an Themen, in die auch die Linguistik eingebettet ist.
Sprache wird bei Halliday als soziales semiotisches System verstanden. Sie entwickelt sich als System von Bedeutungspotenzialen bzw. als eine Sammlung von Ressourcen, die beeinflussen, was Sprecher in einem bestimmten sozialen Kontext mit Sprache tun können. Anders gesagt: Sprache ist nicht nur eine Sammlung von Sätzen, sondern ein Austausch von Bedeutungen in sozialen Kontexten, geprägt durch Entscheidungen der Sprecher.
Die fünf Ebenen der Sprachanalyse
Sprachen werden typischerweise auf fünf Ebenen analysiert. Wir beginnen mit der kleinsten Einheit und arbeiten uns zur größten vor.
- Phonetik und Phonologie beschäftigen sich mit den Lauten der menschlichen Sprache. Die Phonetik untersucht, wie Laute produziert, übertragen und wahrgenommen werden. Ihre kleinste Einheit ist das Phonem, eine bedeutungsunterscheidende Lauteinheit in einer Sprache. Die Phonologie hingegen klassifiziert diese Laute innerhalb des Systems einer bestimmten Sprache.
- Die nächstgrößere Einheit ist die Morphologie, die sich mit Wörtern beschäftigt: wie sie gebildet werden und wie sie miteinander in Beziehung stehen. Wörter bestehen aus kleinsten Bedeutungseinheiten, sogenannten Morphemen. Zum Beispiel besteht „Worker“ (Arbeiter) aus dem Stamm „Work“ und dem Suffix „-er“, das daraus ein Nomen macht.
- Die Syntax ist der Bereich der Linguistik, der sich mit Sätzen beschäftigt – insbesondere mit den Regeln, die die Struktur von Sätzen bestimmen. Sie untersucht, wie Wörter angeordnet und kombiniert werden, um Bedeutung korrekt zu vermitteln.
- Die Semantik beschäftigt sich damit, wie Bedeutung in menschlichen Sprachen grundsätzlich funktioniert. Dabei steht die wörtliche Bedeutung von Wörtern im Mittelpunkt des Sprachsystems.
- Die Pragmatik schließlich betrachtet, wie Bedeutung in der Praxis verwendet wird und wie der Kontext sie beeinflusst. Sie erklärt, wie Sprecher Mehrdeutigkeiten auflösen, da Bedeutung auch von Situation, Ort, Zeit, Vorwissen und anderen Kontextfaktoren abhängt.