Einführung in Natural Language Processing mit NLP++
Seite 4: Glossar
Glossar
Die Definitionen wurden von Wikipedia entnommen übersetzt, leicht modifiziert und gekürzt.
- Information Extraction: Automatisierte Extrahierung strukturierter Informationen von unstrukturierten und halbstrukturierten Texten.
- Information Retrieval: Abfrage einer gesuchten Information aus einer Sammlung von Text- oder Datenquellen.
- Machine Learning: ein Teilgebiet der Informatik und Statistik. Es geht um den Aufbau und das Verstehen von Systemen, die von Daten lernen, ohne nur explizit programmierte Instruktionen zu nutzen.
- Natural Language Processing: Schnittstelle zwischen Linguistik und Informatik. Mit NLP untersucht man, wie sich natürliche Sprache (geschrieben und gesprochen) mit Algorithmen verarbeiten lässt.
- POS: In der Grammatik ist eine Wortart (Part of Speech) eine linguistische Kategorie von lexikalischen Einheiten, die durch syntaktische oder morphologische Regeln definiert werden. Wortarten sind zum Beispiel Nomen, Adjektiv und Adverb.
- Sentiment Analysis, auch Opinion Mining genannt: Durch die Anwendung von Natural Language Processing, Textanalyse und Computerlinguistik werden subjektive Informationen aus dem Quellmaterial (z. B. Twitter, Facebook und CRM-Systemen) identifiziert und extrahiert.
- Morphologie: Struktur der Wörter.
- Syntax: ein Teilgebiet der Grammatik natürlicher Sprachen, das den Aufbau von Sätzen aus elementaren Bausteinen (Wörtern bzw. Wortgruppen) behandelt, auch Satzlehre genannt.
- Semantik: Bedeutung und Wissen.
- Text Analysis und Text Analytics: Oft werden beide Begriffe synonym verwendet, was nicht ganz korrekt ist. Beides sind Teilgebiete des Text Mining. Eine Analyse untersucht die Struktur, die Zusammensetzung, den Aufbau, die Bedeutung und liefert Erkenntnisse und Zusammenhänge. Die Analyse ist heuristisch, informal und qualitativ. Die Analytik dagegen ist algorithmisch und wendet systematisch numerische und statistische Methoden an, die quantitative Informationen in Form von Indikatoren, Tabellen oder Visualisierungen liefern. Die Analytik ist formal und reproduzierbar. (Quelle: Seth Grimes; Naming & Classifying: Text Analysis Vs. Text Analytics)
(ane)