Sie befinden sich hierLinguistik Links / NLP & Text Mining

NLP & Text Mining

Latent Semantic Analysis:

  • LSA at CU Boulder - Online Implementation der LSA (verschiedene Korpora verfügbar)
  • conText - Hier sind deutschsprachige Korpora implemtentiert, vor deren Hintergrund man eine Latent Semantic Analysis durchführen kann. Das Programm conText, welches man herunterladen kann, ist ähnlich zu Summary Street, das an der Universität Boulder/Colorado entwickelt wurde.
  • Infomap NLP - Projekt zur gleichnamigem LSA Software (läuft unter Linux, unter Windows benötigt man Cygwin)

Weitere Linguistik Links:

  • Stanford Parser - In Java implementiert
  • TreeTagger - Dank WinTreeTagger, einem Interface für Windows, lässt sich der TreeTagger bequem unter Windows verwenden. Ansonsten besteht die Möglichkeit, ihn per Konsole in Windows oder Linux zu verwenden.
  • NLTK - Werkzeuge für die Sprachverarbeitung, geschrieben in Phyton. Unter Windows ist NLTK leicht zu installieren; sollten Fehler auftreten, unter Phyton einfach Module Docs anklicken, um möglicherweise geblockte Module ausfindig um machen. Diese dann zulassen.
  • WordNet - Lexiaklische Datenbank des Englischen, die u.a. Synonyme und Antonyme enthält
  • R - Statistik-Software mit einer Unmenge an Paketen (z.B. dem TM Paket für Text Mining) für verschiedene Aufgaben
  • JavaRAP - u.a. Anaphernresolution; leider jedoch nicht mir allzu guten Ergebnissen. Beispiel: We gave the bananas to the monkeys because they were hungry.