Medusa: Performante Textstatistiken auf grossen Textmengen

Mit dem exponentiellen Wachstum der zur Verfügung stehenden Daten im Internet, wächst auch das darin gespeicherte Wissen. Ziel dieser Arbeit ist, verschiedene statistische Verfahren zur Extraktion von semantischen und syntaktischen Beziehungen zwischen Wörtern zu vergleichen. Dabei werden neben klassischen Kookurrenzen auch die distanzabhängigen Kookkurrenzen eingeführt. Diese Aufgaben setzen große Datenmengen voraus. Um dies auch auf mehrere Millionen Sätze anwenden zu können, werden performante Datenstrukturen benötigt. Weiterhin werden einige Heuristiken für das performante Speichern von mehreren Milliarden Kookkurrenz-Datensätzen vorgestellt und deren Auswirkungen gemessen.

82,00 CHF

Lieferbar


Artikelnummer 9783639011258
Produkttyp Buch
Preis 82,00 CHF
Verfügbarkeit Lieferbar
Einband Kartonierter Einband (Kt)
Meldetext Folgt in ca. 5 Arbeitstagen
Autor Büchler, Marco
Verlag VDM Verlag Dr. Müller e.K.
Weight 0,0
Erscheinungsjahr 2013
Seitenangabe 128
Sprache ger
Anzahl der Bewertungen 0

Dieser Artikel hat noch keine Bewertungen.

Eine Produktbewertung schreiben