Was ist n-Gramm in R?
ngram ist ein R-Paket zum Konstruieren von N-Grammen („Tokenisieren“) sowie zum Generieren von neuem Text basierend auf der N-Gramm-Struktur einer gegebenen Texteingabe („Babbling“). Das Paket kann für ernsthafte Analysen oder zum Erstellen von „Bots“ verwendet werden, die amüsante Dinge sagen. Weitere Informationen finden Sie im Detailabschnitt unten.
Was ist eine N-Gramm-Tüte mit Wörtern??
Bag of N-Grams ist eine natürliche Erweiterung von Bag of Words. Ein n-Gramm ist einfach eine beliebige Folge von n Token (Wörtern). Angesichts des folgenden Rezensionstextes – „Absolut wunderbar – seidig und sexy und bequem“ könnten wir dies also aufteilen in: 1-Gramm: Absolut, wunderbar, seidig und, sexy und bequem.
Was ist ein N-Gramm-Beispiel??
Ein N-Gramm bedeutet eine Folge von N Wörtern. Zum Beispiel ist „Medium blog“ ein 2-Gramm (ein Bigramm), „A Medium blog post“ ist ein 4-Gramm und „Write on Medium“ ist ein 3-Gramm (Trigram). Nun, das war nicht sehr interessant oder aufregend.