In der Informatik sowie der maschinellen Sprachverarbeitung werden Merkmalsvektoren benutzt und mit ihnen gerechnet, um Eigenschaften von Daten oder Texten zu finden.
Konkrete Anwendung: Textklassifikation, z.B. Erkennen, ob eine eMail Spam ist oder nicht . Auf die erste Dimension können wir zum Beispiel packen, wie oft das Wort "kaufen" vorkommt, auf die zweite Dimension, wie oft das Wort "Bett" vorkommt, auf die dritte, wie oft das Wort... na jetzt denk dir selbst noch ein paar aus. Prinzipiell kannst du hier Tausende oder Millionen von Dimensionen nehmen, für jedes Wort eines.
Jetzt kommt die Trainingsphase: du hast 100 normale Mails und 100 Spams, von denen Menschen gesagt haben, dass sie normal/Spam sind. Von denen speicherst du die Vektoren ab.
Dann nimmst du eine neue Mail, die du klassifizieren möchtest, erstellst den Vektor und guckst, welchem anderen Vektor dieser am ähnlichsten ist. Dazu gibt es verschiedene Möglichkeiten, das sind dann Erfahrungswerte, was für Distanzmaße man nimmt. Einfachste Möglichkeit: man sucht den Vektor mit dem geringsten euklidischen Abstand zur neuen Mail und klassifiziert die neue Mail genauso. Man könnte auch im Vorfeld den Mittelpunkt aller Spams und den Mittelpunkt aller normalen anschauen und die Mail entsprechend klassifizieren, welchem Mittelpunkt sie näher ist.
Ganz ähnlich kann man auch an die Frage gehen, ob in einer Kundenrezension etwas Positives oder Negatives über ein Produkt gesagt wird (= "Sentiment Detection") aber hier bietet sich ein etwas ausgeklügelteres Verfahren eher an, weil das böse Wörtchen "nicht" ja alles umdreht ;-)
Falls dich das weiter interessiert, wären die Wörter "Text Mining", "Data Mining" oder auch "Computerlinguistik" interessant.