In der Informatik sowie der maschinellen Sprachverarbeitung werden Merkmalsvektoren benutzt und mit ihnen gerechnet, um Eigenschaften von Daten oder Texten zu finden.

Konkrete Anwendung: Textklassifikation, z.B. Erkennen, ob eine eMail Spam ist oder nicht . Auf die erste Dimension können wir zum Beispiel packen, wie oft das Wort "kaufen" vorkommt, auf die zweite Dimension, wie oft das Wort "Bett" vorkommt, auf die dritte, wie oft das Wort... na jetzt denk dir selbst noch ein paar aus. Prinzipiell kannst du hier Tausende oder Millionen von Dimensionen nehmen, für jedes Wort eines.

Jetzt kommt die Trainingsphase: du hast 100 normale Mails und 100 Spams, von denen Menschen gesagt haben, dass sie normal/Spam sind. Von denen speicherst du die Vektoren ab.

Dann nimmst du eine neue Mail, die du klassifizieren möchtest, erstellst den Vektor und guckst, welchem anderen Vektor dieser am ähnlichsten ist. Dazu gibt es verschiedene Möglichkeiten, das sind dann Erfahrungswerte, was für Distanzmaße man nimmt. Einfachste Möglichkeit: man sucht den Vektor mit dem geringsten euklidischen Abstand zur neuen Mail und klassifiziert die neue Mail genauso. Man könnte auch im Vorfeld den Mittelpunkt aller Spams und den Mittelpunkt aller normalen anschauen und die Mail entsprechend klassifizieren, welchem Mittelpunkt sie näher ist.

Ganz ähnlich kann man auch an die Frage gehen, ob in einer Kundenrezension etwas Positives oder Negatives über ein Produkt gesagt wird (= "Sentiment Detection") aber hier bietet sich ein etwas ausgeklügelteres Verfahren eher an, weil das böse Wörtchen "nicht" ja alles umdreht ;-)

Falls dich das weiter interessiert, wären die Wörter "Text Mining", "Data Mining" oder auch "Computerlinguistik" interessant.

...zur Antwort

Ich bin ein Sprach-Chamäleon und passe mich nach kurzer Zeit meinem Gegenüber an.

...zur Antwort

Der Abstand zwischen Stimmbändern und Lippen ist die Länge des Sprachrohrs. Wenn das länger ist, ist die natürliche Stimmlage tiefer, ist dieses Rohr kürzer ist die Stimme höher.

Falls es mit den Stimmlippen zu tun hat, dann aber bestimmt nicht allein, weil das mit dem Sprachrohr jedenfalls stimmt.

Deswegen erwarten wir von einem 2-Meter-Kerl eine echt tiefe Stimme und kein Gepiepse. (die Länge des Sprachrohrs korrelliert mit der Körpergröße)

...zur Antwort

Die Mächtigkeit der Menge der natürlichen Zahlen ist - ebenso wie die der rationalen Zahlen - abzählbar unendlich. Wie bereits in einer anderen Antwort erwähnt, gibt es auch überabzählbar unendliche Mächtigkeiten von Mengen.

Mathematiker sagen also, dass es gleich viele rationale wie natürliche gibt, weil du jede rationale Zahl auf eine natürliche abbilden kannst und dir dabei die natürlichen niemals ausgehen.

...zur Antwort

hat es vielleicht damit zu tun, dass die Mächtigkeit von Q abzählbar unendlich, die von R aber überabzählbar unendlich ist?

...zur Antwort

> Gibt es eine Sprache, in der es nicht mal eine sinngemäße Übersetzung für sein gibt?

Also im Türkischen gibt es meines Wissens kein eigenständiges Wort "sein", sondern es kommt eine Silbe an das Wort, das man ist.

Profesör => Er ist Professor.

Profesörüm => Ich bin Professor.

Profesörsün => Du bist Professor.

...zur Antwort

Also wenn du 3 Äpfel auf einmal aufisst, dann scheint das ja eher viel. Wenn ein Pferd 3 Äpfel aufisst, ist das vielleicht nicht so viel. Die absolute Zahl ist in beiden Fällen 3.

Aber wenn man sagt, bei einem Menschen ist es normal nur 1 Apfel zu essen und ein Pferd isst vielleicht 10 Äpfel auf einmal, dann hast du 300 % vom normalen gegessen, aber das Pferd nur 33,33 % vom normalen. Das sind jetzt also Zahlen, die relativ zum "Normalen" sind.

Anderes Beispiel: In Kleinhintertupfingen demonstrieren 15 Leute gegen Atomkraft. In Stuttgart demonstrieren 15 Leute gegen Stuttgart 21. In Kleinhintertupfingen wohnen aber nur 150 Leute, in Stuttgart 600.000 Leute. Absolut gesehen demonstrieren in beiden Orten gleich viele Leute. Relativ gesehen besteht aber ein großer Unterschied!

...zur Antwort
Weitere Inhalte können nur Nutzer sehen, die bei uns eingeloggt sind.