Frage von GedankenGruetze, 34

Euklidischer Abstand bei Termsuche?

Kann mir hier jemand helfen? Wie sehen die passenden Vektoren zu "windows und computer" aus? Nehme ich die jeweiligen Werte und setze die Wörter, nach denen nicht gesucht wird einfach auf 0?

Danke

Antwort
von WeicheBirne, 13

Ich bin kein IT-Experte, aber nach dem was ich im Netz finden konnte sollst Du keine separaten Vektoren für "windows" und "computer" erstellen.

Die Formel für den euklidischen Abstand zwischen der Anfrage "windows computer" und jeweils einem der drei Dokumente findest Du hier

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.332.4480&rep=rep1&a...

Der euklidische Abstand zwischen der Anfrage und einem Dokument ist als euklidischer Abstand zwischen dem Tf-idf-Vektor der Anfrage und dem Tf-idf-Vektor des Dokuments definiert. 

Eine Erklärung dafür was ein Tf-idf-Vektor ist findest Du sowohl im obigen Dokument als auch noch einmal detaillierter hier

https://de.wikipedia.org/wiki/Tf-idf-Ma%C3%9F

Kommentar von GedankenGruetze ,

Auch wenn ich das erste Dokument nicht verwendet habe, hat mir deine Antwort so ziemlich den richtigen Weg geleitet. Man muss eben kein IT-Profi sein. ;)

Danke

Keine passende Antwort gefunden?

Fragen Sie die Community