schlauste Art ähnliche Wörter zusammenzufassen(python)?
Hallo, ich habe die Aufgabe bekommen Kopierrechte, hier als BSP. copyR1-20, zusammenzufassen. Wenn ich mit meiner "Ähnlichkeitsfunktion" über die Liste gehe gibt diese mir die Liste für das entsprechende Kopierrecht zurück von 100, genau gleich bis 0 absolut verschieden. Nehmen wir also mal an meine Ähnlichkeitsfunktion macht Sinn und es kommen logische Werte raus. Gibt es hier ein Statistisches Verfahren um die ähnlichsten Kopierrechte in einer Gruppe zusammenzufassen?
Bislang schaue ich einfach Kopierrecht1 an, nehme alle Kopierrechte über mein Limit 86 hinzu und nenne das meine Gruppe. Das Führt jedoch zu Problemen, wenn z.B. Kopierrecht1 ähnlich zu Kopierrecht 2 und 3 ist, Kopierrecht 4 aber nur ähnlich zu Kopierrecht 2 ist. Hier weiß ich nicht wie ich die Gruppen bilden soll.
Also zu meiner Frage:
Ich soll das in Python implementieren.
Gibt es eine systematische Möglichkeit durch z.B. einen Clusteralgorithmus die besten Gruppen hier zu bilden? (Die Tabelle ist nicht ausgefüllt, sie geht natürlich noch weiter)
Vielen Dank im Vorraus
