Doubletten über mehrere Spalten in Excel finden

...komplette Frage anzeigen

3 Antworten

8Ich würde mit einer "Hilfspalte" arbeiten. Hier kann man z.B. Teile von Feldinhalten rein-rechnen und auch gleichsetzen. z.B. kann man die Spalte für jede Zeile folgend berechnen: - ersten 10 Zeichen des Namens, mit ersetzten Umlauten (z.B. ß = ss, ä = ae, ö = oe...) - ersten 10-15 Zeichen der Straße, Umlaute und gängige Abkürzungen (z.B. str. = strasse) ersetzen -ersten 10 Zeichen des Ortes -Hausnummer -Postleitzahl, nur die Zahlen übernehmen

Diese Einzel-Daten werden einfach zusammengekettet in das Hilfsfeld abgelegt, die Reihenfolge sollte sich vielleicht nach gewünschten Sortiereinstellung richten. Vielleicht müssen auch die Inhalte von weiteren Feldern hier mit aufgenommen werden. Die Zahlen bei den Ersten Zeichen, können natürlich je nach bedarf angepasst werden. Danach muss man nur noch die Werte des Hilfsfeldes prüfen und kann danach entsprechende Doubletten ermitteln.

Excel ist ein Tabellenkalkulationstool. Es kann dir sagen das "Strasse" und "Strasse" das selbe sind. Es sind jeweils 7 Zeichen die jeweils aus den gleichen Bits bestehen. Excel erkennt lediglich eine Folge von 0 und 1. Excel "weiss" nicht dass das Wort Strasse heisst und es weiss auch nicht, dass dies eine Aneinanderreihung von Häusern ist. Woher soll Excel also wissen das "Str." genau das selbe bedeutet? Für einen Deutschsprachigen Menschen ist das klar, weil man bei "Strasse" genau wie bei "Str." diese Aneinanderreihung von Häusern vor Augen hat und weiss das es das selbe ist. Excel weiss dies nicht.

Du kannst exakt selbe Datensätze als Dubletten kennzeichnen und ausschliessen. Wenn jedoch nur ein Zeichen anders ist (und wenn es nur ein unnötiges Leerzeichen ist) dann ist der Datensatz nicht mehr der gleiche und wird nicht erkannt.

Grundbedingung für für die saubere Auswertung von Daten ist die Gleiche Darstellungsweise. Dies gilt für jede Art Datenbanksystem oder Tabellenkalkulation.

Also sorge über die Funktion "Ersetzten" erst mal dafür, dass alle Daten gleich aussehen.

Ist Tomas Müller der im 30stöckigen, 600 Parteien - Hochhaus wohnt tatsächlich der selbe wie Thomas Müller, der im selben Haus wohnt? Das kannst nicht mal du als Mensch sagen. Wie soll es da eine Maschine können?

Kann ich denn mit Hilfe einer Formel mehrere Komponenten abgleichen, so dass ich die Doubletten erkenne, wenn eine Komponente gleich ist und alles andere anders? Also bis jetzt weiß ich, wie ich die Doubletten finde, wenn ich z.B. nur nach der Kundennummer suche...

Doubletten Abgleich geht normalerweise mit der Formel ZÄHLENWENN

Also: Zähle wie oft ein Wert aus Liste 2 in Liste 1 vorkommt alles was null ist ist Single, alles grössergleich 1 hat Dubletten

0

Was möchtest Du wissen?