csv Export bereinigen?

2 Antworten

Die CSV sollte eigentlich einfach lesbar sein, zumindest was die Inhalte angeht. Optisch unübersichtlich ist halt weil alles aneinander gereiht ist und nicht als Tabelle dargestellt wird. Für den Import ist das auch nicht relevant. Liest sich jetzt eher so, als wäre die exportierte Datei vom Inhalt her Schrott.


Fui1903 
Beitragsersteller
 07.02.2025, 14:06

Genau die Exportdatei ist das problem. Die frage ist wie ich sie am besten bereinige. Per hand ist keine option da es 250 dateien sind. Python mit pandas vllt. Andere tipps kommen mir gelegen

Fui1903 
Beitragsersteller
 07.02.2025, 17:35
@fkkch1967

Naja, sieht so aus, als wurde wohl mit , und Gänsefüßchen geschmissen

fkkch1967  07.02.2025, 17:59
@Fui1903

wenn es nur darum geht die Gänsefüsschen zu ersetzten, dann kann das jeder halbwegs taugliche Texteditor mit Suchen/Ersetzen.

Fui1903 
Beitragsersteller
 07.02.2025, 18:01
@fkkch1967

Ja, das problem ist nur das es ein großes durcheinander ist. Der datensatz hat mal kommatas zu viel dann zu wenig dann das gleiche mit den gänsefüßchen. Des weiteren sind die daten falsch codiert und teilweise einfach durch kommas ersetzt

regex9  07.02.2025, 20:15
@Fui1903

Anführungszeichen innerhalb einer CSV-Datei können der Maskierung dienen, falls beispielsweise das Trennzeichen (in deinem Fall also das Komma) auch in einzelnen Datensätzen vorkommen kann. Ein Programm, welches einen CSV-Datenimport anbietet, weiß normalerweise damit umzugehen.

Ich habe es immer wieder mit CSV Dateien zu tun.

Die haben leider Trennzeichen (eben das C für Comma), die auch in den Daten vorkommen können, ebenso Zeilenschaltungen (Linefeeds).

Ein vernünftiges Exportprogramm bietet diverse Einstellungen an. Da musst du experimentieren, solche Trennzeichen zu finden, die in den Daten nicht vorkommen und vom Importprogramm verstanden werden.

Hier die Export-Einstellungen von phpMyAdmin:

Bild zum Beitrag

 - (Python, Programmiersprache, PowerShell)