CSV-Datumsnormalisierer — gemischte Datumsformate zu ISO 8601
Eine Spalte mit 01/03/2024, 2024-03-01 und '1. März 2024' durcheinander lässt sich nicht sortieren. Wir schreiben alles auf JJJJ-MM-TT um — eindeutig, sortierbar, sicher für jede Datenbank.
Datumsangaben normalisiert
Vorher
15/03/2024 03-15-2024
Nachher
2024-03-15 2024-03-15
CSV-Datei hier ablegen
oder zum Auswählen klicken
Die Reparatur „date format" wird automatisch erkannt.
Was ist das und warum ist es wichtig?
Gemischte Datumsformate gehören zu den häufigsten Datenqualitätsproblemen. Sie entstehen, wenn Daten aus mehreren Quellen kommen, manuelle Eingabe auf automatisierte Exporte trifft oder Länder-Einstellungen zwischen Nutzern wechseln. Ist 01/02/2024 der 2. Januar oder der 1. Februar? Ohne Kontext mehrdeutig.
CSV First Aid analysiert jede Spalte auf datumsähnliche Werte. Wir erkennen gängige Formate: TT/MM/JJJJ, MM/TT/JJJJ, JJJJ-MM-TT, TT-Mon-JJJJ und mehr. Bei gemischten Formaten normalisiert das Tool alles auf ISO 8601 (JJJJ-MM-TT), den eindeutigen internationalen Standard.
Mehrdeutige Datumsangaben (wie 01/02/2024) werden anhand des dominanten Musters der Spalte aufgelöst. Sind 90 % im Format TT/MM/JJJJ, werden die mehrdeutigen ebenfalls so interpretiert.
So funktioniert es
- 1CSV ablegen. Der Detektor scannt jede Spalte nach Datumsmustern.
- 2Spalten mit gemischten Formaten werden markiert. Die Diagnose zeigt, wie viele Datumsangaben zu normalisieren sind.
- 3Anwenden → alle Datumsangaben werden zu JJJJ-MM-TT. Herunterladen.
FAQ
Was, wenn ein Datum wirklich mehrdeutig ist (z. B. 01/02/2024)?
Das Tool nutzt das Mehrheitsformat der Spalte zur Auflösung. Ist der Großteil klar TT/MM, werden mehrdeutige Werte ebenso geparst. Edge Cases werden im Report als 'teilweise' markiert.
Kann ich ein anderes Ausgabeformat wählen?
Aktuell ISO 8601 (JJJJ-MM-TT). Das ist das sicherste Format für Datenaustausch: eindeutig und korrekt sortierbar. Eigene Ausgabeformate sind geplant.
Was ist mit Zeitstempeln (Datum mit Uhrzeit)?
Datum-Zeit-Werte wie '2024-01-15 14:30:00' bleiben unverändert. Nur reine Datumsangaben werden normalisiert.
Ähnliche Tools
CSV-Zahlenformat-Fixer
In Europa bedeutet 1.234,56 tausendzweihundertvierunddreißig Komma sechsundfünfzig. In den USA steht 1,234.56 dafür. Wir erkennen das europäische Muster über eine ganze Spalte und schreiben es ins internationale Format um — das, was jede Datenbank wirklich akzeptiert.
CSV-Whitespace-Trimmer
Ein einziges nachgestelltes Leerzeichen ist der Grund, warum SVERWEIS nichts findet, warum zwei Zeilen wie Duplikate aussehen aber keine sind, warum der Join stillschweigend die Hälfte verliert. Ein Durchlauf trimmt jede Zelle — Matches funktionieren wieder.
CSV-Kodierung reparieren
é, ü, ö statt é, ü, ö? Die Datei wurde in einer Kodierung gespeichert und in einer anderen gelesen. Wir finden heraus, welche, und konvertieren nach UTF-8 — dann sieht Müller wieder wie Müller aus.