UTF-8-BOM aus Ihrer CSV entfernen
Erste Spalte zeigt 'ID' statt 'ID'? Das ist ein UTF-8-BOM — drei unsichtbare Bytes, die die meisten Export-Tools hinterlassen. Wir entfernen sie und die Überschrift liest sich wieder sauber.
Unsichtbares BOM entfernt
Vorher
ID,Name,Age
Nachher
ID,Name,Age
CSV-Datei hier ablegen
oder zum Auswählen klicken
Die Reparatur „bom" wird automatisch erkannt.
Was ist das und warum ist es wichtig?
Ein BOM (Byte Order Mark) ist ein unsichtbares Zeichen, das manche Programme — etwa Notepad oder ältere Excel-Versionen — stillschweigend an den Anfang einer Datei setzen. Sie sehen es nicht, aber es ist da und macht Ärger.
Typisches Symptom: Die erste Spaltenüberschrift sieht kaputt aus. Statt 'ID' oder 'Name' sehen Sie eine verstümmelte Version mit seltsamen Zeichen davor. Import-Tools lehnen die Datei ab oder Ihr erster Schlüssel findet keine Treffer mehr.
CSV First Aid erkennt das unsichtbare Zeichen und entfernt es. An Ihren eigentlichen Daten ändert sich nichts — nur der versteckte Präfix fällt weg.
So funktioniert es
- 1Ziehen Sie Ihre CSV in das Feld oben. Die Datei bleibt im Browser — nichts wird hochgeladen.
- 2CSV First Aid prüft den Dateianfang auf das unsichtbare Zeichen. Wenn gefunden, zeigt die Diagnose 'BOM erkannt'.
- 3Anwenden, dann Herunterladen. Der unsichtbare Präfix ist weg.
FAQ
Zerstört das Entfernen des BOM meine Datei?
Nein. Der BOM ist Metadaten, keine Daten. Entfernen ändert keinen einzigen Zellwert. UTF-8 funktioniert ohne BOM einwandfrei — der Unicode-Standard empfiehlt ausdrücklich, ihn für UTF-8 wegzulassen.
Wie erkenne ich, ob meine CSV ein BOM hat?
In einem Hex-Editor nachsehen, ob die ersten Bytes EF BB BF sind. Oder einfach die Datei hier ablegen — CSV First Aid sagt es Ihnen sofort.
Warum fügt Excel einen BOM hinzu?
Bei 'Speichern unter → CSV UTF-8' setzt Excel einen BOM, damit es die Kodierung beim erneuten Öffnen erkennen kann. Andere Tools erwarten das nicht — daher das klassische Problem mit der verstümmelten ersten Spalte.
Funktioniert das auch mit UTF-16-BOM?
Aktuell erkennen und entfernen wir den UTF-8-BOM (EF BB BF). UTF-16 ist in CSV-Workflows selten; bei Bedarf vorher nach UTF-8 konvertieren.
Ähnliche Tools
CSV-Kodierung reparieren
é, ü, ö statt é, ü, ö? Die Datei wurde in einer Kodierung gespeichert und in einer anderen gelesen. Wir finden heraus, welche, und konvertieren nach UTF-8 — dann sieht Müller wieder wie Müller aus.
Unsichtbare Zeichen aus einer CSV entfernen
NBSP, Zero-Width-Joiner, versprengte Control-Bytes — Excel zeigt sie nicht, aber SVERWEIS sieht sie und matcht nicht. Wir scannen jede Zelle und entfernen, was nicht hingehört.
CSV-Validator
Vor COPY FROM oder pd.read_csv() hier durchjagen. 14 Prüfungen — Kodierung, BOM, Trennzeichen, Quotes, Spaltenzahl, Duplikate, unsichtbare Zeichen — jede mit den auslösenden Zeilennummern.