Перейти к основному содержимому
CSV First Aid

Убрать невидимые символы из CSV

NBSP, zero-width joiners, залётные control-байты — вы их не видите в Excel, но VLOOKUP видит и не матчит. Сканируем каждую ячейку и убираем то, чего не должно быть.

Невидимые убраны

До

John Smith, 25

После

John Smith, 25

Перетащите CSV-файл сюда

или нажмите, чтобы выбрать

Исправление «invisible chars» будет обнаружено автоматически.

Что это и почему важно?

Некоторые символы полностью невидимы — их не видно в Excel, Notepad, нигде. Но они есть, и из-за них lookup-ы не работают, фильтры пропускают записи, проверки дубликатов ломаются. Ячейка, выглядящая как 'Alice', может содержать скрытый символ, отличающий её от настоящей 'Alice'.

Эти невидимые символы попадают при копировании текста из веба, вставке из email, объединении файлов из разных систем, экспорте из старого софта. Вы их не видите, но ваши тулы видят — и ломаются.

CSV First Aid сканирует каждую ячейку и убирает все скрытые символы. Диагноз точно говорит, сколько ячеек было затронуто — вы видите масштаб проблемы.

Как это работает

  1. 1Перетащите CSV. Сканируем каждую ячейку на скрытые невидимые символы.
  2. 2В диагнозе — сколько ячеек содержит невидимые символы.
  3. 3Применить → скрытые символы ушли. Скачать.

FAQ

Какие символы детектируются?

NBSP (U+00A0), zero-width space (U+200B), zero-width non-joiner (U+200C), zero-width joiner (U+200D), word joiner (U+2060), BOM (U+FEFF), null-байты (U+0000), и все C0/C1 control-символы (U+0001–U+001F, U+007F, U+000E–U+001F).

Сломает ли это поля, намеренно использующие NBSP?

NBSP конвертируется в обычный пробел, не удаляется. Если данные используют NBSP для форматирования (например, неразрывные пробелы в именах) — визуально идентично. Символ меняется с U+00A0 на U+0020.

Как увидеть невидимые символы до фикса?

Использовать hex-редактор, или в Python: repr(cell_value) покажет \xa0, \u200b и т.д. В панели диагноза показываем количество — вы знаете, что они там есть.

Похожие инструменты