Починить несогласованное число колонок CSV
Заголовок говорит 5 колонок, у некоторых строк 4, у одной 7 — и ваш импорт сдаётся. Добиваем короткие, помечаем длинные и говорим, какие номера строк проверить.
Колонки выровнены
До
A,B 1,2,3 4
После
A,B 1,2 4,
Перетащите CSV-файл сюда
или нажмите, чтобы выбрать
Исправление «column count» будет обнаружено автоматически.
Что это и почему важно?
Правильный CSV-файл должен иметь одинаковое число колонок в каждой строке. Но в реальных файлах часто встречаются строки с пропущенными значениями в конце или строки с лишними данными, сдвигающими всё. Это ломает импорт и данные оказываются не в тех колонках.
CSV First Aid определяет, сколько колонок должно быть в файле, по самой частой длине строки. Слишком короткие строки добиваются пустыми ячейками, слишком длинные помечаются для проверки.
Этот фикс запускается после других корректировок, так что число колонок отражает реальную форму ваших очищенных данных.
Как это работает
- 1Перетащите CSV. Считаем колонки в каждой строке, чтобы найти несоответствия.
- 2Строки со слишком малым или большим числом колонок помечаются с позициями.
- 3Применить → короткие строки добиты, у всех одинаковое число колонок. Скачать.
FAQ
Как определяется 'ожидаемое' число колонок?
Это мода (самое частое значение) длин строк. Если 95% строк имеют 10 колонок, а 5% — 9, ожидаемое число — 10.
Что происходит со строками со слишком большим числом колонок?
Лишние колонки сохраняются (не обрезаются) — избегаем потери данных. Они помечены в отчёте, чтобы вы могли их просмотреть.
У меня в заголовке больше колонок, чем в строках данных. Что будет?
Если заголовок — самая широкая строка, он становится ожидаемым числом, и более короткие строки добиваются. Это обычный паттерн с опциональными хвостовыми колонками.
Похожие инструменты
Починить заголовки CSV
Две колонки обе 'Name' и ваш SQL-импорт падает, или Pandas молча переименовывает в Name и Name.1. Переименовываем дубли в Name, Name_1, Name_2 — импорт перестаёт падать.
Ремонт кавычек CSV
Одна пропущенная закрывающая кавычка превращает одно поле в многострочного монстра и сдвигает все колонки после. Находим незакрытые, закрываем, переэкранируем внутренние — по RFC 4180.
Убрать пустые строки из CSV
Пустые строки прячутся между данными и ломают подсчёт строк, импорт, каждый SUM(). Мы сканируем каждую строку и удаляем те, где все ячейки пусты. Хоть одно значение — строка остаётся.