Починить заголовки CSV — дедупликация имён колонок
Две колонки обе 'Name' и ваш SQL-импорт падает, или Pandas молча переименовывает в Name и Name.1. Переименовываем дубли в Name, Name_1, Name_2 — импорт перестаёт падать.
Заголовки дедуплицированы
До
Name,Name,Name
После
Name,Name_1,Name_2
Перетащите CSV-файл сюда
или нажмите, чтобы выбрать
Исправление «headers» будет обнаружено автоматически.
Что это и почему важно?
Дублирующиеся заголовки появляются при слиянии таблиц, комбинировании данных из разных источников, или экспорте из тулов, не проверяющих уникальность. Многие импортёры просто падают, увидев две колонки с одним именем.
Пустые или отсутствующие заголовки столь же проблематичны — они приводят к рассогласованию колонок при импорте, данные оказываются не там, где должны.
CSV First Aid сканирует строку заголовков и чинит обе проблемы. Дубли получают суффикс (_2, _3 и т.д.) для уникальности. Пустые заголовки заполняются плейсхолдерами. Первое вхождение каждого имени остаётся нетронутым.
Как это работает
- 1Перетащите CSV. Проверяем первую строку на пустые и повторяющиеся имена колонок.
- 2Дубли и пустые помечаются в диагнозе.
- 3Применить → заголовки переименованы в уникальные. Скачать.
FAQ
Какая конвенция именования используется при переименовании?
Дубли получают суффикс: name_2, name_3 и т.д. Пустые становятся column_1, column_2. Первое вхождение сохраняет оригинальное имя.
Можно настроить переименованные имена?
Пока нет — тул применяет автоматические уникальные имена. Можно отредактировать строку заголовков в скачанном файле, если нужны конкретные имена.
А если в файле нет строки заголовков?
CSV First Aid трактует первую строку как заголовок. Если данные начинаются с первой строки без заголовка — значения первой строки данных будут трактоваться как имена колонок. Для лучшего результата добавьте строку заголовков заранее.
Похожие инструменты
Убрать колонку 'Unnamed: 0' из CSV
Первая колонка без названия, содержит 0, 1, 2, 3…? Кто-то запустил to_csv() без index=False. Находим утечку индекса и убираем — реальные данные возвращаются в колонку A.
Починить несогласованное число колонок CSV
Заголовок говорит 5 колонок, у некоторых строк 4, у одной 7 — и ваш импорт сдаётся. Добиваем короткие, помечаем длинные и говорим, какие номера строк проверить.
Убрать дублирующиеся строки из CSV
Одна строка появляется трижды — плохой join, пропущенный DISTINCT, вчерашний скрипт запустили дважды. Сравниваем каждую строку со всеми остальными и убираем точные совпадения, сохраняя первое вхождение.