Saltar al contenido principal
CSV First Aid

Cómo arreglar un CSV roto — guía completa

Los CSVs se rompen de docenas de formas — caracteres confusos, columnas desplazadas, filas vacías fantasma, fechas que no ordenan. Esta guía cubre cada modo de fallo común, explica por qué ocurre, y muestra cómo arreglarlo (manual y con CSV First Aid).

1. Caracteres confusos (problemas de codificación)

Si ves secuencias confusas como é en vez de caracteres legibles, tu archivo se guardó en Windows-1252 o Latin-1 pero se abrió como UTF-8. Se llama mojibake.

Manual: en Python, abrir con encoding='cp1252'. En Excel, usar el Asistente de Importación y seleccionar '65001: Unicode (UTF-8)' o '1252: Europeo Occidental' según la codificación real.

Automático: suelta el archivo en CSV First Aid. El detector de codificación identifica patrones Windows-1252 y re-decodifica a UTF-8 limpio.


2. Primer encabezado empieza con basura (BOM)

Si tu primer encabezado se ve como id o \ufeffid, el archivo tiene un BOM UTF-8 (Byte Order Mark). Son 3 bytes invisibles al inicio que Excel añadió al guardar como 'CSV UTF-8'.

Manual: abrir en editor hex y borrar los bytes EF BB BF. En Python: open('file.csv', encoding='utf-8-sig').

Automático: CSV First Aid elimina el BOM como parte del paso de lectura.


3. Datos desplazados a columnas equivocadas (comillas rotas)

Cuando un campo contiene coma o salto de línea pero no está bien entrecomillado, el parser lo parte en varias columnas o filas. Una sola comilla sin cerrar puede desplazar todos los campos siguientes.

Manual: encuentra el campo problemático (busca comillas sin pareja), añade la comilla de cierre que falta, y escapa las internas duplicándolas ("").

Automático: el parser tolerante de CSV First Aid se recupera de comillas sin cerrar y re-entrecomilla todos los campos correctamente al exportar.


4. Todo en una columna (delimitador equivocado)

Si tus datos aparecen en una sola columna, el archivo usa un delimitador distinto al que espera tu tool. Los exports europeos suelen usar punto y coma porque la coma es separador decimal.

Manual: re-importar con el delimitador correcto. En Excel: Datos → Texto en columnas → Delimitado → elegir el carácter correcto. En Pandas: pd.read_csv('file.csv', sep=';').

Automático: CSV First Aid detecta el delimitador y te permite convertir a cualquier formato estándar.


5. Fechas mal ordenadas o malinterpretadas

Cuando una columna mezcla formatos (01/03/2024 vs 2024-03-01 vs 1 de marzo de 2024), la ordenación falla y los imports malinterpretan las fechas. ¿01/02/2024 es 2 de enero o 1 de febrero?

Manual: reemplazo regex o un script que parsee cada formato y escriba ISO 8601 (AAAA-MM-DD).

Automático: CSV First Aid detecta patrones de fecha mezclados por columna y normaliza a ISO 8601.


6. Problemas invisibles (whitespace, NBSP, zero-width)

Los bugs más frustrantes de CSV son invisibles. Los espacios al final hacen fallar BUSCARV. Los espacios no separables (NBSP) parecen espacios normales pero no matchean. Los caracteres zero-width del web scraping rompen joins en silencio.

Manual: en Python, strip() quita whitespace pero no NBSP. Necesitas regex: re.sub(r'[\u00a0\u200b\ufeff]', '', text).

Automático: el limpiador de caracteres invisibles más el trimmer de whitespace de CSV First Aid manejan todos en una pasada.


7. Filas en blanco y saltos finales

Las filas en blanco infladan recuentos, rompen importadores que esperan datos densos y crean registros NULL fantasma en bases de datos.

Manual: abrir en editor de texto y borrar líneas en blanco. Cuidado con el salto final — es válido por RFC 4180 pero muchos parsers crean una fila final vacía con él.

Automático: activa el fix 'Filas vacías' en CSV First Aid.


8. La columna 'Unnamed: 0' (fuga de índice de Pandas)

Si ves un índice numérico como primera columna con encabezado 'Unnamed: 0', el archivo se creó con df.to_csv() de Pandas sin index=False.

Manual: pd.read_csv('file.csv', index_col=0) o borrar la primera columna.

Automático: CSV First Aid detecta y quita la columna de índice secuencial.

¿No quieres arreglarlos a mano? Suelta el archivo en CSV First Aid — corre estas mismas comprobaciones automáticamente.

Arregla tu CSV ahora →

Herramientas relacionadas