Cómo limpiar un CSV de clientes antes de importarlo a tu tienda

Tienes un CSV con 8.000 clientes. Lo exportas de tu plataforma antigua, o de Mailchimp, o de una hoja de Excel que alguien fue rellenando a mano durante tres años. Y ahora quieres importarlo.

No lo hagas todavía.

Un CSV sucio importado directamente te va a crear problemas que tardarás semanas en resolver. Duplicados que inflan tus métricas, emails que rebotan desde el primer envío, registros sin nombre que rompen las personalizaciones. Lo he visto demasiadas veces.

Esta guía te explica exactamente qué revisar antes de pulsar el botón de importar.

Por qué los CSV de clientes siempre llegan sucios

No es culpa tuya. Es culpa de cómo se recogen los datos.

Durante años, los registros entran desde fuentes distintas: el formulario de la web, una feria presencial donde alguien apuntó emails a mano, una campaña de captación de hace cuatro años, la exportación de un sistema anterior. Cada fuente tiene su propio formato, sus propios errores, su propia lógica.

El resultado es un archivo donde "María García" aparece tres veces con variaciones del nombre, donde hay emails como "usuario@gmai.com" (sin la l), y donde la columna de teléfono tiene números con espacios, sin espacios, con prefijo +34 y sin él.

No es catastrófico. Pero hay que limpiarlo antes de mover nada.

Los 5 problemas más comunes en un CSV de clientes

1. Emails duplicados

Es el más frecuente. La misma dirección aparece dos o más veces porque el cliente compró en distintos momentos, o porque se importó el archivo dos veces, o porque hay datos de dos sistemas que nadie reconcilió.

En un CSV de 8.000 registros, es normal encontrar entre 800 y 1.200 duplicados. Eso es hasta un 15% del total.

Si los importas todos, tu plataforma crea dos fichas para el mismo cliente. Las compras no se consolidan. Los segmentos no funcionan. Y si mandas una campaña, ese cliente recibe el email dos veces. En el mejor caso, pareces descuidado. En el peor, te marca como spam.

2. Emails con errores de formato

Los más habituales:

  • Falta el punto en el dominio: "usuario@gmailcom"
  • Error tipográfico: "usuario@homail.es" en vez de "hotmail.es"
  • Espacios antes o después: " usuario@dominio.com "
  • Caracteres especiales fuera de las comillas

Estos emails nunca van a llegar. Pero van a ocupar espacio en tu base de datos, van a contar en tus métricas y van a hacerte creer que tienes más clientes activos de los que realmente tienes.

3. Columnas mal alineadas

Esto pasa cuando el CSV viene de Excel y alguien movió columnas sin actualizar las cabeceras. El resultado es que el nombre acaba en el campo de teléfono, o el código postal aparece como email.

Cuando importas esto, tu plataforma no da error. Simplemente guarda el dato en el campo incorrecto. Y tú no te das cuenta hasta que mandas un email personalizado que empieza con "Hola, 08014".

4. Teléfonos mal formateados

En España, el formato estándar para un móvil es +34 6XX XXX XXX. En la práctica, los CSV incluyen formatos como:

  • 634123456
  • 634 123 456
  • 0034634123456
  • +34634123456

No hay formato malo de por sí. Pero si tu plataforma espera uno concreto y recibe otro, el número se guarda de forma incorrecta o no se guarda. Las campañas de SMS no funcionan. La verificación de envíos tampoco.

5. Registros incompletos

Clientes sin nombre, sin apellido, sin dirección. A veces faltan datos porque el formulario original no los pedía. A veces porque alguien los dejó en blanco aposta.

No son registros inútiles, pero hay que decidir qué hacer con ellos antes de importar. Si los metes tal cual, rompen las automatizaciones que usan esos campos.

Cómo limpiar el CSV paso a paso

Paso 1: Abre el archivo en Google Sheets o Excel y revisa las cabeceras. Asegúrate de que cada columna contiene lo que dice que contiene. Coge 20 filas al azar y compruébalas manualmente. Si algo falla aquí, falla en todo el archivo.

Paso 2: Elimina duplicados por email. En Excel: selecciona la columna de email → Datos → Quitar duplicados. En Google Sheets: Datos → Limpieza de datos → Quitar duplicados. Quédate siempre con el registro más completo o el más reciente.

Paso 3: Valida el formato de los emails. Filtra por la columna de email y busca registros que no contengan "@" o que no tengan un punto después de la @. Son los más fáciles de detectar. Los errores tipográficos en el dominio son más difíciles y normalmente requieren una herramienta específica.

Paso 4: Normaliza los teléfonos. Decide un formato único para todo el archivo y aplícalo. Si tu plataforma usa +34XXXXXXXXX, eso es lo que debe aparecer en todas las filas.

Paso 5: Gestiona los registros incompletos. Tienes tres opciones: completarlos si tienes la información en otro sitio, dejarlos con los campos vacíos y asumirlo, o excluirlos de esta importación y tratarlos después por separado.

Cuánto tiempo lleva limpiar un CSV

Depende del tamaño y de lo sucia que esté la fuente original.

Un CSV de 2.000 registros bien organizado se puede limpiar manualmente en 2-3 horas. Uno de 15.000 con datos de múltiples fuentes puede llevar días si lo haces todo a mano.

La mayor parte del tiempo se va en detectar los problemas. Limpiarlos, una vez detectados, es mecánico.

Hay herramientas que automatizan la detección. ClearRows analiza un CSV de clientes en menos de un minuto y te dice exactamente cuántos duplicados tiene, cuántos emails no son válidos y cuántos registros están incompletos. Antes de tocar nada, ya sabes el tamaño del problema.

Antes de importar, una comprobación más

Una vez limpio el CSV, haz una importación de prueba con 50 registros.

Entra en la plataforma, mira cómo han quedado los registros y comprueba que los campos están donde deben estar. Si algo está mal, es mejor descubrirlo con 50 que con 8.000.

Solo cuando la prueba sale bien, importa el resto.

Artículos relacionados


Analiza tu base gratis en 30 segundos →