LTV inflado, CAC disparado: como los duplicados en tu base de datos arruinan tus metricas de ecommerce
Llevas meses tomando decisiones importantes basandote en tus metricas. Cuanto puedes gastar en captar un nuevo cliente. Si tu negocio es rentable a largo plazo. Que canal de adquisicion funciona mejor. Cuanto vale realmente tu cartera de clientes.
El problema es que si tienes duplicados y registros sucios en tu base de datos, todas esas metricas son mentira. No aproximaciones. Mentiras.
Y lo peor: no lo sabes hasta que el dano esta hecho.
El error que nadie revisa
La mayoria de los ecommerces espanoles auditan su stock, revisan su margen por producto, analizan el coste por clic de sus campanas. Pero nadie revisa si el numero de clientes unicos en su CRM es real.
Resultado: metricas de negocio construidas sobre arena.
1. El LTV (Valor de Vida del Cliente) que miente
El LTV es la metrica mas importante en ecommerce. Te dice cuanto vale un cliente a lo largo del tiempo y, por lo tanto, cuanto puedes gastar en adquirirlo.
La formula basica:
LTV = Ticket medio x Frecuencia de compra anual x Anos de vida del cliente
Imagina que tienes 10.000 registros en tu base de datos, pero 1.500 son duplicados: el mismo cliente con dos o mas registros distintos.
Pasa con frecuencia. Un cliente compra con maria.garcia@gmail.com, luego vuelve con m.garcia@hotmail.com. Tu sistema los registra como dos personas distintas.
Que pasa con tu LTV:
- Cliente real: compro 4 veces en 2 anos. LTV real: 4 compras x 65 euros = 260 euros
- Lo que ve tu sistema: dos clientes con 2 compras cada uno. LTV calculado: 2 x 65 euros = 130 euros por perfil
Tu LTV aparente es 130 euros cuando deberia ser 260 euros. Estas valorando cada cliente a la mitad de lo que vale.
Con 1.500 duplicados en una base de 8.500 clientes reales, la diferencia en la valoracion total de tu cartera puede ser de decenas de miles de euros.
2. El CAC que te dice que estas perdiendo dinero (cuando no es asi)
El Coste de Adquisicion de Cliente (CAC) se calcula dividiendo tu inversion en marketing entre el numero de nuevos clientes captados.
CAC = Gasto en captacion / Nuevos clientes
Si en un mes gastas 3.000 euros en Meta Ads y captas 150 nuevos registros, tu CAC es 20 euros.
Pero si 40 de esos 150 registros son clientes que ya tenias (misma persona, email diferente), en realidad captaste 110 clientes nuevos. Tu CAC real es 27,27 euros.
No parece una diferencia enorme. Pero multiplicalo por 12 meses y piensa en el impacto sobre tus decisiones:
- Decides que Meta Ads no escala porque el CAC sube al aumentar la inversion, sin entender que estas captando menos clientes nuevos de los que crees.
- Comparas canales con datos incorrectos y desinviertes del canal equivocado.
- Calculas el ROI de tu negocio sobre una base de clientes sobredimensionada.
Un ecommerce de Barcelona en el sector de accesorios deportivos descubrio en 2025 que el 18% de sus nuevos clientes mensuales eran en realidad recurrentes con registros duplicados. Su CAC real era un 22% mas alto de lo que pensaba. Llevaban 14 meses escalando inversion publicitaria con datos erroneos.
3. La tasa de retencion que no existe
La retencion es otro indicador critico: que porcentaje de clientes vuelve a comprar en los 12 meses siguientes a su primera compra.
Si un cliente nuevo es en realidad un recurrente con registro duplicado, lo estas contando como retencion cuando no lo es. Tu tasa de retencion aparente sube. Parece que tu tienda fideliza muy bien. Te relajas con las campanas de retencion.
Y mientras tanto, tu tasa de retencion real es mas baja. Los clientes se van y no lo ves.
4. Las cohortes que no tienen sentido
Las cohortes son el analisis mas profundo en ecommerce: como se comporta el grupo de clientes captados en un mes determinado a lo largo del tiempo.
Si en enero captaste 200 clientes y en agosto ves que 60 han vuelto a comprar, tu retencion de la cohorte de enero es del 30%.
Ahora imagina que 30 de esos 200 nuevos de enero eran duplicados de clientes ya existentes. En realidad captaste 170 clientes nuevos.
Tu retencion real de la cohorte puede ser del 25% o del 38%. No lo sabras hasta que limpies los datos.
Tomar decisiones de pricing, catalogo o canal basadas en cohortes contaminadas es como navegar con un GPS que tiene el 15% de las calles mal.
Las senales de que tus metricas estan contaminadas
1. Tu base de clientes crece mas rapido que tus ventas. Si tienes un 20% mas de clientes que el ano pasado pero el numero de pedidos solo crecio un 8%, algo no cuadra.
2. Tu LTV bajo sin razon aparente. Si el ticket medio se mantiene pero el LTV calculado cae, puede ser que estes anadiendo clientes que en realidad son recurrentes duplicados y bajan la frecuencia media.
3. Tus campanas de retencion tienen tasa de apertura muy baja. Si envias a nuevos clientes y muchos ni abren, puede ser porque ya recibieron ese email antes (con otro registro).
4. Tus informes de Shopify o WooCommerce no casan con los de tu herramienta de email marketing. Las discrepancias entre sistemas suelen indicar duplicados.
5. Clientes que se quejaron de recibir el email de bienvenida dos veces. Es el sintoma mas obvio de duplicados activos.
Como resolver el problema en 5 pasos
Paso 1: Audita el tamano real del problema
Exporta tu base de datos completa a CSV y busca duplicados por:
- Email identico
- Nombre y apellido identicos (con variaciones de mayusculas)
- Telefono identico
- Direccion de envio identica
En la mayoria de los ecommerces con mas de 5.000 clientes, los duplicados suponen entre el 8% y el 22% de los registros.
Sube tu CSV a ClearRows y obtein el diagnostico en 30 segundos
Paso 2: Normaliza antes de buscar duplicados
Maria Garcia, maria garcia, M. Garcia y MARIA GARCIA son la misma persona. Antes de comparar, normaliza todo a minusculas sin acentos. Lo mismo con telefonos: +34 612345678 y 612345678 son el mismo numero.
Si no normalizas antes, encontraras menos de la mitad de los duplicados reales.
Paso 3: Fusiona con criterio, no a lo bruto
Al fusionar perfiles duplicados, conserva:
- El email mas reciente o con mas actividad
- La direccion de envio mas usada
- El historial completo de pedidos de ambos perfiles
No borres el duplicado sin antes migrar su historial al perfil principal. Si lo haces mal, perderas datos de compras que afectaran a tus calculos de LTV.
Paso 4: Recalcula tus metricas clave
Una vez limpia la base, recalcula LTV, CAC por canal y tasa de retencion. En la mayoria de los casos veras que:
- El LTV sube (ahora ves el valor real de cada cliente)
- El CAC sube ligeramente (menos nuevos clientes espureos)
- La tasa de retencion varia (depende del tipo de duplicados que tenias)
Ninguna de estas variaciones es mala noticia. Es que ahora tienes datos reales.
Paso 5: Implementa validacion en la captura
El problema de los duplicados empieza en el alta del cliente. Implementa:
- Validacion de email en tiempo real al registrarse (rechaza typos como @gnail.com)
- Busqueda de cliente existente antes de crear uno nuevo (por email o telefono)
- Normalizacion automatica de nombre y direccion al guardar
El coste real de ignorarlo
Una tienda de cosmetica natural con 12.000 registros descubrio que 2.100 eran duplicados. Al fusionarlos, su numero real de clientes era 9.900.
Impacto directo:
- Su LTV real subio de 87 euros a 112 euros (los duplicados diluian las compras recurrentes)
- Su CAC real era 18 euros, no los 14 euros que calculaban
- Su tasa de retencion real bajo del 34% al 27%
Con los datos corregidos, redujeron inversion en captacion y la pusieron en retencion. En 6 meses, la retencion real subio al 33% y el margen bruto mejoro un 11%.
No cambiaron el producto. No cambiaron los precios. Limpiaron los datos.
Conclusion
Tus metricas de negocio solo son utiles si reflejan la realidad. Con duplicados en tu base de clientes, el LTV que ves no es el real, el CAC que calculas no es el real y las decisiones que tomas se basan en datos que mienten.
La buena noticia es que el problema tiene solucion rapida. Una limpieza bien hecha devuelve la fiabilidad a tus metricas en cuestion de horas.
Analiza tu base gratis en 30 segundos