El backflip de Klarna: por qué traer de vuelta humanos después de 1 año

29 may 2026

El backflip de Klarna: por qué ni siquiera los gigantes pueden automatizar sin red de seguridad

A principios de 2024, Klarna fue portada de todo medio tech imaginable: la fintech sueca anunció que había automatizado dos tercios de su soporte al cliente con IA, despidiendo a prácticamente todos sus agentes humanos. Era el sueño de Silicon Valley hecho realidad. Un año después, ese sueño colapsó. Klarna rehizo la marcha atrás y volvió a contratar humanos para ciertos tipos de tickets. No es un fracaso — es una lección brutalmente clara sobre dónde realmente vive el límite de la automatización.

El sueño era atractivo. Los números, menos.

La realidad es que Klarna logró algo genuinamente impresionante: automatizar dos tercios de su volumen de tickets con un chatbot de IA. Para cualquier equipo de customer experience, eso es colosal. El problema no fue la escala, sino la calidad en casos que importaban.

Cuando empezaron a meter toda clase de tickets en el modelo — especialmente disputas de transacciones, denegaciones de crédito, y resoluciones de fricción compleja — el CSAT se desplomó. Las alucinaciones aparecieron en lugares donde no se podían permitir. Un cliente en disputa por una compra de $500 no quiere una respuesta "aproximada" de un bot. Quiere certeza. Quiere alguien que entienda que si el bot mete la pata, hay consecuencias regulatorias y de confianza que van mucho más allá del ticket.

Ahí fue cuando la ecuación cambió.

El problema real: no fue el bot, fue el scope creep

La tentación de toda empresa con un modelo de IA relativamente robusto es la misma: "¿Qué pasa si lo soltamos en todo?" Klarna cedió a esa tentación. Y lo que descubrieron es que los tickets no son todos iguales.

Los tickets simples — un cliente preguntando cómo cambiar su dirección de envío, solicitar un recibo, preguntar sobre términos de servicio — esos viven perfectamente en un bot. Son predecibles. El contexto es acotado. El daño de una error es mínimo.

Los tickets complejos — una disputa donde el cliente dice "nunca recibí mi compra pero mi banco dice que la entrega se confirmó" — requieren investigación real, criterio humano, y la capacidad de entender matices en lenguaje natural que un modelo puede interpretar de forma completamente errada. Eso no es un defecto del bot. Es la realidad de resolver conflictos.

La lección invisible: Klarna no fracasó en automatización. Fracasó en segmentación.

El modelo que funciona: tiering con sentido

La mejor práctica que todo esto deja en claro es que el futuro no es "IA o humanos". Es "IA para esto, humanos para aquello". Se llama tiering, y es aburrido porque no tiene magia, pero funciona.

Tier 1 (IA pura): FAQ, cambios de datos, consultas de estado de pedido, preguntas sobre política. Automático, rápido, sin supervisión. Un bot puede resolver el 60-70% del volumen aquí sin problema.

Tier 2 (IA con escalada): Problemas que se pueden clasificar pero que requieren contacto humano — por ejemplo, una queja sobre calidad. El bot filtra, categoriza, extrae información contextual, y lo pasa limpio a un humano. Ganas velocidad sin sacrificar calidad.

Tier 3 (Humano): Disputas, compliance, retención VIP, decisiones con riesgo regulatorio. Aquí no toca IA. Punto.

Klarna eventualmente tuvo que volver a algo cercano a esto, aunque la verdad es que su comunicación al respecto fue vaga. El dato importante es que reconocieron que el modelo de "automatizar todo" reventaba en casos donde el criterio humano no es un lujo — es un requisito.

Cómo detectar cuándo estás overshooting

Hay una métrica simple que funciona: CSAT por tipo de ticket. Si estás viendo que tu puntuación general está bien (85%+) pero en tickets complejos cae a 60-70%, tienes un problema de scope creep en IA.

Lo irónico es que es fácil perder esto en el ruido. Los números globales pueden verse bien — ese 60% de satisfacción en disputas se promedia con el 95% en tickets simples — pero esos puntos perdidos en tickets sensibles son exactamente donde se genera churn y riesgo legal.

La recomendación práctica: mira los datos por segmento. Si algo está roto, arreglalo achicando el scope de IA en ese tipo de ticket, no empujando más automatización esperando que mejore por volumen.

No es derrota, es calibración

Klarna está donde debería estar ahora: usando IA para lo que es buena (velocidad, consistencia, volumen), y humanos para lo que importa (criterio, riesgo, relaciones). No es el sueño glamoroso que vendieron hace un año, pero es el que escala sin quebrarse.

La verdad incómoda es que la mayoría de las empresas que construyen customer experience van a tener que aprender esta lección por su cuenta. La pregunta no es "¿automatizo todo?" sino "¿dónde está el punto donde el error de una máquina me cuesta más que la eficiencia que gano?" Una vez que sabes esa respuesta, todo lo demás es detalles técnicos.

Fuentes

Fini Labs — Klarna automates two-thirds

¿Te gustaría un chatbot así para tu negocio?

7 días gratis. Sin tarjeta hasta el final.

Probar KOGNIT