Em 2024 e 2025 vimos uma onda de operações implementando IA generativa em todo lugar — chatbots, sumarização, classificação de chamadas, copilot de agente. A maior parte com resultado bem abaixo do esperado.
O problema raramente é a tecnologia. É o lugar onde ela foi colocada.
Onde IA entrega resultado real
- Triagem e roteamento — classificar intenção do cliente em <1s e mandar para o time certo. Ganho de 15-25% em FCR.
- Sumarização pós-chamada — agente economiza 60-90 segundos por atendimento. Em operação grande, isso vira FTE.
- Copilot em tempo real — sugestões de resposta enquanto o cliente fala. Reduz TMA e nivela qualidade entre agentes.
- Análise de sentimento em 100% das chamadas — antes era amostragem manual de 2-3%. Agora cada chamada vira sinal.
Onde IA vira hype caro
- Bot de primeiro contato sem fallback humano claro — cliente que precisa de algo simples (segunda via, agendar visita) tolera. Cliente irritado, não.
- Geração de respostas longas em e-mail — cliente percebe o tom genérico e o NPS cai. Vale para draft, não para envio direto.
- Chatbot multi-turno em assunto sensível — cobrança, cancelamento, sinistro. Encaminhamento humano direto é melhor.
A pergunta certa antes de implementar IA
Não é "podemos usar IA aqui?". É "qual é o gargalo da operação que mede impacto financeiro real?".
Se a resposta é "TMA alto", IA de copilot resolve. Se é "FCR baixo", IA de roteamento e base de conhecimento. Se é "satisfação inconsistente entre turnos", análise de sentimento + monitoria automatizada.
Implementar IA sem clareza de gargalo é gastar dinheiro para resolver um problema que ninguém vai notar.
Stack que estamos usando em 2026
- Roteamento: classificadores leves (não precisa de LLM grande)
- Sumarização: GPT-4o ou Claude Sonnet — modelos médios bastam
- Copilot: modelo fine-tuned no domínio do cliente, sempre
- Análise de sentimento: modelo dedicado, não LLM genérico (mais barato e mais preciso)
O mais importante: medir antes e depois. Implementação de IA sem baseline é loteria.