Logo

Reconocimiento y Síntesis de voz: ¿Indispensables para el call center?

Las tecnologías de reconocimiento y síntesis de voz son tendencias que destacan en el mercado, pero ¿qué sabemos de su uso real por parte de las marcas y los consumidores? A las tecnologías de reconocimiento y síntesis de voz les cuesta incorporarse plenamente a los hábitos de las personas porque no tienen en cuenta el factor humano. Errores en los términos, comunicaciones matizadas, problemas de comprensión… son algunas de las razones por las que la tecnología de asistencia, como el reconocimiento y la síntesis de voz, no terminan de ser adoptadas plenamente por los clientes finales y, sin embargo, son indispensables para los call centers. A pesar de todo, el uso de estas tecnologías es cada vez mayor y, por tanto, no han dicho su última palabra. Entendamos por qué.

Síntesis de voz: ¿Adopción tecnológica unilateral?

Cuando los clientes se comunican con las marcas hoy en día, quieren una experiencia de calidad que también les ahorre tiempo.

Muchas tecnologías actuales ayudan a los clientes en este sentido, desde los menús IVR que dirigen a los clientes a los agentes más cualificados lo más rápidamente posible, hasta los chatbots con capacidad IA en las aplicaciones de mensajería instantánea que ayudan a los clientes a encontrar respuestas rápidas a través del self-service. Mientras que los clientes utilizan a menudo el texto escrito o la tecnología de marcación por tonos para comunicarse a través de estos métodos de comunicación, otras tecnologías de los call centers se centran en la tecnología de reconocimiento de voz.

  • El Reconocimiento Automático del Habla (RAH), más conocido como reconocimiento de voz o del habla, se utiliza a menudo en los inbound call centers y con sistemas IVR para que los clientes puedan dar sus respuestas a las preguntas o selecciones del menú. Gracias a que identifica ciertas palabras clave pronunciadas por los clientes, la tecnología los dirige al agente adecuado o les permite completar una tarea de self-service (por ejemplo, la comprobación del saldo de una cuenta bancaria).
  • Otra forma de tecnología de voz es la Conversión de Texto a Voz (CTV). Esta tecnología es una especie de síntesis de voz que pronuncia el texto en voz alta. También se utiliza con frecuencia en los menús IVR y su voz es sintética, aunque a menudo suena natural, y habla con el cliente, desde un saludo hasta las opciones del menú y otra información que le ayuda.

Aunque las tecnologías de reconocimiento y síntesis de voz automatizadas ofrecen numerosas ventajas tanto a las empresas como a los clientes, desde la reducción de costes para las empresas hasta el ahorro de tiempo y el aumento del self-service para los clientes, estas tecnologías no se han implantado aún tan ampliamente como se esperaba.

Una respuesta mixta a la tecnología de reconocimiento de voz

A pesar de sus ventajas potenciales, la adopción de la tecnología de reconocimiento de voz ha sido mucho más lenta de lo previsto. En el año 2000, Gartner predijo que el 30 % de los departamentos de atención al cliente utilizarían esta tecnología para el 2003. Sin embargo, la adopción a escala global está siendo mucho más lenta de lo previsto, a pesar de que la tecnología de reconocimiento de voz existe ya desde hace años. Es posible que las empresas consideren que la tecnología carece de funciones avanzadas, por lo que no es fiable en un contexto de atención al cliente. Por ejemplo, la tecnología de reconocimiento de voz no tiene plenamente en cuenta las necesidades de todos los perfiles de clientes, como los clientes sordomudos o los que tienen acentos o idiomas que la tecnología no puede identificar. No tiene en cuenta las discapacidades ni la forma de hablar de las personas. Además, factores como el ruido de fondo (por ejemplo, los sonidos de la calle cuando un cliente está en el exterior) pueden dificultar o incluso imposibilitar la realización de una llamada con éxito. La tecnología probablemente pedirá al cliente que repita la información, lo que provoca frustración e insatisfacción en el cliente. Para las empresas, tampoco es fácil configurar la tecnología de reconocimiento de voz. Identificar numerosos fonemas (sonidos que componen el lenguaje) para programar dicha tecnología es una tarea ardua y compleja.

Aun así, la adopción de esta tecnología está volviendo a aumentar hoy en día. El aumento del uso de smartphones, los avances en la tecnología de aprendizaje automático y del reconocimiento de voz, y la promesa de reducir los costes para las empresas, ya que es más barato utilizar esta tecnología que asignar agentes humanos a cada función, está impulsando el crecimiento del mercado en los sectores de atención al cliente, sanitario y financiero.

El self-service crece gracias a la tecnología de texto a voz

Muchas empresas consideran que la tecnología de texto a voz es más pertinente para sus call centers. Esta tecnología de síntesis de voz convierte el texto escrito en lenguaje hablado, de nuevo con una voz sintética pero realista. La tecnología es fácil de personalizar, se puede elegir entre una voz masculina o femenina, así como entre una variedad de idiomas y acentos. Gracias a esta capacidad, las empresas pueden asociar determinadas voces a perfiles de clientes específicos o a una imagen de marca concreta. Puede ayudar a personalizar la experiencia del cliente sin necesidad de agentes humanos. Aunque a menudo se utiliza para ayudar a los clientes con las llamadas entrantes, también puede utilizarse para las llamadas salientes cuando se comunican mensajes importantes a los clientes (como un corte de luz programado o un recordatorio de que una factura está disponible para su consulta).

Y lo que es más importante, la CTV contribuye a potenciar el self-service. Puede buscar palabras específicas en el perfil de un cliente contenido en una base de datos de CRM, y luego proporcionar una respuesta a la solicitud del cliente utilizando los datos que ha obtenido. Por ejemplo, la CTV puede buscar en una base de datos de CRM para comunicar a un cliente el saldo de su cuenta bancaria o la fecha de entrega prevista. El self-service es esencial para que la experiencia del cliente sea óptima, ya que le permite encontrar ayuda rápida las 24 horas del día sin necesidad de asistencia humana. En definitiva, el self-service ahorra tiempo a los clientes y aumenta su satisfacción. Esto también significa que los agentes humanos tienen más tiempo para gestionar las tareas que requieren su intervención, como la comunicación con los clientes que tienen casos complejos. Cuantas más preguntas se respondan a través del self-service, menos clientes tendrán que ponerse en contacto con su call center en canales como el de voz, cuyo funcionamiento es más costoso. Sin embargo, es importante tener en cuenta que la CTV funciona mejor para solicitudes sencillas: la tecnología no puede funcionar bien con tareas más complejas que van más allá de la verificación de datos concretos como fechas, saldos, etc.

Aunque las tecnologías de reconocimiento y síntesis de voz están ganando popularidad poco a poco, todavía no son la norma. A medida que estas tecnologías mejoran y son más fiables y fáciles de usar, tanto las empresas como los clientes son más propensos a adoptarlas.

Interesado en nuestras soluciones?

+33 (0)1 55 37 30 50

Contáctenos para obtener más información