Entrevista a Oscar Mangas: La experiencia en interfaces de voz

1024 768 Miguel Benítez

Esta semana contamos con una nueva entrevista sobre la experiencia en interfaces de voz.

Esta vez hemos hablado con Oscar Mangas, que además de ser Senior UX Designer en Agenteroes muy amigo nuestro y fue colaborador en Legridd en su vida pasada.

Oscar Mangas. Senior UX Designer en Agentero

Oscar Mangas. Senior UX Designer en Agentero

Oscar lleva trabajando en el sector digital desde hace unos 16 años. Cuenta con formación en Sociología, lo que le abrió las puertas del mundo del diseño y la usabilidad a través de la investigación con usuarios. A partir de ahí, ha evolucionado tanto como el mercado y los avances en el mundo digital le han ido demandando, por lo que también se ha formado en temas específicos de innovación y liderazgo, así como en distintas facetas propias de la experiencia de usuario y el diseño de servicios.

Su pasión por el mundo digital le ha llevado a trabajar en distintos países, entre ellos el Reino Unido, donde pasó, según él, “5 magníficos años trabajando en ambientes multinacionales para distintas compañías”. El último lustro, prácticamente lo ha pasado diseñando productos para varias empresas del sector Fintech e Insurtech.

Oscar nos cuenta cuál es su relación con el mundo de las interfaces de voz y cual es su opinión y visión sobre estas nuevas posibilidades de interacción.

P: ¿Tienes algún tipo de interfaz de voz?

R: Sí, en mi casa tengo un Google Home y un Google Home mini. Los utilizo principalmente para controlar distintas funciones básicas del hogar como la iluminación, etc. Además suelo escuchar música (tengo conectada mi cuenta de Spotify) y la radio a través de ellos. También suelo hacer consultas a diario sobre la previsión meteorológica, escucho resúmenes de noticias y otras cuestiones del día a día. A ese nivel, me resultan útiles y, un tanto, “divertidos”.

P: ¿Cómo crees que pueden ayudar las interfaces de voz en tu trabajo actual?

R: Ahora mismo estoy trabajando en Agentero, dentro del sector denominado Insurtech. Estamos creando un producto muy potente que utilizan agentes de seguros en EEUU. Agentero les permite digitalizar de un modo eficiente su listado de clientes y detectar oportunidades de negocio que vienen generadas por un complejo sistema de análisis de datos. Además, les facilitamos la comunicación online con sus clientes de un modo mucho más eficiente al utilizado hasta ahora por ellos en dicha industria.

Dicho esto, y si te soy sincero, ahora mismo estamos en una fase de desarrollo de producto donde nos interesa más solventar otros problemas que no están estrictamente relacionados con las interfaces de voz. De momento, a corto plazo, no contemplamos la posibilidad de trabajar esta línea. Sin embargo, sí que creo que podría haber cierto margen para el estudio y desarrollo de determinadas skills que ayudarían al usuario final a recibir y consultar información de forma más eficiente si la comparamos con la experiencia actual.

P: ¿Cuáles son esas necesidades?

R: Creo que la gestión de los seguros por parte de los usuarios es un poco frustrante. Sólo recurrimos a ellos cuando necesitamos informar de algún siniestro o quejarnos porque sabemos por alguien conocido que tiene un mejor precio en una aseguradora determinada. Las interfaces de voz podrían ayudar a mejorar la experiencia de usuario en ese sentido con una mejor relación con el cliente, más personalizada y reduciendo las esperas al teléfono. Cabe destacar que la mayoría de los procesos que se dan en una aseguradora en su relación con el cliente están muy sistematizados: han sido creados para ofrecer precios ajustados de acuerdo al perfil de cada cliente. Estos procesos pueden tener una mecánica de análisis de datos muy compleja en su base, pero en la capa de contacto con el cliente, responden a unos patrones muy determinados. Por ejemplo, creo que sería muy positivo para los usuarios poder pedir información a través de un dispositivo de voz sobre determinadas coberturas o asistencias y recibirlas en su email. Asimismo, también sería muy interesante empezar a experimentar cómo de eficiente sería poder informar de un siniestro a través de una de estas interfaces. Por lo que sé, aseguradoras como Liberty, Aviva o Safeco ya están metiéndose en ese campo con resultados positivos.

P: ¿Has desarrollado alguna skill para tu compañía?

R: He leído mucho sobre el tema de las skills y tengo ciertas nociones, pero no he desarrollado ninguna skill hasta ahora por los motivos que te comentaba más arriba.

P: Aparte del usuario externo, ¿crees que las interfaces de voz pueden solucionar necesidades del usuario interno?

R: En el entorno en el que trabajo, creo que esa posibilidad no se da de momento. Somos un equipo relativamente pequeño, que trabaja con EEUU con una importante diferencia horaria, y no encuentro ningún margen para una interfaz de voz. A otro nivel, el de las agencias de seguros en EEUU (no confundir con las aseguradoras en sí) suelen tener un tamaño de empleados pequeño. Ahí tampoco veo aplicación posible de momento.

P: ¿Qué crees que es más efectivo dentro de lo que entendemos como interfaz conversacional, un chatbot o una interacción a través de un altavoz inteligente?

R: Todos los datos indican que, a nivel general, los chatbots están dando muy buen resultado en temas de atención al cliente y resolución de preguntas habituales. Queda todavía mucho por explorar, pero la penetración de los altavoces inteligentes en los hogares todavía no es suficiente como para poder comparar. 

P: ¿Cómo se consigue que en una organización se dé prioridad a este tipo de tecnología? 

R: La puerta de entrada de una nueva tecnología es siempre la misma: el coste de oportunidad y la potencial rapidez en su implementación, aparte del valor que pueda aportar a sus clientes. En este sentido, existen ya muchas soluciones de chatbot que pueden ser fácilmente customizables ofreciendo un buen resultado, por lo que no debería ser un problema. El tema del altavoz inteligente afecta a otras variables, como es la propia penetración del dispositivo en los hogares o espacios físicos.

P: A nivel de seguridad, ¿Cuál es tu percepción sobre la interacción con este tipo de soluciones, principalmente en las que aplican a los altavoces inteligentes, con o sin pantalla?

R: No soy un experto de seguridad, pero a nivel de usuario creo que la percepción de la misma se diluye durante la interacción debido al carácter intangible de la voz. Al no haber una gran penetración (de momento) en temas de ecommerce, creo que el foco en la seguridad percibida se relaja bastante. A otros niveles, creo que la ética de los fabricantes jugará un papel relevante, así como la mejora en la revisión de las actualizaciones de las skills ya que algunos hackers éticos han detectado la posibilidad de realizar phishing a través de las propias actualizaciones (actualmente no se revisan).

Otro tema que no hay que descuidar es el del vishing. Ya se han detectado casos de suplantación de voces que han conducido a estafas. Es complejo, pero ya hay IA que está preparada para copiar y reproducir voces. Creo que este tema puede traer muchos quebraderos de cabeza y la legislación debe ponerse al día rápidamente.

P: Se habla mucho últimamente de las escuchas de los altavoces inteligentes supuestamente para aprender de los clientes para ofrecerles productos más cercanos a sus necesidades. ¿Qué opinas de esto?

R: Como comentaba antes, la ética va a jugar un papel muy importante en el futuro de la tecnología. En especial, de los altavoces inteligentes. No sólo por parte de los fabricantes, sino también por parte de todos aquellos que desarrollen skills. A medio plazo, las legislaciones tendrán que adaptarse para estos nuevos dispositivos y denuncias de los usuarios que seguro vendrán. 

Los altavoces inteligentes serán dentro de muy poco un elemento más del engranaje de la comercialización y de la recopilación de datos, por lo que sumarán información de valor a tu huella digital. A nivel personal, y siempre que se haga de una forma ética, no tengo ningún inconveniente en que mi interacción con las interfaces de voz sea utilizada para ofertar un servicio o un producto en el que puedo estar potencialmente interesado. Pero como digo, la ética y la regulación tendrán un papel muy importante en estas acciones.

P: ¿Interfaz de voz con pantalla o sin pantalla?

R: Depende del contexto. Creo que con pantalla puede tener mucho impacto positivo en la experiencia dependiendo de lo que estés haciendo. Aquí creo que va a haber una interesante aplicación de casos de uso a medio plazo y cada interfaz terminará encontrando su sitio a través de la propia experiencia de usuario. Pero al final lo que existe es un ecosistema donde interactuamos de forma sistémica con un engranaje formado por distintos dispositivos. El aspecto táctil al que ya estamos acostumbrados, se fusionará con el verbal y todo formará parte de la misma experiencia.

P: ¿Interfaz de voz como altavoz inteligente o desde cualquier dispositivo, por ejemplo desde un móvil?

R: Alrededor del año 2005 hice varios proyectos en los que tuve la oportunidad de testear con usuarios servicios de voz primitivos. Los resultados no fueron muy positivos debido a dos factores destacados. En primer lugar, la tecnología no estaba lo suficientemente madura y eso provocaba una pobre experiencia de usuario. En segundo lugar, los usuarios eran reacios a hablar con un dispositivo tecnológico. Estos dos factores han cambiado radicalmente en la última década gracias al desarrollo de nuevos lenguajes de programación y el refinamiento de la linguística computacional. A nivel de usuario, hemos perdido el miedo a hablar con un teléfono gracias en parte a WhatsApp. En definitiva, yo apuesto por la interfaz de voz y su expansión siempre que sea posible. Facilitará la vida a muchos usuarios, sobre todo en términos de accesibilidad.

P: ¿Qué sector o sectores crees que son los más beneficiados de este tipo de soluciones?

R: Creo que casi cualquier sector podrá beneficiarse en mayor o menor medida de las interfaces de voz. Pero creo que la banca, seguros, ecommerce, el sector asistencial o ehealth, e incluso la administración pública, pueden tener interesantes touchpoints en el diseño de sus servicios. Pero todos estos sectores deben ser capaces de analizar en profundidad sus customer journeys y proceder en consecuencia con la integración de este tipo de interfaces. Para ello hace falta mucha investigación y capacidad de experimentación.

P: ¿Si tuvieras que priorizar a qué le darías más peso, personalidad del bot, funcionalidades, otros?

R: A mí desde una perspectiva profesional me interesa muchísimo todo lo que tenga que ver con la personalidad. Supongo que es por mi propia formación en Psicología y Sociología. En este sentido, el modelo Her a nivel funcional está todavía muy lejos, sigue siendo una ficción. Pero la verdad es que se están haciendo cosas muy interesantes a este respecto, como Meet Q

Sin embargo, creo que se están descuidando lo que desde el punto de la psicología se denominan los aspectos “no verbales” de la voz: la riqueza tímbrica, la intensidad, la claridad de las consonantes, la proyección, el ritmo, el tono, etc. La propia Gestalt o la rama de la psicología evolutiva pueden aportar mucha luz a este respecto. Se han hecho muchos estudios en las últimas décadas y la voz es un elemento integrador y definidor de la comunicación en sí misma. 

En definitiva, creo que hace falta más investigación a este nivel y estudiar en qué debe consistir esta dimensión de “personalidad” que creo puede ser muy valiosa para, por ejemplo, el sector ehealth y asistencial. Pero sobre todo, ayudará a diseñar una tecnología más humana que servirá como base a futuros desarrollos, tengan o no que ver con interfaces de voz.

P: ¿Hay algo que quieras contarnos sobre las interfaces de voz que creas que nos hemos dejado en el tintero y consideres relevante?

R: Desde que empecé a interactuar con interfaces de voz, me fascinaron. Creo que tienen una dimensión psicológica que es necesario estudiar y potenciar más allá de la propia tecnología utilizada para su desarrollo. La lingüística computacional es el espacio donde en la práctica más se han fusionado las ciencias y las letras, pero hace falta ir más allá y estudiar más a fondo las emociones de los usuarios y cómo la tecnología puede responder (y responde) a las mismas. Existe un foco extraordinario en la seguridad, el desarrollo de skills, el dato recogido, etc., pero el aspecto emocional se está descuidando. Espero que no sea así y esto cambie a medio plazo.

 

¿Quieres que hablemos sobre Diseño de Interfaces Conversacionales?

Estaríamos encantados de charlar contigo sobre chatbots, o interfaces de voz, multimodal o más.

1 comentario

    Dejar una Respuesta

    Tu dirección de correo electrónico no será publicada.