Pronto nos comunicaremos mayoritariamente por voz con los ordenadores.

El despertador suena a las 6:30 de la mañana pero todavía tienes sueño y le pides que se calle hasta las 7:00.

Media hora más tarde, en la ducha, te acuerdas de la reunión a primera hora. ¡Maldita sea!, llegarás tarde; así que le dictas al asistente un correo para avisar de tu retraso. Aprovechas para añadir en la cesta de la compra el champú que estás acabando.

Al salir de casa, de camino al coche, te llega la notificación que han retrasado la reunión para que puedas llegar a tiempo. Preguntas por el estado de la carretera en tu trayecto habitual (no quieres tener más imprevistos)…

Parece que todavía falte mucho para eso, pero no es cierto.

En los tres últimos años se ha avanzado una barbaridad en la tecnología que hace posible convertir la voz humana en una orden que la máquina pueda entender. ¿Qué falta?.

Potencia de cálculo. El proceso de convertir la voz en una orden, y la respuesta en voz, es relativamente pesado para un ordenador. Las grandes compañías como Amazon y Google gastan dinero a raudales para procesar las voces de los usuarios de Alexa o Google Assistant. Son costes prohibitivos para muchos negocios.

Un ejemplo. Para una empresa de 1000 clientes, usar con Amazon lex (Alexa a la carta) una pequeña interacción (por ejemplo preguntar el estado de la carretera) de 4 pasos para sus clientes les costaría unos 14eur. Si estos clientes realizan esta interacción cada día, el coste sería de 16 x 22 (laborables) = 352 eur/mes.

No es caro, son 0.4 eur/mes por usuario. Pero las empresas sólo pueden ofertar servicios de voz a sus clientes si son de pago. Sospecho que Amazon está perdiendo (¿invirtiendo?¿apostando?) mucho dinero impulsando sus altavoces con Alexa.

¿Entonces, qué sucederá en el futuro próximo?

Teléfonos móviles. Los móviles no dejan de ser pequeños ordenadores de bolsillo, pronto (¿dos años?) tendrán la capacidad suficiente para procesar la voz para sus propietarios con suficiente rapidez. El teléfono convertirá la voz en órdenes y luego transformará la respuesta en voz. En ese momento, para las empresas ofertar servicios de voz, les resultará tan barato (o caro) como mantener una web decente.

¿Deben las empresas empezar a prepararse para ese cambio ? …. esa es otra historia.