Info Image

La Voz Contextual Proporciona una Ventaja Competitiva para el Negocio De Voz

Los operadores de redes de móviles (MNOs) han estado lidiando en los últimos años con la realidad de su negocio de voz. Con las aplicaciones de transmisión libre (OTTs) haciéndose con una cuota del mercado de voz mayor de lo que se esperaba, con la disminución de los márgenes del segmento de voz, y con los datos convirtiéndose en el denominador común preferido de los planes para móviles de los (MNOs), el negocio de voz sigue escalando posiciones para continuar siendo un segmento de negocio rentable.

Este es el motivo por el que la aparición este año de VoLTE y de las llamadas por Wi-Fi son un avance muy esperado para los operadores de redes móviles. Esa es la evolución que están experimentando Rich Communication Services (RCS) y Unified Communications (UC) y que promete situar al servicio de voz en una posición relevante en el ámbito de los negocios de telecomunicaciones. Con el debut de más de 16 implantaciones de VoLTE y servicios de llamadas por Wifi el pasado año, así como la introducción de algunos servicios MNO por parte de RCS y UC durante este periodo, el negocio de voz de los MNO parece estar bien preparado para hacer su reaparición.

¿Qué es la voz contextual?

En medio de todos estos nuevos desarrollos en el negocio de voz, hay otra prometedora y original tecnología, la voz contextual, que puede ser la clave para uno de los mayores cambios en este negocio de los MNOs, con la que redefinir su propuesta de valor en el futuro y su potencial de monetización. La voz contextual, todavía en una etapa conceptual, es una tecnología de comunicación de voz con la que se prevé transmitir tanto lo que hablan los usuarios en una llamada de voz, como un amplio conjunto de datos que se transmiten al cerebro humano utilizando frecuencias de mayor ancho de banda y que ayudan a construir el "contexto" de la llamada.

Escuchar más de lo que se habla

La idea de la voz contextual es bastante interesante ya que desarrolla por primera vez el concepto de "escuchar más de lo que se habla", ya que la mayoría de la gente no piensa que hay algo más que se intercambia durante una llamada de voz además de la palabras pronunciadas por ambas partes. Lo que realmente se lleva a cabo durante una llamada es la transmisión a través de una banda de frecuencias (medida en Hz) que incluye ruidos no "escuchados" por el oyente, pero que sin embargo, se transmiten durante la conversación y son captados por el oído humano y descifrados por el cerebro. 

Dos personas que se comunican mediante una llamada de voz de larga distancia pueden transmitir algo más que las palabras cuando hablan, y en los casos en los que la tecnología puede comprimir mayores anchos de banda sobre los dispositivos de los interlocutores, ambas partes pueden apreciar muchas más cosas la una de la otra, como estados de ánimo, emociones, el estado físico de la persona, las cosas y las personas del entorno, los conflictos, la percepción de urgencia, etc.

Esta semana The Fast Mode ha hablado con Radhakant Das, Vicepresidente Ejecutivo de BEDIGITAL, la sección de servicios digitales de Bakrie Telecom de Indonesia, en relación con la voz contextual como el siguiente concepto en el mercado de las comunicaciones de voz que va más allá del enfoque actual de HD, de la voz basada en IP y de las comunicaciones enriquecidas, llegando a un nuevo nivel de interacción de voz que se aproxima a la comunicación presencial.  Defensor incondicional de la voz contextual, Radhakant la define como una tecnología que aprovecha un gran número de entradas en tiempo real y múltiples algoritmos que enlazan el tiempo, el espacio, atributos de naturaleza emocional, física y política para presentar información contextual a las partes que realizan y reciben una llamada de voz.  

 

Radhakant Das,

Vicepresidente ejecutivo de BEDIGITAL, Bakrie Telecom

Según Radhakant, la tecnología que capta señales con de un mayor ancho de banda (es decir, superior a la banda de 300 Hz a 3,4 kHz con calidad de voz tradicional, y superior también a la de 50 Hz a 7k Hz empleada en las llamadas de voz HD) es capaz de proporcionar información al cerebro que no podemos oír, pero que sin embargo podemos decodificar, permitiendo recibir una mayor información sobre la persona y su entorno en el otro extremo de la línea. La voz contextual pretende transmitir en un ancho de banda mucho mayor, desde valores inferiores a 50 Hz y superiores a 14 kHz (que se define como "Banda super ancha" o banda ancha HD), permitiendo al interlocutor experimentar el "aura" de la persona al otro lado del teléfono, y ser capaz de oír la profunda respiración de la persona que llama, una ligera tos, los movimientos del cuerpo, los gestos y el estado emocional. Toda esta información se transmitirá en tiempo real junto con los sonidos audibles cuando se habilite la voz contextual en una llamada de voz.

Con la incesante búsqueda entre las empresas de tecnología de telecomunicaciones para ofrecer una experiencia de comunicación superior para los usuarios, la voz contextual promete la aparición de un servicio de gran relevancia que no sólo restablecerá la voz a su gloria del pasado, sino que se elevará para competir con servicios de la talla de la realidad aumentada, ofreciendo a los usuarios una experiencia más rica y casi "surrealista". La banda super ancha ya se utiiliza en la industria de musical, añadió Radhakant, y los oyentes disfrutan de experiencias sensoriales que van más allá de la música y de las letras que escuchan de forma consciente, y lo consiguen a través de los sonidos "silenciosos" presentes en frecuencias que el cerebro puede realmente "escuchar" y descifrar.

OTT, otra vez en la vanguardia

Como cualquier tecnología que aún está en su etapa inicial, Radhakant pronostica que el eventual aumento del uso de voz contextual va a depender de una serie de factores clave, a saber, de una investigación y desarrollo permanentes y más coordinados que le ayuden a reafirmar el uso de esta tecnología, la presión de los proveedores de servicios OTT y las mejoras al mismo tiempo de los dispositivos de consumo que permitan a los consumidores finales comenzar a experimentar con el servicio de voz contextual.

Radhakant compartió una serie de escenarios de uso, como la posibilidad de acompañar la llamada telefónica de un mensaje corto que explique el objeto de la llamada, y otro ejemplo puede ser el de un SmartWatch, en el que Apple Watch, es capaz de incluir información con datos como los latidos o la presión arterial de la persona que llama y que se pueden utilizar para indicar el estado de ánimo o emocional de la persona durante la llamada.

En los dos casos anteriores, la voz se acompaña de información contextual que se transmite a través de textos, imágenes o iconos, y la voz contextual en estos casos no se está basada totalmente en señales de audio. Estos casos la información contextual procede bien de datos introducidos manualmente o de información recogida automáticamente de nodos o sensores conectados. Sin embargo, ambos casos con la utilización de voz contextual son capaces de ofrecer información contextual a las dos partes que se comunican entre sí.

Una aplicación muy especial del segundo caso, en el que se puede transmitir información sobre el estado de salud y de la forma física a través de una llamada, convertirá a la voz contextual en una herramienta útil en telemedicina, y permitirá a los médicos a aprender mucho más acerca de sus pacientes que lo que éstos comparten voluntariamente durante las sesiones de diagnóstico a distancia, añadió Radhakant.

Abundando sobre los posibles casos de uso, Radhakant dijo que el aprovechamiento de los datos y las API de grandes proveedores de servicios de voz contextual permitirán construir automáticamente el contexto situacional para una llamada en cualquier entorno mediante la extracción y la combinación de información relevante de una gran cantidad de fuentes disponibles en la actualidad, tales como las tendencias actualidad en Twitter, los canales de noticias locales, información sobre ubicación, cámaras de circuito cerrado de televisión y otras fuentes de datos en tiempo real

El despegue: tradicional, VoLTE o OTT, ¿Por dónde empezar?

Despliegue sabio, Radhakant dijo que para un despliegue coherente de lavoz contextual VoLTE se destaca como la mejor plataforma, aunque las aplicaciones de transmisión libre (OTTs) tienen la ventaja competitiva de poder desplegar de forma más rápida esta característica en sus aplicaciones de voz debido a que disponen de unos modelos operativos más ágiles, además del estímulo empresarial que a menudo acompaña a las empresas OTT de nueva creación. A más largo plazo, sin embargo, la voz contextual recorrerá el mismo camino que el de las soluciones de RCS, donde los modelos de negocio contrastados proporcionarán el empuje a los operadores de redes de móviles (MNOs) para incorporar esta tecnología como parte de su oferta de servicios.

Mientras tanto, la voz contextual ha estado construyendo paso a paso su momento, después de su presentación en el MWC en 2013 y con el apoyo de Vodafone, Telenor y TIM Italia que han puesto en práctica algunas iniciativas vanguardistas en ese área.  Como tecnología, promete una experiencia nueva en telecomunicaciones, y como servicio que es, se espera que impulse el negocio de voz hacia una nueva fase de crecimiento. La responsabilidad recae ahora en posibles pretendientes que depuren el concepto, creen las aplicaciones pertinentes y pongan en práctica la idea. Para el resto de los que formamos parte de la comunidad de telecomunicaciones, es genial saber que algo grande se está gestando en el mundo de la voz.

Artículo original  - 'Contextual Voice – Creating an Edge for Voice Business' by Tara Neal, Executive Editor, The Fast Mode

Traducido por, Francisco Martínez - LinkedIn

Author

Executive Editor and Telecoms Strategist at The Fast Mode | 5G | IoT/M2M | Telecom Strategy | Mobile Service Innovations 

Tara Neal heads the strategy & editorial unit at The Fast Mode, focusing on latest technologies such as gigabit broadband, 5G, cloud-native networking, edge computing, virtualization, software-defined networking and network automation as well as broader telco segments such as IoT/M2M, CX, OTT services and network security. Tara holds a First Class Honours in BSc Accounting and Finance from The London School of Economics, UK and is a CFA charterholder from the CFA Institute, United States. Tara has over 22 years of experience in technology and business strategy, and has earlier served as project director for technology and economic development projects in various management consulting firms.

Follow Tara Neal on Twitter @taraneal11, LinkedIn @taraneal11, Facebook or email her at tara.neal@thefastmode.com.

PREVIOUS POST

La llegada de la Internet de Máquinas Conscientes

NEXT POST

Plataformas de mensajería integrada: Redes evolutivas y modelos de negocio para superar los nuevos retos