Xataka
Contenidos contratados por la marca que se menciona

+info

En las últimas décadas han surgido muchas grandes revoluciones tecnológicas, y todas empezaron como herramientas básicas que se expandieron con fuerza: el PC, el teléfono móvil, internet, el portátil, el smartphone… Cada una de ellas ha cambiado nuestro mundo. En la actualidad convivimos con dos tecnologías emergentes que harán lo propio: la IA aplicada y el control por voz.

En casos muy concretos, estas tecnologías ya están combinadas y entrelazadas en máquinas de uso diarioSiri en sistemas operativos Mac/iOS; Cortana en Windows; Google Assistant en Android, Chromium y Google Home; Alexa en dispositivos Amazon; la traducción automática de Microsoft en dispositivos Huawei con chip IA Kirin… Y este universo se está expandiendo.

¿Qué puede hacer hoy en día un asistente de voz?

Lejos queda todavía el día en que un Jarvis al estilo de Iron Man nos hable de forma natural. Los sistemas de inteligencia artificial mejoran con cada interacción, pero su avance es aún lento y moderado. Esto no significa que no den saltos relevantes cada pocos meses, ofreciendo mejoras en hardware y software y, lo que es más importante, en funcionalidades.

Desde hace años, Siri, Google Assistant, Cortana o Alexa nos permiten realizar búsquedas en internet, devolviendonos una breve —o no tan breve— reseña del término por el que preguntamos. En 2016, el 20% de las búsquedas móviles se hacían mediante voz.

Por ejemplo, decimos “Ok, Google” seguido de una frase simple “define asistente virtual”. Tras apenas medio segundo de espera, una voz sintetizada nos responde: ”Según Wikipedia, un asistente virtual es un agente de software que ayuda a usuarios…”.

Google Home usa el motor de búsqueda de Google, mientras que Alexa va directa a Wikipedia y Cortana usa Bing. Cada uno barre para casa, aunque, como veremos más abajo, el panorama se está complicando bastante. Además, se puede hacer más que solo preguntar términos, pedir el parte del clima o poner música.

El vídeo anterior muestra la tecnología capaz de remodelar la vivienda con un panel táctil o usando comandos de voz. Detrás está el español Hasier Larrea, que trabaja en la integración de este transformismo con asistentes de voz. El objetivo es que nuestra próxima vivienda podrá ser domotizada vía asistente virtual.
De hecho, en octubre de 2018, Amazon sacaba seis nuevos dispositivos para el mercado español, con una mecánica muy interesante a la cabeza: las skills o capas de personalización. Funcionan de un modo similar a los bots de inteligencia artificial de Skype o a las aplicaciones de un smartphone. De este modo, los programadores podrán crear sus propias “apps” y los usuarios descargarlas, aumentando las posibilidades del universo de los asistentes de voz.

¿Cómo funciona la IA del asistente de voz?

El procedimiento base es muy sencillo de entender, pero realmente complejo de programar, funcionando de un modo similar a como las personas entendemos lo que nos dicen los demás. De hecho, la inteligencia artificial busca acercarse en la medida de lo posible al pensamiento humano

Cuando alguien habla, nuestros oídos registran las ondas de presión en el aire y las traducen a impulsos nerviosos que llegan al cerebro. Allí se coteja esa información con una base de datos personal en base a nuestras vivencias y cultura, y surge el entendimiento.

Las máquinas aún no nos entienden (recordemos que oír no es saber escuchar), pero son capaces de saber qué estamos diciendo. De momento, eso es suficiente. Cuando nuestra voz digitalizada llega a un servidor, de este surge una respuesta que podríamos llamar “instintiva” por su falta de consciencia, pero basada en sistemas de aprendizaje.

Un universo integrado y codependiente

El universo de los asistentes de internet lleva unos años complicándose, y sus límites haciéndose más difusos en todos los sentidos. No solo integran cada vez más sistemas, pasando de controlar Netflix a las luces de la casa. Al igual que ocurrió con los programas de algunas marcas (como Word de Microsoft, ahora en sistemas Android e iOS), hay cierta permeabilidad en el mundo de la inteligencia artificial.

Alexa arrancó con el objetivo evidente de convertirse en el centro neural de la vivienda como altavoz inteligente. Los datos que recoge pueden ser integrados dentro de los algoritmos de la marca de Bezos, y con su procesamiento Amazon puede ofrecernos productos de nuestro interés (o necesidad). En altavoces inteligentes, su cuota de mercado es del 70% y ya integra domótica.

Parece una cuota alta, pero compite directamente con el Google Assistant integrado en los dispositivos Google Home y en todos los teléfonos que incluyen Android (que suponen más del 85% de la cuota de mercado móvil). El smartphone Huawei P20 Pro usa un sistema operativo Android Phone, por ejemplo, por lo que tiene integración natural con el asistente del buscador.

Para complicar un poco más la trama, este Huawei usa un chip Kirin 970 para, con los recursos de inteligencia artificial del traductor de Microsoft, ayudar a traducir en tiempo real conversaciones en varios idiomas, como se ve en el vídeo adjunto. No es un hecho aislado: Alexa ya puede instalarse en Windows, algunas marcas de televisores incluyen el motor de Google Assistant, y los Amazon Echo ya han abierto la puerta al desarrollo de aplicaciones (skills) externas.

En otras palabras, pronto veremos estándares muy interesantes a nuestro alrededor, como ha ocurrido con otras tecnologías, como el protocolo HTTP o con el cargador USB. Ahora, móviles, ordenadores, auriculares, altavoces o relojes se cargan con USB porque miles de marcas orientaron sus esfuerzos a hacerlos compatibles. Si esto lo llevamos a interactuar con voz con las máquinas, el futuro es brillante.

¿Qué podrán hacer los asistentes digitales en el futuro?

Hoy día podemos usar los asistentes para hablar en tiempo real en otro idioma, algo que podría cambiar la educación tal y como la conocemos. Además, en muchos dispositivos ya es posible comprar, programar alarmas y eventos, leer nuestro calendario, realizar llamadas de teléfono, programar la ruta sin necesidad de levantar las manos del volante, etc. ¿Y en el futuro?

Además de controlar la configuración de la vivienda, y sin salirnos de ella, ya se están integrando sistemas domóticos como los de Philips en algunos asistentes virtuales. Luces y climatizadores están adentrándose en el segmento de dispositivos con conexión a internet, así como esos robots a los que llamamos electrodomésticos. No hay más que abrir nuestra aplicación Google Home para observar que en el botón “+” se van añadiendo cada vez más dispositivos conectados.

Es posible que en un momento de nuestro vehículo, o una aplicación directa a nuestra empresa favorita de taxis robotizados, estén conectados a la red mediante asistentes virtuales. Estos ya están evolucionando a acompañantes como los que veíamos en la ciencia ficción:

La marca Gatebox (arriba) lleva tiempo trabajando en este concepto. Es posible que en el futuro no esperemos nada de la IA más allá de que esté ahí y nos haga compañía. Quizá en su momento todos los parámetros de la cámara queden ajustados en “automático” y sea el teléfono móvil el que los elija, como ocurre con algunas funciones de los teléfonos de última generación de Huawei.

También es posible que en el futuro enfoquemos con nuestro teléfono y solo le tengamos que decir al asistente “ajusta la fotografía para Instagram, quiero mostrar tristeza”. Tras ello, el chip Kirin podría servirse de algoritmos de aprendizaje como el usado por Aesthetics para lograr imágenes de más impacto.

Las personas hablamos entre nosotros usando la voz, no nos pasamos notas de texto en las comidas familiares. ¿Por qué íbamos a hablar con las máquinas de otro modo, si es nuestra forma natural de comunicarnos?

Imágenes | iStock/AndreyPopov e iStock/seewhatmitchsee