Escucha, máquina
De tanto hablarle a la máquina se nos atrofiará el cerebro por dejar de escribir. Y además, acabaremos hablándole como si fuese una persona.
Estas dos ideas —así resumidas y simplificadas para que me quepan en un párrafo— son las que plantea Enrique Dans en su última columna Los chatbots de inteligencia artificial y los peligros del modo voz.
En De laude scriptorum (1492), Trithemius advertía que la imprenta acabaría con la memoria y que escribir a mano era esencial para fijar el conocimiento. Automatizar la escritura nos iba a volver más torpes, pensaba el alemán. Quinientos años después, aquí seguimos.
Respeto y admiro a Enrique Dans. Tenemos suerte de contar con sus reflexiones. Pero en este artículo suena un poco… atrincherado. Me recuerda a mi abuela advirtiéndonos de los peligros de ver tanta tele, tan de cerca; o a quienes aseguraban que viajar en tren a más de 40 km/h desplazaba órganos vitales.
Estoy convencido de que hablarle a las máquinas en lenguaje natural cambiará cosas. ¡Si tengo un retrato de McLuhan enmarcado, por favor! Claro que nada será igual; por supuesto que estamos siendo recableados, como cuando llegó internet o el GPS. Pero eso no significa que sea peor. Será distinto —yo diría que incluso mejor.
Aquí van mis tres argumentos a favor de la IA por voz:
Es más emocional. La voz contiene una pista afectiva que el texto no tiene. Imagina la frase “¿Qué te pasa?” gritada, susurrada, o con tonito bromista… El tono, el timbre, el tempo. El mensaje hablado lleva metadatos emocionales que el texto sólo puede simular con ese parche llamado emoji 😅. De esto, de voz, sonido, emoción e información, sabe más que nadie el profesor Suárez Quirós, que hoy mismo hablará de ello en el Instituto Tramontana.
Es más rápida y más cómoda, en ciertos contextos. Escribir ocupa la vista y las dos manos. Hablar sólo necesita boca y oído. El coche, la ducha, los paseos… son momentos donde la mente va a toda potencia pero no puedes teclear ni abrir un portátil. No digo que la voz deba sustituir al texto, digo que se adapta mejor a muchos contextos.
Es más inclusiva. Dice Enrique Dans que habrá quien deje de escribir y sólo le hable a la máquina. Yo lo veo al revés: habrá gente —mucha— que POR FIN podrá hacer cosas con la tecnología que antes le resultaban imposibles. Piensa en ese tercio de la población mayor de 65 años que a duras penas se desenvuelve con el móvil y ya no puede operar con su banco porque todo va por GUIs, apps y menús telefónicos imposibles. O quienes no pueden comprar online, pedir cita al médico o gestionar un seguro porque la interfaz actual es un lodazal. Pon ahí una interfaz de voz y hemos ganado todos.
Diseñar es humanizar lo artificial. Ese es mi último argumento: las cosas mejoran cuando se adaptan a nuestra naturaleza. No todo es escribir prompts, igual que no todo lo que decimos son instrucciones. Conversamos para mil fines distintos y de mil maneras. Es fantástico que hayamos convertido eso en una interfaz.
La escritura es una tecnología artificial, como lo son los automóviles o los porteros automáticos. El lenguaje también lo es, pero es la más natural: se apoya en nuestra propia anatomía —tórax y cuerdas vocales— y es, de hecho, la más antigua.
Las interfaces de IA por voz combinan la tecnología más avanzada de la humanidad con la más antigua, lo más artificial con lo más humano. Imagina poder diseñar eso ¿Te pone la piel de gallina? ¡Eres de los míos!
Dice Dans:
Esa familiaridad tiene un precio: convierte la conversación con una máquina en sustituto del diálogo humano. Si no tienes alguien con quien hablar, búscalo, pero no te lo inventes.
Luego nos advierte del peligro de acabar como Theodore en Her, pillados por una IA con voz sexy. ¿Jugamos a agentes de IA en ficción? Venga. Yo pongo sobre la mesa a KITT (empático y cómplice), a C-3PO (amable e histriónico), a TARS (“turn your humour setting to 75%”), o a Wall·E, al que muchos preferiríamos antes que a media humanidad.
Fíjate: la IA por voz se vuelve maravillosa cuando la dotamos de rasgos de personalidad y convertimos el agente en personaje, aprendiendo de la literatura y, en especial, de la ciencia ficción. Diría que ese es ahora el punto más alto de diseño, precisamente en lo que estamos trabajando ahora en Tramontana y en Vidiv.
Dans continúa:
En segundo lugar, porque antropomorfizar a la inteligencia artificial y tratarla como interlocutor emocional o cognitivo es psicológicamente peligroso.
Aquí confieso que me he reído. No por lo que dice, sino porque me he imaginado una escena inevitable, cotidiana:
—Menudo día llevamos, Bobby. Y aún tenemos que llevar el coche a la ITV. Qué ganas de finde.
—¡Arf!
—Tú no tienes ganas de finde —dice Dans, rascándole la cabeza con cariño—. ¡Qué envidia, pillín!
Y no pasa nada. Aquí seguimos.
Las máquinas no nos quitan humanidad: nos piden que la despleguemos. Nos obligan a decidir quiénes somos, qué queremos contar y cómo queremos contarlo. Si la inteligencia artificial aprende a escucharlo, lo mejor que podemos hacer es hablarle.
Al final, la pregunta no es si hablar con máquinas nos volverá más tontos, más solitarios o más crédulos. La pregunta real es otra: ¿qué haremos con esta nueva capacidad expresiva?




Tenía un profe que sabiamente decía: "Sé tecnofóbico con los tecnofílicos y tecnofílico con los tecnofóbicos". Estoy de acuerdo en que, sobre todo para la accesibilidad, la voz será increíble. Sabré que he llegado a otra era el día en que las máquinas entiendan el tono irónico.
Es la natural resistencia al cambio, y la osadía (la de Dans pero también la tuya) de vaticinar lo que viene a partir de lo que hay, vaticinios en los que es difícil de acertar. Los cambios que vienen tendrán un efecto mayor en aspectos que casi no somos capaces de imaginar, y para los optimistas como tú y yo, serán buenos en general y traerán problemas que habrá que afrontar. O sea, como todo en la vida.