Reflexiones sobre el enriquecimiento pragmático en el procesamiento del lenguaje natural a partir del análisis del juego de mesa Dixit.
En el post de este mes, me gustaría hablar de algunos asuntos relacionados con el modo en que la mente interactúa con la forma lingüística usando, como ejemplo de partida, el funcionamiento del juego de mesa Dixit.
Tarea esencial es, para los que trabajan en la inteligencia artificial, comprender cómo la forma lingüística entra en contacto con el contexto para obtener su significado final. La comprensión e implementación de dichos procesos mentales son de obligado cumplimiento si queremos mejorar el rol comunicativo de los robots sociales.
Pero, primero, para los que no lo conozcan, presentaremos una breve introducción a este juego de mesa.
El juego Dixit se compone de los siguientes elementos:
-
una baraja de cartas con dibujos más o menos surrealistas en su interior.
-
un tablero con un recorrido parecido al de la oca, pero las casillas son neutras.
-
seis fichas que representan a los participantes y que son figuritas de conejitos de colores.
Al inicio de la partida, se reparten seis cartas a cada jugador. El que se la liga, o se la pocha, o el que es la madre, que de diferentes formas se puede decir, elige, de entre sus cartas, una de ellas y dice en alto una frase o palabra o interjección u onomatopeya o emite un ruido que le inspire la carta. Pongamos un ejemplo. Supongamos que me han tocado estas cartas:
Elijo la última, la de los niños y el lobo, y digo lo siguiente: el lado oscuro del corazón.
A continuación, cada jugador buscará, de entre sus cartas, aquella que más se le parezca al patrón lingüístico dicho por la madre. La madre recogerá todas las cartas seleccionadas, incluida la suya, las mezclará, las barajará y las irá poniendo, una por una, boca arriba en la mesa.
Ahora, todos los jugadores menos la madre deben votar a la carta que ellos crean que pertenece a la madre.
Ahora que ya conocemos el juego básico, pongamos un ejemplo más complicado. La madre ha elegido una carta entre todas y ha dicho en alto la expresión: dar la nota.
Es aquí donde se ve claramente el lanzamiento de un patrón lingüístico sin contexto. En la comunicación hombre máquina, el robot también recibe formas lingüísticas sin significado, sin contexto, solo pura forma.
Los jugadores tienen que buscarle un significado a la forma que la madre ha enunciado, que era: dar la nota. Y aquí comienza el juego de probabilidades en la interpretación, la búsqueda de rutas neuronales, que asocien significante a significado. Puesto que sabemos que la forma lingüística es per se ambigua, cada jugador, buscará en su mente posibles significados a la expresión dar la nota e intentará buscar en las cartas un contexto adecuado para ellos. De igual manera tendría que operar un robot social y creativo.
Ejemplos de posibles significados:
- Dar la nota: un profesor que da la puntuación de un examen.
- Dar la nota: un borracho que por la calle está haciendo escándalo
- Dar la nota: un músico comunicándose con su orquesta
- Dar la nota: una persona que le da una nota a otra.
Estas son algunas de las posibles alternativas de interpretación, pero no todas, y no todas aparecen a la vez en la mente de todos los jugadores. Los jugadores elegirán la carta, esto es, el contexto, que se adecue mejor al posible significado que se le haya ocurrido, significados que acudirán más o menos en función de nuestra riqueza verbal y de la desinhibición (Freud estudió ya debidamente en su día cómo ciertas rutas neuronales se bloquean en función de condicionantes contextuales como la timidez, la ansiedad, estrés, etc. lo cual significa que podemos tener más significado en nuestra mente de los que afloran en ese momento a nuestro pensamiento consciente).
Vemos, por tanto, a través de este juego ejemplificado algunos hitos dentro del procesamiento del lenguaje natural dentro de la mente. Así por ejemplo a los lingüistas, y también a vosotros en el colegio, os enseñaron que el signo lingüístico se componía de significante y significado y que esta relación era arbitraria.
Quiero desde este medio de divulgación de conocimiento, como es la sección angular, empezar a deconstruir algunas creencias que están impidiendo un enfoque productivo para la IA sobre cuestiones de procesamiento de lenguaje natural.
En primer lugar, hay que por fin aceptar de una vez por todas que la forma lingüística está completamente desligada del significado, que es una relación abierta, cuyas rutas se van fijando probabilísticamente en función de la experiencia.
La cultura, la convencionalización de la realidad, las rutas o inferencias mentales que se recorren una y otra vez, son las que van estrechando esta relación entre significante y significado, que, como digo, en principio, al igual que las conexiones entre las neuronas, son abiertas.
A muchos ingenieros, la ambigüedad del lenguaje les irrita. Sin embargo, si no fuera porque la forma lingüística no está ligada intrínsecamente al significado, el lenguaje, como herramienta de supervivencia que ha llegado a nuestros días, no hubiera podido designar todas las realidades nuevas que a lo largo de la historia han ido surgiendo. Las lenguas son formas que van sobreviviendo en el tiempo y son sus hablantes las que a través del uso van renovando los significados, en función del contexto histórico, y de cómo este va cambiando.
Actualmente, estamos muy lejos de que un robot pueda jugar correctamente al Dixit con un humano. Los sistemas de comunicación hombre-máquina hasta la fecha se conciben para dominios restringidos; esto es lo que les hace crear un vínculo estable entre la forma lingüística y su interpretación. De hecho, algunos sistemas de diálogo ya tienen sus gramáticas cargadas que determinan la interpretación de los inputs. Estas estrategias tienen una probalidad de éxito elevada cuando el robot o asistente virtual tiene que cumplir una función específica. Sin embargo, cuando hablamos de robots sociales, robots abiertos a temas de conversación libres, robots que sirven para jugar con niños, robots a los que se les exige cierto grado de creatividad, dichas conexiones se tienen que dejar abiertas. Los robots sociales serán, con el tiempo, lo más alejado de un perro de Pavlov. Mediará una interpretación de los datos de la realidad, entre el input y el output. Conectarán sus patrones lingüísticos a patrones emocionales. Y realizarán cálculos sociales sobre la conveniencia de decir lo que piensan en cada momento o de callarse para no generar conflicto social. Todas estas habilidades propias de la inteligencia social, o, dentro de la Lingüística, de la dimensión pragmática de la lengua, deben ser consideradas como la meta final en la concepción de sistemas de diálogo complejos que hagan robots sociales no solo comunicativos sino con una conducta social adecuada a las normas que rigen los marcos o frames descritos por el sociólogo Goffman.
Ana González Ledesma
Departamento de Procesamiento de Lenguaje Natural y Sistema de diálogo de AISoy Robotics.
Aclaración:
*Dixit es distribuido en España por Morapiaf.
*Todas las imágenes del juego son propiedad de sus respectivos licenciatarios.
*AISoy no tiene un acuerdo comercial con ninguno de los propietarios o distribuidores de los productos mencionados en el blog.



