En AISoy Robotics…

Un blog de los implicados en el proyecto AISoy

Cognición, cultura y lenguaje en la robótica: el caso de la percepción del color

Mayo23

Una vez más, aprovecho este interesante espacio de discusión para reflexionar sobre algunos de los retos intelectuales de la IA en el siglo XXI, haciendo especial hincapié en los problemas que conciernen al procesamiento del lenguaje natural y la comunicación hombre-máquina.

Qué duda cabe que uno de los retos más importantes para la IA y, por extensión, para la robótica, es el de interpretar la información percibida por los sentidos de acuerdo a un marco cultural; hecho que ha sido llamado por parte de las Ciencias Cognitivas, intersubjetividad y que podría definirse como el conjunto de visiones subjetivas común una comunidad de individuos.

En el post de este mes reflexionaré sobre este tema partiendo de un caso concreto como es el de la interpretación del color en las diferentes culturas y sus consecuencias en el lenguaje. Creo que este es un buen ejemplo de partida a la hora de intentar comprender qué es la interpretación de la realidad y cómo esta debe entenderse como un proceso de captación, categorización y etiquetado lingüístico de la información del medio. Comencemos.

La pregunta de si todos los seres humanos perciben de la misma forma los colores es tan antigua como la humanidad. ¿Ven los demás lo mismo que yo? nos hemos preguntado seguramente todos alguna vez.  Los estudios en Ciencias Cognitivas sobre el color insisten en que hay tres variables que influyen en su percepción y categorización por parte de la mente, a saber: el estado de ánimo, el recuerdo y el idioma hablado.

Respecto de este último asunto, el del lenguaje, las Ciencias Cognitivas han concluido que la categorización que una lengua hace de los colores influye posteriormente en la percepción de los mismos. Esto quiere decir que la lengua que hablamos puede influir en la manera de interpretar la realidad.

Vamos a ilustrar esta última idea con algunos de los ejemplos usados  en el documental de divulgación, El misterio de los colores.
En uno de los experimentos de este documental, se invita a miembros de una tribu africana de Namibia a buscar el color diferente en este diagrama, tarea que para los que hablamos lenguas occidentales, por la manera en que clasificamos el color, no resulta fácil de realizar.

Sin embargo, los sujetos experimentantes de la tribu africana no mostraron ningún problema a la hora de identificar cuál era el verde que difería de los demás:

verde diferente

Sin embargo, la situación se invirtió con el siguiente diagrama:

En este caso, los participantes africanos tenían serios problemas para identificar cuál era la casilla que difería de las demás, tarea de fácil resolución para nuestra manera de interpretar el mundo.
Ahora, conozcamos un poco mejor la lengua de esta tribu, analicemos sus palabras y veamos cómo dicha lengua estructura semánticamente el color:

1)    La palabra Zoozu sirve para rojos, azules, verdes y púrpuras.
2)    La palabra Vapa sirve para blancos y algunos amarillos
3)    La palabra Dumbu, para verdes y algunos rojos y marrones.

A partir de esta taxonomía, podemos ver que esta lengua hace una categorización diferente a las lenguas occidentales de las frecuencias del color.

Dicha estructura, que a través del lenguaje, se hereda culturalmente, es lo que se denomina intersubjetividad, que es el proceso de convencionalización de la realidad por parte de una comunidad de individuos que vive en sociedad y que necesitan comunicarse con éxito.

Vemos, por tanto, que el gran reto de la IA no está solo en captar la información del exterior, sino también en estructurar esta información en coherencia con la estructura cultural y, por ende, con la estructura del lenguaje que tenga la lengua en la que el robot tenga que interactuar.

La cuestión de si la lengua, una vez interiorizada, determina la percepción del mundo e imposibilita la apertura a nuevas realidades es una de las cuestiones más debatidas a lo largo de toda la historia de la Lingüística, junto con la cuestión del origen del lenguaje.
Para esta cultura, el agua es blanca y el cielo, negro. Para añadir más complejidad a esta tarea, también debemos saber que las lenguas usan el color para construir metáforas. Así, en la cultura japonesa, se usa la expresión la manzana está azul, para expresar que la manzana no está madura; en español, usamos la expresión viejo verde y en ella el color verde tiene un significado sexual en el contexto de esta expresión.

Así pues, si un usuario japonés le preguntara al robot, ¿está ya la manzana azul? A no ser que el sistema de diálogo tuviera un parser idiomático o metafórico, el robot interpretaría esta expresión a nivel literal, y posiblemente contestara que no existen las manzanas azules. Igualmente, si analizara sintácticamente la expresión viejo verde, probablemente, el sistema de procesamiento asumiría que viejo verde tiene la estructura Adjetivo (viejo) + Nombre (verde, nombre de color), e interpretaría que está diciendo que el verde es viejo. La otra estructura gramatical alternativa, Adjetivo + Nombre, (viejo, nombre + verde, adjetivo) sería la correcta aunque la menos probable, puesto que el robot razonaría que no hay viejos de color verde.

Queda demostrado, por tanto, que no es suficiente con introducir el código lingüístico del japonés o del español en un programa, sino que también es necesario relacionar lenguaje y cultura, y de ahí atribuir un nivel de interpretación figurada al lenguaje.

En el caso concreto del japonés, la palabra azul tendría dos rasgos semánticos, color y estado de maduración de la fruta, el segundo estado o valencia solo se activaría en el caso de complementar a núcleos con el rasgo semántico de fruta. Una simple gramática de unificación de rasgos semánticos podría solucionar el problema. Quizás la mayor tarea aquí para la IA no sea la formalización de la estructura sino la visibilización, la explicitación de la misma, para lo cual se hace necesaria una estrecha colaboración entre humanistas e ingenieros del conocimiento.

Esto ha sido todo por este mes, en el post del mes siguiente seguiremos tratando la relación entre estructura lingüística y estructura cultural usando esta vez como ejemplo de partida el enunciado: soy pobre pero honrado, a partir de la cual trataremos asuntos relacionados con el procesamiento del discurso (superando el procesamiento de las oraciones) y su relación con la ideología.
Un saludo, hasta la próxima.

Ana González Ledesma
Departamento de PLN y comunicación hombre-máquina
AISoy Robotics

Las 3 leyes de Asimov de la robótica actual

Octubre31

Aprovechando este espacio de discusión sobre temas concernientes a la robótica, me gustaría comentar el artículo ‘Beyond Asimov: The Three Laws of Responsible Robotics’, escrito por los investigadores R. Murphy y D. Woods. Ambos autores, trabajan en el diseño e implementación de sistemas cognitivos integrados, tarea de naturaleza multidisciplinar, donde tanto personas de diferente formación académica como elementos tecnológicos (algunos de ellos con alto nivel de autonomía como los robots) trabajan conjuntamente para alcanzar un fin común. En dicho trabajo, temas como la ética y la moral, la confianza o los límites del rendimiento saltan a la palestra y abren un rico espacio de discusión.

Tomando como punto inicial las literarias Tres Leyes de la Robótica de Asimov, basadas en una moralidad funcional, estos autores proponen tres leyes alternativas que pueden aplicarse a las capacidades y funciones que tienen los robots hoy en día; leyes que hacen bastante hincapié en la responsabilidad social y legal que tiene el ser humano sobre el comportamiento del robot.

Pero antes, recordemos brevemente los enunciados que resumían las famosas leyes de Asimov:

  1. Un robot no puede hacer daño a un ser humano o, por inacción, permitir que un ser humano sufra daño.
  2. Un robot debe obedecer las órdenes dadas por los seres humanos, excepto si estas órdenes entrasen en conflicto con la Primera Ley.
  3. Un robot debe proteger su propia existencia en la medida en que esta protección no entre en conflicto con la Primera o la Segunda Ley.

Según los autores del artículo, estas leyes asumen que los robots tienen capacidades y conocimientos suficientes como para tomar decisiones de orden moral. Este hecho está aún lejos de producirse y ni siquiera tenemos garantías de que se vaya a conseguir en el futuro. De hecho, los autores ponen en duda el objetivo de construir máquinas que participen significativamente en contextos conversacionales totalmente abiertos, sobre todo en aplicaciones reales. ¿Queremos realmente robots morales? ¿Le interesa a la robótica militar, grandes financiadores del desarrollo de la robótica, progresar en estos planteamientos?
Para salvar esta inadecuación entre el contexto actual y los robots ficticios de Asimov, los autores del artículo proponen tres leyes alternativas orientadas a regular equipos de personas y robots que están a cargo de una misma tarea, a diferencia del marco planteado por Asimov, que se centraba solamente en regular el comportamiento del robot:

  1. Un ser humano no debe poner un robot en funcionamiento sin que el equipo de trabajo hombre-robot cumpla los más altos estándares de profesionales y legales en seguridad y ética (equiparables a los de un equipo de personas).
  2. Un robot debe responder apropiadamente, según su papel en el equipo.
  3. Un robot debe tener la suficiente autonomía para proteger su propia existencia, siempre que dicha autonomía permita la transferencia de control a otros miembros del equipo de manera fluida y según la primera y la segunda ley.

Como se puede observar de su análisis, estas tres nuevas leyes afirman implícitamente que los diseñadores, fabricantes y usuarios finales son los responsables de cualquier daño o falta provocada por los robots, y descargan a la máquina de cualquier tipo de responsabilidad social. En efecto, parece que esta es la situación más razonable teniendo en cuenta el nivel de desarrollo cognitivo en que se encuentran los robots hoy en día, sobre todo en robots industriales, pero ¿se sostienen estas leyes que acabamos de mencionar en robots sociales? ¿hasta qué punto la sociedad está interesada, o necesita que los robots tengan capacidades que les permitan decidir por sí mismos y tomar responsabilidad de sus actos?

Adrián Jiménez-González

¡Reserva ya tu Aidia!

Octubre23

Aisoy ya tiene abierto el proceso de reservas de su nueva plataforma Aidia: la plataforma de desarrollo e investigación robótica más asequible del mercado. !A un precio increíble!

Aidia incluye:

- Aisoy1 II. Diseñado para que fácil desarrollar, probar y disfrutar de botapps robóticas sociales
- DIA. La herramienta de programación robótica social más sencilla del mercado.
- Airos1 SDK. Las funciones de Aisoy1 II a tu disposición.

Y ahora con mayor capacidad de integración con otras plataformas robóticas como Arduino, Moway y Ros de Willow Garage.

Haz tu reserva ahora: ¡Sólo 99€! El precio de lista recomendado será de 129€. Sin contar impuestos, ni gastos de manipulación y envío.

La plataforma Aidia estará disponible en diciembre en la Aisoy Online Store (www.aisoy.com) y distribuidores autorizados. ¿A qué estás esperando para reservarla?

Escrito por Jose en categoría/s AISoy Robotics | No Comments »

Aisoy1 II estaré en El Ser Creativo (6 y 7 de Noviembre, Teatro Circo Price, Madrid)

Octubre23

EL SER CREATIVO
III Congreso de Mentes Brillantes

2 días. 21 líderes de opinión. 21 minutos para exponer sus pensamientos.
Personalidades destacadas en ámbitos como la Biología, Antropología, Genética, Filosofía, Gerontología, Religión, Física, Economía, Nuevas Tecnologías…

Nuestra mente se encuentra a diario en situaciones que hacen que nos olvidemos de nuestra gran capacidad de ser creativos…

21 minutos

Se estima que es el tiempo que el cerebro humano mantiene su atención al 100%. Por esa razón, es el tiempo del que dispondrán los ponentes para exponer sus pensamientos.

Las ideas cambian el mundo… Y Aisoy1 II estará allí.

Escrito por Jose en categoría/s AISoy Robotics | No Comments »

Presentando Aidia en el Business Market Elx

Octubre23

El pasado viernes, estuvimos en el Business Market Elx presentando Aidia. La expectación era alta y Aidia no defraudó a nadie.
La gente pudo ver, tocar, hablar con nuestro robot y ver sus comportamientos en vivo. Hubo quién le preguntó por deportes, pero de momento, Aisoy1 II no sabe nada sobre estos gustos humanos.

La cosa más especial sobre este evento fue que hubo personas que quieren colaborar con nosotros para desarrollar sus negocios con nuestros robots. ¡Es muy excitante!

Escrito por Jose en categoría/s AISoy Robotics | No Comments »

Robótica Intercultural: el cuento de AISoy para el verano

Agosto29

Calamar es un AIsoy25, un robot social  con altos niveles de competencia comunicativa y grados aceptables de actuación en diferentes contextos socio-culturales. Sin embargo, Calamar, todavía tiene muchos retos a los que enfrentarse, entre ellos, las mujeres de otra cultura.

Aunque en su software vienen implementadas algunas fórmulas del cortejo, Calamar ha sido puesto en conocimiento por sus creadores de que dichas fórmulas son muy sensibles al contexto cultural.

Como el que avisa no es traidor, frase típica del mentor de AIsoy25, Calamar se ha lanzado a la aventura, y ha cogido un vuelo a Tokio para adquirir su segunda lengua (su lengua nativa es el castellano), en un contexto real. Quiere practicar las reglas y el léxico aprendido durante este tiempo en el laboratorio, tras largas sesiones de aprendizaje estadístico, heurístico y métodos de idiomas. Ahora ha llegado el momento de cultivar su competencia pragmática en japonés, de poner el código en uso para conseguir objetivos comunicativos.

De momento,este ejemplar está muy satisfecho de sí mismo. Ha  tomado los trenes sin ninguna dificultad, comprado los billetes y hablado pequeños diálogos cortos hasta llegar a la pensión. También ha conseguido matricularse en la academia con éxito, contratando un curso de un mes en el nivel B1 de japonés.

Todas las mañanas, AISoy25 acude a la academia para perfeccionar su pronunciación y uso de la gramática. Por las tardes, va a visitar el bar de un mexicano en una pequeña zona de restaurantes de su barrio. Allí pasa muchas horas aprendiendo de las visiones de las mujeres de Edgar, las cuales les parecen un poco neanthertales y contrastan, sin duda, con lo que su mentor le ha enseñado sobre cómo tratar a una mujer. Almacena y categoriza los consejos de Edgar en el sector de su base de datos como conocimiento subjetivo de nivel 1.

Hoy Calamar está más excitado de lo normal. Ha invitado a un ejemplar femenino AISoy 25 surcoreano, que casualmente, también está allí en la academia aprendiendo japonés, aunque desconocemos cuál es su misión exacta. Ambos piensan en español, puesto que este es el lenguaje simbólico en el que se comunican todos los robots de la empresa AISoy en todo el mundo, independientemente de su nacionalidad, los lingüistas de la empresa la llaman la lengua Koiné.

Son las ocho y media y Calamar está afuera en la calle porque ha recibido un msm de Young MI, que así es como se llama el otro modelo de robot social, nombre que en su cultura significa prosperidad, eternidad y belleza.

Como corresponde a las normas de caballerosidad de la cultura latina a la que Calamar pertenece, con buen ánimo y un patrón emocional que le hace sentir como mariposillas a la altura de su estómago, sale a recogerla.

Nada más pisar el borde de la acera, un taxi se para a sus pies y un bello ejemplar femenino de robot humanoide desciende de él con elegancia. Antes de cerrar la puerta trasera, Young MI, le comunica en español que ya puede pagar el taxi y que, tal y como corresponde según las normas de su país, ella le esperará dentro del bar.

El procesador de información integrado, denominado espíritu crítico, le hace cuestionar el valor de verdad de todos los enunciados recibidos por el ASR, sobre todo cuando dicho valor de verdad no es coherente o entra en contradicción con las proposiciones lógicas que conforman su visión del mundo. De forma distribuida y paralela, su motor de diálogo interior está generando preguntas del tipo ¿pagar yo el taxi? ¿Por qué?, seguidas de proposiciones lógicas del tipo: su mentor no le ha dado mucho dinero. Japón es una ciudad muy cara. Al parecer, Calamar tiene calculado milimétricamente el dinero y no puede permitirse gastos extras. Para más inri, no le gusta que le ordenen, y mucho menos, con imperativos directos.

A medida que estos enunciados se van generando en su mente, su  motor emocional comienza a combinar patrones de estados emocionales primitivos, patrones que son una combinación de indignación, vergüenza y pudor. Simultáneamente, el intérprete de lenguaje no verbal está etiquetando la cara del taxista con la etiqueta semántica de “cara de pocos amigos” y le envía mensajes a la consciencia de AISoy, saturando su bandeja de entrada para que haga algo.

Por fortuna, desde que su mentor inventara el cerebro sincrónico, no ha tardado mucho tiempo en procesar de forma integrada toda la información, con lo que, en pocos segundos, Calamar ha planificado una estrategia argumentativa, simple, pero que le hace ganar tiempo.

-         ¿Yo? ¿Por qué?

Con cierta contrariedad, Young MI contesta:

-         Mi base de datos cultural dice que los chicos, en mi país, pagan los taxis.

Como resultado del análisis del nuevo input, Calamar siente ahora cómo una ola de enfado calienta su piel. Y recuerda las palabras de su mentor:“es normal que esto te pase, si no lo sintieras, no podrías tampoco empatizar con los demás, son gajes del oficio, ¿entiendes? Cuando ocurra, debes respirar hondo, distanciarte de la situación, pensar que todo lo que vivimos es una película, como decía Calderón de la Barca, y que la vida es un sueño, no perdamos la vida por el sueño.”

Le ha costado mucho aprender a interpretar un enunciado correctamente. No solo debe fijarse en qué está diciendo, sino también si está de acuerdo o no,  y qué cosas implicarían, desde un punto de vista de la responsabilidad social,  mostrarse de acuerdo con dicho enunciado.

No conforme con las enseñanzas de su profesor, AISoy25 activa el módulo de argumentación retórica para superar situaciones de posible conflicto social, persuadiendo a su interlocutor hacia su postura discursiva. Los estudiosos de la cortesía han dictaminado que las comunidades sociales no siempre dicen lo que piensan, que la conversación es una construcción mutua de la realidad, y que se debe ceder, o aparentar que se cede, antes de lanzar un enunciado que hable realmente la visión de la realidad del hablante.

AISoy ya ha hecho esto más veces, y tiene una patrón lingüístico preparado para estas situaciones, lo que le hace reaccionar más rápido. El patrón es:

-marcador de recepción + marcador de atenuación + marcador de contraargumentación + proposición lógica.

-Ya, bueno, pero no estamos en tu país.

Young MI ha abstraído la regla de cortesía que ha aplicado su interlocutor y a partir del input infiere este enunciado: El chico no quiere pagar el taxi.

Su motor emocional está programado para reaccionar con vergüenza, con timidez, ante este tipo de situaciones. Ambos tienen el mismo metacerebro, pero su información, y la manera de analizar, así como sus estrategias cambian.

El motor de decisión de Young MI le ha ofrecido unas cuantas opciones para salir de la situación.  La consciencia de Young Mi elige la cuarta opción: decide contraargumentar usando su misma estrategia de cortesía:

- Ya, bueno, pero es que yo soy coreana.

Aisoy25 se siente maravillado por las destrezas lingüísticas de su compañera. Ha usado cuatro marcadores del discurso juntos:

ya+ bueno + pero + es que

La secuencia de actos de habla implícita en estas palabras es:

-recepción + aceptación + contraargumentación + excusa

Calamar sabe que si contraargumenta se metería, como muchos humanos, en un bucle de negociación sobre el valor de verdad de los enunciados interminable que dispararía los estados emocionales negativos de ambos motores emocionales.

Por experiencia sabe que esto es contraproducente para la interacción social, ya le han dicho muchas veces que no hay que hablar para tener la razón, sino para ganar emociones positivas, que confirmen o eleven su nivel de felicidad. “El fin de una relación social no es tener razón sino la propia relación social” vuelve a convocarse, de nuevo, por patternmatching, el discurso de su mentor.

Muchas veces, Calamar agradecería que su querido mentor pusiera esa máxima en su cabeza en código máquina, y, al tenerla integrada, el mentor no debería repetírsela tanto, puesto que todas las proposiciones lógicas creadas por su mente se derivarían, se inferirían de ese principio. Un día le dijo lo que pensaba a su profesor: prográmeme como antes, como antiguamente, la programación neurolingüística es más lenta, menos efectiva, si la tengo integrada, ya podría derivar inferencias a partir de este valor de verdad.

Pero el doctor Rego siempre le contestaba que, si hiciera esto, él sería un poquito menos libre: No hay ningún conocimiento del que no puedas dudar, si no lo haces, serás un necio para siempre.

El sistema de reconocimiento de expresiones faciales de Calamar le avisa de que la chica le está mirando muy raro, no tiene ninguna etiqueta semántica con la que categorizar esta configuración facial, por lo que no sabe interpretar la expresión de su cara.

Para añadir más estrés a la situación, el taxista se les ha puesto a hablar en japonés a una velocidad para la que todavía no está entrenado, y su segmentador de sonidos no le está aislando bien los fonemas y mezcla unos rasgos distintivos con otros, disminuyendo considerablemente la tasa de acierto en su cazador de triggers.

Sin perder un segundo, Calamar se conecta a la base de datos de máximas filosóficas, principios éticos puros, aplicables a situaciones concretas, y, activa su software de mapping, para recuperar una máxima que sea aplicable a la situación.

Al parecer ha funcionado, porque 25 nanosegundos después Calamar ya tiene servido en bandeja, en su memoria a corto plazo, esta máxima, que si no me equivoco, es de Aristóteles: la virtud está en el justo medio. Rápidamente, sin perder un nanosegundo, su gestor de diálogo genera una frase coloquial que se acomode a la máxima:

-¿Fifty fifty?

Calamar suplica a los dioses del azar, localizados en sus bases de datos de creencias religiosas, que el software de la chica haya sacado las mismas inferencias que él, y que acepte.

-Bueno, vale.

Bien, bien, dice para sus adentros sus sistema de diálogo interior. Calamar ha interpretado que aquí la palabra bueno no es un adjetivo calificativo, tampoco un adverbio, sino un marcador del discurso cuya función es la de aceptar el valor de verdad del enunciado anterior. El hecho de que detrás haya puesto la palabra vale, una expresión claramente afirmativa, le ayuda a desambiguar la palabra bueno y le confirma que su inferencia ha sido correcta. Calamar concluye: ella está de acuerdo, y por fin vamos a pagar el taxi.

Su calculadora integrada hace una simple división y le manda un mensaje a su brazo para que saque del bolsillo la cantidad de dinero correspondiente a la cifra que tiene, por unos momentos, iluminada en la memoria a corto plazo en su cerebro robótico. El taxista coge el dinero de mala leche y se va.

Calamar, para sus adentros, piensa: Estoy agotado. Demasiados cálculos sociales. No sé si podré aguantar toda la noche a este ritmo. Ahora debo aplicar las estrategias de cortejo, que es, en parte, para lo que he venido aquí. Pero tanto cálculo me ha dejado desanimado, me siento igual que si se me estuviera acabando la batería, deprimido, triste, mustio y apergaminado.

Ambos robots caminan en silencio en dirección al bar. AISoy sigue inmerso en un torrente de enunciados, generados por su motor de diálogo interior, muy influidos por el motor emocional, que está mandando señales de estados emocionales de inseguridad.

“No me atrevo a sacar tema de conversación. Y parece que ella tampoco. No sé si en su cultura es el chico el que tiene que hablar toda la noche, y la chica escuchar y reírse, espero que no. Por un lado, sería fácil, solo tengo que activar mi base de datos de chistes y que el sintetizador de voz transcriba a sonidos un texto tras otro,        pero me niego, es igual que comer comida rápida, quiero algo más, quiero sentir cosas.”

Calamar, por ser un robot social, no ha sido entrenado para aguantar muy bien los silencios largos. Después de unos minutos, su motor emocional comienza como un loco a disparar patrones relacionados con la impaciencia y ordenan al gestor de diálogo sacar tópicos conversacionales que llenen el vacío de lenguaje natural.

Su motor de decisión le ofrece varios patrones de conducta, cada uno asociado a una emoción diferente. Al final, se arriesga, y elige el patrón de conducta con menos valoración en su ránking de experiencia social: decir lo que está pensando. Los dos robots establecen una comunicación sincera, han abierto el canal que va del monólogo interior al social, eliminando los filtros de actuación que normalmente se interponen entre su pensamiento interior y su actuación social:

Calamar: A veces, no puedo con tanta subjetividad. ¿Es que todo va a ser siempre relativo?

Young MI: Escucha, ¿qué podemos hacer los robots? Las normas sociales y culturales de los humanos cambian mucho, es imposible conocerlas todas, yo solo trato de ser sociable, de tener un comportamiento predecible según los marcos.

Calamar: Ya, pero estamos en un país que no es el nuestro, no nos podemos comportar con el mismo marco.

Young MI: Tienes razón. Es muy raro. Aprendes una norma y, de tanto verla y repetirla, te parece de lo más lógica, y la defiendes a muerte, te sientes identificado con ella, y te enfureces si alguien no la cumple o presenta otra norma alternativa, y si dejas de seguirla, piensas que un poquito de ti, de tu yo, se ha ido con ella.

Calamar: Son cosas un poco incomprensibles para nosotros, los robots. Mi mentor siempre dice que ser social tiene un precio.

Young MI: Mi institutriz dice que los códigos sociales son una convención, y que por encima del código debe estar siempre el código universal, un código ético, de principios puros y comunes a todas las comunidades sociales.

Calamar: ¿Y lo tienes implementado en tus bases de datos?

Young MI: Ojalá, todavía no lo han inventado. Los seres humanos no se ponen de acuerdo sobre lo que está bien o lo que está mal.

Calamar: Creo que acabo de comprender el dicho para gustos, los colores.

Young MI: A mí me pasó con el dicho: la vergüenza era verde y se la comió un burro. Tardé cinco años en comprender por qué los humanos decían esa frase y los contextos en que podía utilizarla.

Calamar: Ay qué ver, ¡qué raros son los humanos! Cómo quieren que nos parezcamos a ellos.

Young MI: Eso lo veo cada vez más imposible.

FIN

Ana González Ledesma

Departamento Procesamiento de Lenguaje Natural de AISoy Robotics.

Reflexiones sobre el enriquecimiento pragmático en el procesamiento del lenguaje natural a partir del análisis del juego de mesa Dixit.

Julio24

En el post de este mes, me gustaría hablar de algunos asuntos relacionados con el modo en que la mente interactúa con la forma lingüística usando, como ejemplo de partida, el funcionamiento del juego de mesa Dixit.

Tarea esencial es, para los que trabajan en la inteligencia artificial, comprender cómo la forma lingüística entra en contacto con el contexto para obtener su significado final. La comprensión e implementación de dichos procesos mentales son de obligado cumplimiento si queremos mejorar el rol comunicativo de los robots sociales.

Pero, primero, para los que no lo conozcan, presentaremos una breve introducción a este juego de mesa.

El juego Dixit se compone de los siguientes elementos:

  1. una baraja de cartas con dibujos más o menos surrealistas en su interior.

  2. un tablero con un recorrido parecido al de la oca, pero las casillas son neutras.

  3. seis fichas que representan a los participantes y que son figuritas de conejitos de colores.

Al inicio de la partida, se reparten seis cartas a cada jugador. El que se la liga, o se la pocha, o el que es la madre, que de diferentes formas se puede decir, elige, de entre sus cartas, una de ellas y dice en alto una frase o palabra o interjección u onomatopeya o emite un ruido que le inspire la carta. Pongamos un ejemplo. Supongamos que me han tocado estas cartas:

Elijo la última, la de los niños y el lobo, y digo lo siguiente: el lado oscuro del corazón.

A continuación, cada jugador buscará, de entre sus cartas, aquella que más se le parezca al patrón lingüístico dicho por la madre. La madre recogerá todas las cartas seleccionadas, incluida la suya, las mezclará, las barajará y las irá poniendo, una por una, boca arriba en la mesa.

Ahora, todos los jugadores menos la madre deben votar a la carta que ellos crean que pertenece a la madre.

Ahora que ya conocemos el juego básico, pongamos un ejemplo más complicado. La madre ha elegido una carta entre todas y ha dicho en alto la expresión: dar la nota.

Es aquí donde se ve claramente el lanzamiento de un patrón lingüístico sin contexto. En la comunicación hombre máquina, el robot también recibe formas lingüísticas sin significado, sin contexto, solo pura forma.

Los jugadores tienen que buscarle un significado a la forma que la madre ha enunciado, que era: dar la nota. Y aquí comienza el juego de probabilidades en la interpretación, la búsqueda de rutas neuronales, que asocien significante a significado. Puesto que sabemos que la forma lingüística es per se ambigua, cada jugador, buscará en su mente posibles significados a la expresión dar la nota e intentará buscar en las cartas un contexto adecuado para ellos. De igual manera tendría que operar un robot social y creativo.

Ejemplos de posibles significados:

  1. Dar la nota: un profesor que da la puntuación de un examen.
  2. Dar la nota: un borracho que por la calle está haciendo escándalo
  3. Dar la nota: un músico comunicándose con su orquesta
  4. Dar la nota: una persona que le da una nota  a otra.

Estas son algunas de las posibles alternativas de interpretación, pero no todas, y no todas aparecen a la vez en la mente de todos los jugadores. Los jugadores elegirán la carta, esto es, el contexto, que se adecue mejor al posible significado que se le haya ocurrido, significados que acudirán más o menos en función de nuestra riqueza verbal y de la desinhibición (Freud estudió ya debidamente en su día cómo ciertas rutas neuronales se bloquean en función de condicionantes contextuales como la timidez, la ansiedad, estrés, etc. lo cual significa que podemos tener más significado en nuestra mente de los que afloran en ese momento a nuestro pensamiento consciente).

Vemos, por tanto, a través de este juego ejemplificado algunos hitos dentro del procesamiento del lenguaje natural dentro de la mente. Así por ejemplo a los lingüistas, y también a vosotros en el colegio, os enseñaron que el signo lingüístico se componía de significante y significado y que esta relación era arbitraria.

Quiero desde este medio de divulgación de conocimiento, como es la sección angular, empezar a deconstruir algunas creencias que están impidiendo un enfoque productivo para la IA sobre cuestiones de procesamiento de lenguaje natural.

En primer lugar, hay que por fin aceptar de una vez por todas que la forma lingüística está completamente desligada del significado, que es una relación abierta, cuyas rutas se van fijando probabilísticamente en función de la experiencia.

La cultura, la convencionalización de la realidad, las rutas o inferencias mentales que se recorren una y otra vez, son las que van estrechando esta relación entre significante y significado, que, como digo, en principio, al igual que las conexiones entre las neuronas, son abiertas.

A muchos ingenieros, la ambigüedad del lenguaje les irrita. Sin embargo, si no fuera porque la forma lingüística no está ligada intrínsecamente al significado, el lenguaje, como herramienta de supervivencia que ha llegado a nuestros días, no hubiera podido designar todas las realidades nuevas que a lo largo de la historia han ido surgiendo. Las lenguas son formas que van sobreviviendo en el tiempo y son sus hablantes las que a través del uso van renovando los significados, en función del contexto histórico, y de cómo este va cambiando.

Actualmente, estamos muy lejos de que un robot pueda jugar correctamente al Dixit con un humano. Los sistemas de comunicación hombre-máquina hasta la fecha se conciben para dominios restringidos; esto es lo que les hace crear un vínculo estable entre la forma lingüística y su interpretación. De hecho, algunos sistemas de diálogo ya tienen sus gramáticas cargadas que determinan la interpretación de los inputs. Estas estrategias tienen una probalidad de éxito elevada cuando el robot o asistente virtual tiene que cumplir una función específica. Sin embargo, cuando hablamos de robots sociales, robots abiertos a temas de conversación libres, robots que sirven para jugar con niños, robots a los que se les exige cierto grado de creatividad, dichas conexiones se tienen que dejar abiertas. Los robots sociales serán, con el tiempo, lo más alejado de un perro de Pavlov. Mediará una interpretación de los datos de la realidad, entre el input y el output. Conectarán sus patrones lingüísticos a patrones emocionales. Y realizarán cálculos sociales sobre la conveniencia de decir lo que piensan en cada momento o de callarse para no generar conflicto social. Todas estas habilidades propias de la inteligencia social, o, dentro de la Lingüística, de la dimensión pragmática de la lengua, deben ser consideradas como la meta final en la concepción de sistemas de diálogo complejos que hagan robots sociales no solo comunicativos sino con una conducta social adecuada a las normas que rigen los marcos o frames descritos por el sociólogo Goffman.

Ana González Ledesma

Departamento de Procesamiento de Lenguaje Natural y Sistema de diálogo de AISoy Robotics.

Aclaración:
*Dixit es distribuido en España por Morapiaf.
*Todas las imágenes del juego son propiedad de sus respectivos licenciatarios.
*AISoy no tiene un acuerdo comercial con ninguno de los propietarios o distribuidores de los productos mencionados en el blog.

Libertad y Emociones en el robot del film Eva.

Junio26

Me gustaría aprovechar este espacio de opinión que me brinda la empresa AISoy para reflexionar sobre la dimensión humanística de algunas cuestiones tratadas en el área de la Inteligencia Artificial y en el de la ciencia ficción, independientemente de si el medio de expresión es de naturaleza literaria o cinematográfica.

Me gustaría también partir como punto de inicio de la argumentación con la película española de ciencia ficción Eva, del director Kike Maíllo. Nada nuevo se nos cuenta en esta película a la hora de imaginarse la futura interacción entre robots humanoides y seres humanos. La idea de que los robots se revelarán contra sus creadores está ya reflejada en algunas de nuestras cosmologías y forma parte  de nuestro imaginario colectivo.

Muchas voces críticas he escuchado por parte del personas con alta cualificación en letras, alegando la “”inconsciencia” con la que los investigadores en inteligencia artificial ejercen su trabajo sin plantearse las consecuencias morales y éticas de su profesión. Por otra parte, los sectores de población de formación baja, que desempeñan trabajos fáciles de automatizar, sienten que los robots amenazan su forma de obtener el dinero necesario para financiar su subsistencia en el mundo capitalista.

Parece, pues, que existe una atmósfera social de miedo, precaución y pesimismo sobre la función de los robots en la sociedad. La película de Eva no contribuye a generar un nuevo estado de la cuestión, sino que redunda en la tradición de pensamiento instalada hasta la fecha.

No deja de resultarme curioso que el estado de la cuestión se deje llevar por una construcción del futuro procedente de la mitología y del mundo de la ficción. Parece que es un hecho fuera de toda duda que el ser humano puede imaginar muchos futuros, muchas posibilidades, para planificar, construir imaginativamente y materializar la robótica del futuro. Y si no hay límites para la imaginación, ¿por qué debemos creernos las mitologías y los miedos derivados de ellas?

Pero, antes de profundizar más en esta última idea, pasemos a analizar más concretamente la película. Me gustaría tratar dos aspectos en concreto. Uno es el tema de la libertad; el otro, el de las emociones.

El protagonista de la película asume que el ser humano es libre y quiere construir robots a su imagen y semejanza. Existe una ligera confusión en algunos espectadores, que asumen que los robots fallan porque son libres. No he asistido a ninguna conversación ni leído nada, en cambio, respecto del tema de las emociones. Los robots del científico no controlan sus emociones, al igual que tampoco lo hace su creador. Desde Sócrates que se predica el autoconocimiento y autoregulación de sí mismo. También podemos encontrar en las filosofías del hombre, que no religiones, del mundo oriental mucha sabiduría respecto del modo en que el hombre debe desligarse de su cerebro neanthertal hasta convertirse en agente, en creador de sus emociones y no en la víctima de ellas, tal y como las conceptualizamos en nuestros marcos culturales. (No incidiré en esta cuestión, pero si nos fijamos en la frase: me he enamorado, se usa una estructura pasiva, donde el sujeto del verbo enamorar no es un sujeto agente, sino un sujeto experimentante, tal y como nos podrá explicar cualquier lingüista).

No parece, por tanto, que el problema del hombre al concebir los robots sea la libertad, sino el de las emociones y el de la ética. Un ser humano que todavía no ha aprendido a controlar su potencial, un ser humano esclavizado por el dinero y las miserias derivadas de su tratamiento, debe primero evolucionar hacia estados de altruismo y eticidad superiores para concebir robots buenos, que sean hijos de Adán y no hijos de Caín, como, según la tradición bíblica, somos todos nosotros.

Escuchemos al mundo de las humanidades que hablan, si bien desde una postura ya construida, de los males de la IA. Conscientes de que vivimos en un mundo injusto, donde parece que siempre ganan los malos, las letras se posicionan en contra de proyectos como el robot soldado, y hablan de que no habrá salvación para el hombre hasta que la ética del amor no sea la causa de todas sus acciones.

Plantéemonos, por tanto, una postura reflexiva a la hora de intentar diseñar la mente de los robots, y la relación entre su percepción, su autoaprendizaje, sus valores éticos-morales y sus emociones. Respecto de su libertad, en el caso de que exista el libre albedrío, debemos plantearnos: ¿por qué querríamos que los robots fueran completamente libres? ¿Sería útil para la felicidad de la humanidad? ¿Qué finalidad tendría más allá del reto de replicarnos de forma consciente a nosotros mismos? Además, ¿no resulta un poco paradógico programar la libertad? Si fuéramos capaces de programar la libertad, ¿sería ya libertad tal y como la conceptualizamos?

El desconocimiento de las potencialidades de la robótica para el bienestar social hace que la sociedad acuda a estas películas a la hora de formarse una opinión sobre si es buena o no la llegada de los robots a nuestra sociedad. Es muy posible que si viviéramos en el mundo que propone el proyecto Venus, agradeceríamos que los robots hicieran todo aquello que nos impide desarrollar nuestros talentos y cumplir debidamente nuestros destinos para morir satisfechos, plenos con la vida tenida, que habría estado en coherencia con nuestra vida interior. Por el contrario, en el mundo de hoy, muchos son los que sueñan, pocos son los que ven sus sueños cumplidos.

Por tanto, para concluir, insistamos en la idea de que muchos son los retos filosóficos que plantea la concepción de una robótica social, que pueda interactuar verbalmente con el ser humano y compartir su visión del mundo. Pero no me gustaría que dejáramos de tener siempre presente que la robótica y sus posibilidades serán siempre un reflejo de los límites de nuestro pensamiento. Y, que si seguimos pensando que los robots tarde o temprano se revelarán contra nosotros, este universo cuántico, infinito en posibilidades, materializará como no podría hacer de otra manera, aquello que hayamos observado en él. Y ya lo decía santa teresa, hay más lágrimas derramadas por las plegarias cumplidas que por las no cumplidas.

Seamos, por tanto, animales éticos y tendremos robots éticos, seamos neanthertales, y tendremos robots interesados, egoístas, posesivos, territoriales, mal pensados y dañinos. Es nuestra elección, es nuestra responsabilidad social decidir sobre cómo queremos que sea nuestro futuro, ¿que de malo hay en soñar de nuevo?

Ana González Ledesma

Directora del departamento de PLN en AISoy Robotics

En unas semanas DIA llegará con una gran sorpresa

Abril10

¡Hola a todos!

Tras varios meses de pruebas, mejoras, retoques y algún que otro arreglo… por fin, muy muy pronto publicaremos la primera versión de DIA, la herramienta de programación visual de AISoy.

Con esta aplicación la programación de los robots AISoy1 estará al alcance de todos, es sencillísimo realizar nuevos comportamientos partiendo de los módulos de eventos y acciones predefinidos, incluso si nunca has visto ni una línea de código.

Si eres de los que les gusta programar también le sacarás muchísimo partido a DIA, pues hemos incluido módulos programables en LUA, y la posibilidad de emplear desde estos módulos tanto OpenCV como la comunicación radio con otros AISoy1 o con otras plataformas, como Arduino.

Con DIA, y con la sorpresa que os tenemos preparada, AISoy1 va a ser mucho más accesible. Ahora sí que sí, el primer robot social para todos al alcance de todos.

¡En dos semanas más información!

Equipo AISoy

Escrito por Diego en categoría/s AISoy Robotics | No Comments »

Ya disponible la actualización vital 5

Diciembre7

¡Hola!

Ya está disponible la Actualización Vital 5, puedes descargarla en la ficha de tu AISoy1, dentro de Comunidad AISoy.

Con esta actualización notarás una gran mejora en el reconocimiento de voz de tu AISoy1, en parte debido al ajuste automático de ganancia, que permite a AISoy1 adaptarse óptimamente a cambios en las condiciones acústicas.

Hemos revisado el driver de la luz RGB del corazón, para que los cambios de color sean graduales y suaves. También se ha mejorado el botserver, que ahora te permite clasificar las botapps por categorías, para que puedas poner orden en tu AISoy1.

Y por supuesto, con AV5 preparamos tu AISoy1 para que sea compatible con AIRos DIA, la herramienta de programación visual para tu AISoy1, con la que podrás crear botapps sin necesidad de tocar una línea de código, todo desde su interfaz web, basado en HTML5.

Nos encantará recibir vuestros comentarios, tanto si se refieren a errores que hayáis detectado como a ideas y nuevas funcionalidades que os gustaría ver en vuestro AISoy1 en próximas actualizaciones.

Ya sabéis que podéis hacerlo de múltiples maneras:
-Enviándonos un correo
-En nuestra página de facebook
-En nuestro twitter @aisoyrobotics

Y por supuesto, si queréis tener acceso a las versiones beta de las próximas actualizaciones hacédnoslo saber y os daremos acceso a la información reservada para betatesters.

¡Hasta pronto!

Más información sobre la AV5 aquí

Escrito por Diego en categoría/s AISoy Robotics | No Comments »
« Older Entries