Cómo Enseñar Humor Sobre Inteligencia Artificial

AI prueba el humor en YSEAS

Tenemos una larga historia de gritar a nuestras máquinas: autos que se descomponen, televisores que transmiten nuestros equipos fallidos. Pero ahora nuestras máquinas nos entienden. Y están respondiendo. Están desenterrando recetas para nosotros en la cocina, navegando en nuestros viajes en automóvil, terminando nuestras oraciones en los motores de búsqueda de Internet y traduciendo idiomas extranjeros.

Por eso tenemos que agradecer a la lingüística computacional, también conocida como procesamiento del lenguaje natural (PNL). Es uno de los focos de investigación de Dragomir Radev, profesor de Ciencias de la Computación A. Bartlett Giamatti. Es un área de estudio en la que se cruzan la informática, la lingüística y la inteligencia artificial, y se ha vuelto cada vez más prominente en nuestras vidas, desde Siri de Apple hasta el servicio al cliente automatizado.

En pocas palabras, la PNL es un medio de enseñar a las computadoras a comprender el lenguaje humano. Esto no es cosa fácil. El lenguaje humano es fluido; las palabras cambian con el tiempo o con el contexto. Tomemos, por ejemplo, la frase “en pocas palabras”. Podría significar “en pocas palabras” o “el grano comestible que se encuentra dentro de la envoltura dura de un tipo de fruta”. Distinguir estos dos significados muy diferentes nos resulta fácil, pero puede resultar confuso para una computadora. Los lenguajes naturales están diseñados para la mente humana; la redacción puede ser imprecisa y, aun así, el significado es claro. Con los lenguajes formales, por ejemplo, el código de computadora, todos los caracteres deben estar en orden o todo se sale de control. La PNL cierra esa brecha.

El trabajo de Radev emplea una serie de técnicas computacionales, incluidas las redes neuronales artificiales, también conocidas como aprendizaje profundo. Esencialmente, las computadoras aprenden a reconocer patrones complejos al ser alimentadas con grandes cantidades de datos. A las palabras, frases, sintaxis y reglas gramaticales se les asignan valores matemáticos. La idea no es nueva, pero se recuperó en las últimas dos décadas a medida que el almacenamiento de datos digitales y la capacidad de procesamiento de la computadora aumentaron drásticamente. Si usó Google Translate recientemente y notó un aumento en la velocidad y exactitud de los resultados, se debe a que la empresa cambió a un sistema de red neuronal.

Algunos argumentan que las computadoras no están realmente aprendiendo el lenguaje, ya que no lo están adquiriendo como lo hacen los humanos. Los niños pequeños aprenden a hablar no estudiando detenidamente colecciones masivas de textos, sino interactuando con el mundo que los rodea con los cinco sentidos. La diferencia no concierne a Radev.

“No afecta la forma en que investigamos porque no estamos tratando con humanos”, dijo. “La forma en que enseñamos el lenguaje a las computadoras no tiene que ser la misma forma en que los humanos entienden el lenguaje. Cuando construyes un avión, no dices ‘Los pájaros baten sus alas, construyamos aviones que baten sus alas’. No es así como se hace, al menos no en la práctica. Solo queremos que vuelen, ya sea que sus alas se muevan o no “.

Como una indicación del nivel de interés en estos temas, 132 estudiantes se inscribieron en el curso de PNL de Radev el semestre pasado. Anteriormente, enseñó PNL a más de 10,000 estudiantes en un curso en línea abierto masivo (MOOC). Este otoño, imparte un curso sobre inteligencia artificial, el estudio de enseñar a las computadoras a realizar tareas que se considerarían inteligentes cuando los humanos las hacen. El curso cubre lógica, aprendizaje y razonamiento. Incluye tareas desafiantes que les piden a los estudiantes que construyan sistemas que puedan jugar juegos de dos jugadores como Othello y Go, resolver laberintos, simular la conducción autónoma de un automóvil, traducir textos usando redes neuronales y aprender de la interacción con el entorno. Esta es ahora la clase más grande en el departamento de Ciencias de la Computación, con más de 200 estudiantes matriculados este semestre.

Con otro proyecto, AAN (Todo sobre la PNL), Radev también está ayudando a los interesados ​​en la PNL a navegar a través del creciente cuerpo de investigación sobre el tema. Él y sus estudiantes del laboratorio LILY (Lenguaje, información y aprendizaje en Yale) han recopilado más de 25,000 artículos y más de 3,000 tutoriales, encuestas, presentaciones, bibliotecas de códigos y conferencias sobre PNL y lingüística computacional. El objetivo final es utilizar la PNL para generar automáticamente recursos educativos para quienes la buscan y orientarlos en la dirección correcta. Incluye resúmenes de un solo artículo, descripciones de algoritmos de múltiples fuentes, encuestas de temas de investigación y recomendaciones de usuarios para recursos didácticos.

Enseñar el humor a las computadoras

Las computadoras pueden descubrir cómo se formaron las galaxias, examinar cantidades inimaginables de datos y calcular un número primo de más de 17 millones de dígitos. ¿Pero pueden contar un chiste? Probablemente no por un tiempo, dijo Radev, pero todavía lo va a intentar.

Como parte de un proyecto en curso, Radev ha estado trabajando con Robert Mankoff, el editor de dibujos animados recientemente retirado del New Yorker. Específicamente, se han centrado en el concurso de subtítulos semanal de la revista en el que los lectores envían subtítulos a la ilustración de un dibujante. La leyenda juzgó las victorias más divertidas.

Enseñar el humor a las computadoras

Radev está trabajando con el New Yorker para destilar las miles de presentaciones que recibe para su concurso semanal de subtítulos. Cortesía del New Yorker.

La revista recibe miles de presentaciones cada semana de posibles dibujantes. Los editores luego los reducen a tres finalistas, para ser juzgados por los lectores de New Yorker. Es un proceso arduo que quizás podría simplificarse con la ayuda de la PNL. Radev explica que cada concurso inspira múltiples presentaciones basadas en la misma idea. Una ilustración, por ejemplo, podría inspirar muchas presentaciones con un juego de palabras similar con respecto a un caballo parado en un bar. Mientras tanto, un ganso sirviendo al caballo en la misma imagen engendra una serie diferente de bromas estrechamente relacionadas.

Radev, Mankoff y colaboradores de Universidad de Colombia y Yahoo Labs han diseñado un programa que intenta identificar temas en los subtítulos enviados.

“El propósito es que los editores no tengan que leer 5.000 presentaciones cada semana”, dijo Radev. “Si 100 son todos la misma broma, podrían leer solo uno o dos. Si la idea básica es divertida, entonces pueden profundizar y elegir algunas específicas. Si no es gracioso, simplemente pueden omitir todo el grupo “.

Partiendo de eso, hay un proyecto en el que las computadoras generarían sus propios subtítulos divertidos. Uno de los primeros obstáculos que encontraron fue que, si bien las computadoras se han vuelto muy buenas para seleccionar objetos en las fotos, las ilustraciones aún les causan muchos problemas. Para evitar eso, él y sus alumnos describieron las imágenes de unas 500 caricaturas en un idioma que el programa puede reconocer.

“Ahora, podría ser mucho más fácil inventar nuevos chistes mirando las descripciones de los dibujos animados y las presentaciones ya hechas, porque ese es un buen punto de partida”, dijo. “Podríamos combinar dos subtítulos en uno o modificar un subtítulo existente agregando algunas palabras para que suene más divertido”.

Es un desafío particularmente complicado. Hasta ahora, las computadoras han superado a los humanos en el ajedrez, el antiguo juego de Go, e incluso el programa de trivia Jeopardy. Pero el humor es un rasgo exclusivamente humano y Radev no espera que el resultado deje sin trabajo a ningún dibujante en el corto plazo (ni, de hecho, cree que los traductores automáticos reemplazarán a sus contrapartes humanas). “Puede que funcione o no, pero será muy interesante poder ver si una computadora puede entender los dibujos animados neoyorquinos y captar los chistes”, dijo.

Radev está interesado en lo que se conoce como creatividad computacional. Es lo que permitiría que programas como Watson, Siri y Alexa no solo brinden respuestas correctas, sino que incluso muestren un poco de personalidad. Ya hay intentos de hacer que nuestros dispositivos sean un poco más amables. Siri, por ejemplo, de vez en cuando da un suave sarcasmo: P: “Siri, ¿cuál es el significado de la vida?” R: “42” (una referencia al libro clásico “La guía del autoestopista galáctico”).

“Pero en realidad no tiene sentido del humor, está preprogramado por los humanos”, dijo Radev. “Sería interesante en el futuro idear sistemas que realmente puedan comprender y generar texto divertido”.

Entrenamiento de la próxima generación de lingüistas computacionales

Radev, quien creció en Bulgaria, habla varios idiomas con fluidez. “Me gusta lo similares, pero lo diferentes que son los idiomas”, dijo. “Y el hecho de que hay reglas, pero las reglas no son estrictas, lo que lo hace más interesante. No me gustan las matemáticas puras porque las cosas son demasiado estrictas. Los idiomas están en algún lugar justo en el medio “.

En 2006, Radev cofundó la Olimpiada de Lingüística Computacional de América del Norte (NACLO), una competencia anual que reúne a estudiantes de secundaria y preparatoria de todo Estados Unidos. Además de identificar a los estudiantes con talento en lingüística, también los introduce en el campo de la lingüística computacional. .

NACLO ha tenido más de 20.000 estudiantes participantes. A diferencia de muchos otros eventos de la escuela secundaria relacionados con la informática, casi el 50% de los participantes en NACLO son mujeres. Los mejores finalistas pasan a competir en la Olimpiada Internacional de Lingüística. El NACLO de este año (alojado en 200 sitios en todo Estados Unidos, incluida Yale) envió a ocho participantes a la competencia internacional en Dublín en agosto.

A los participantes de NACLO se les da una serie de problemas extraídos de una variedad de idiomas para resolver, generalmente involucrando traducción. Algunos piden métodos lingüísticos tradicionales y otros piden computación para llegar a las soluciones. La lógica y el razonamiento son las únicas habilidades que necesitan los concursantes. Radev dijo que él y los otros organizadores reconocen que la lingüística rara vez se enseña en las escuelas secundarias, por lo que los problemas están configurados de manera que no se requieren conocimientos previos de idiomas o lingüística en particular.

Los problemas a menudo se basan en lenguajes relativamente oscuros. Por ejemplo, un conjunto de oraciones podría estar escrito en taa, hablado por unas 2.600 personas en Botswana y Namibia, cada una seguida de una traducción al inglés. Con base en los patrones que pudieron deducir de estas oraciones, los estudiantes deben traducir el siguiente conjunto de oraciones Taa sin ninguna traducción al inglés.

“Usamos gráficos para que sea más fácil de entender para los estudiantes de secundaria”, dijo Radev, quien en 2015 fue nombrado miembro de la Asociación de Maquinaria de Computación, uno de los más altos honores en ciencias de la computación. “‘Esta es la presentación semántica de esta palabra, esta palabra, esa palabra’, y luego tienes que averiguar cómo funciona este método y traducir algunas palabras adicionales en esas presentaciones”.

Entrenamiento de la próxima generación de lingüistas computacionales

Eliminando ambigüedades de la palabra “astro” como pista de un crucigrama.

Tom McCoy, quien se graduó de Yale este año con una especialización en lingüística, comenzó a competir en NACLO cuando era un estudiante de secundaria que vivía en Pittsburgh. No sabía nada de lingüística computacional en ese momento, pero le gustaban los acertijos y descifrar códigos, y su hermana sugirió que probara la competencia. Radev fue uno de sus entrenadores.

“Fue realmente genial”, dijo McCoy. “Creo que la mejor frase para describirlo es ‘una fuerza de la naturaleza’. Simplemente hace tantas cosas y las hace todas muy bien. Es un profesor / investigador muy activo, pero también se las arregla para dedicar mucho tiempo a la Olimpiada ”.

McCoy se comprometió a estudiar biología antes de unirse a NACLO, lo que lo envió a un curso diferente. Este otoño, ingresó al prestigioso Ph.D. programa en ciencias cognitivas en Johns Hopkins con un enfoque en lingüística computacional.

Radev reclutó estudiantes para su laboratorio LILY poco después de llegar a Yale en enero de 2017. Rápidamente reunió a un equipo de estudiantes de Yale para trabajar en un sistema de red neuronal para resumir conjuntos de artículos de noticias relacionados. El artículo resultante, cuyo primer autor es Michihiro Yasunaga, YC’19, fue aceptado para su presentación en la prestigiosa Conferencia sobre Aprendizaje Computacional del Lenguaje Natural en Vancouver en agosto. El laboratorio LILY (laboratorio de lenguaje, información y aprendizaje en Yale), dirigido por Radev, ahora incluye a seis estudiantes de doctorado y más de una docena de estudiantes universitarios de Yale. El equipo de LILY está trabajando en una serie de nuevos artículos sobre generación de encuestas, comprensión de documentos médicos, recuperación de información en varios idiomas y sistemas de diálogo.

Colaboraciones

La PNL es un campo de estudio que se presta bien a colaboraciones interdisciplinarias, y Radev no ha perdido el tiempo. Incluso antes de llegar a Yale en enero, Radev estuvo en contacto con varios miembros de la facultad de otros campos para entablar colaboraciones, incluidos los de la escuela de medicina, las humanidades y los programas de ciencias sociales.

“Hay una conciencia general ahora de que el procesamiento del lenguaje natural y estas otras herramientas pueden ser útiles para esos otros campos”, dijo. “Hace diez años, muchas personas de otros campos ni siquiera sabían que se podía hacer este tipo de trabajo. Si colaboramos con personas en ciencias políticas o medicina, obtienen algo de eso porque ahora pueden analizar datos de una manera que antes no podían. Y la gente de ciencias de la computación saca algo de eso con interesantes conjuntos de datos con los que trabajar para sus teorías “.

Los científicos políticos podrían utilizar la tecnología, por ejemplo, para analizar el discurso y los textos de los funcionarios electos. Un análisis objetivo de las estrategias y la retórica en un debate, por ejemplo, podría ayudar a discernir si un candidato apela al nacionalismo o las preocupaciones sobre la economía. ¿Con qué frecuencia se usaron los insultos como táctica de debate? Lincoln Swaine-Moore, uno de los estudiantes de Radev, analizó las conexiones del semestre pasado entre el discurso de los funcionarios y los contribuyentes a sus campañas.

“Por ejemplo, si un senador obtiene una cierta cantidad de fondos de la industria farmacéutica, ¿eso significa que hablará más sobre cuestiones farmacéuticas en sus discursos?”

Los campos de la salud y la medicina también se beneficiarán enormemente del procesamiento del lenguaje natural.

“Otra posibilidad es ver si hay algún sesgo en las cartas de recomendación a las escuelas de medicina”, dijo. “Hay estudios que muestran que las mujeres que se postulan para ciertos trabajos son tratadas de manera diferente. Las personas los interrumpen con más frecuencia o perciben un determinado rasgo de la persona de manera negativa; podrían usar la palabra ‘fogoso’, mientras que un hombre sería descrito con una palabra más suave “.

También ha hablado con el profesor de la Facultad de Medicina de Yale, Harlan Krumholz, sobre posibles colaboraciones. Krumholz, profesor de medicina Harold H. Hines Jr., director del Proyecto de Acceso a Datos Abiertos de Yale y codirector de la facultad del Centro de Investigación en Computación de Yale, dijo que las notas de las enfermeras, los informes de radiología y tantos otros documentos han creado una montaña de datos no estructurados en medicina. La experiencia de Radev podría ayudar a darle sentido a todo. Como ejemplo, señala formas que obligan a los pacientes a calificar sus síntomas en una escala del 1 al 5.

“Les damos cinco opciones, pero la verdad es que tienen que contarme una historia para que yo entienda cómo se sienten”, dijo Krumholz. “El santo grial es descubrir cómo tomar los datos en gran medida indisciplinados que existen en todas partes en la medicina y convertirlos en algo que pueda generar nuevos conocimientos y perspectivas y una mejor atención”.

Hacer eso significa alejarse de un sistema que requiere que las personas hablen y piensen como computadoras. En cambio, dijo, necesitamos computadoras para obtener información de la forma en que las personas se comunican naturalmente. Es una ambición que, no hace mucho, podría haber parecido inalcanzable. Con el trabajo de personas como Radev, está comenzando a suceder.

“Por eso pensé de inmediato que sería una gran incorporación aquí, y por eso busqué formas de trabajar con él”, dijo Krumholz. “Es una adición espectacular a nuestra facultad y nos brinda más experiencia de clase mundial. Cuando alguien así llega al campus, inmediatamente se siente atraído por tratar de ver si hay oportunidades de colaboración “.

Añadir un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *