Módulo D

SUBMITTED BY BBOTELLA ON MON, 11/12/2018 – 12:00

Generación de lenguaje universal para una sociedad IIA 

El objetivo de este módulo es la generación automática de lenguaje teniendo en cuenta los criterios definidos en el módulo B respecto al lenguaje IIA (igualitario, inclusivo y accesible), así como las reglas de corrección y transformación definidas en el módulo C. A continuación, se definen las tareas necesarias para alcanzar este objetivo que utilizarán las herramientas y recursos obtenidos como resultado del módulo A.

Tarea D.1. Definición de accesibilidad en términos de adaptación del contenido del texto inclusivo e igualitario al perfil de usuario/a

En esta tarea se analizarán y valorarán distintas estrategias basadas en las TLH para hacer más accesible el contenido de un texto igualitario e inclusivo según un determinado perfil de usuario/a. En este sentido, la accesibilidad en términos de adaptación del contenido de un texto tendrá como objetivo facilitar la comprensión del mismo, ya sea mediante el uso de técnicas de simplificación del lenguaje, técnicas de enriquecimiento del texto, o bien técnicas de resumen automático. En todas estas técnicas, se analizarán los posibles obstáculos léxicos (p.ej., palabras largas), sintácticos (p.ej. frases subordinadas) y/o semánticos (p.ej. vocabulario complejo y especializado) para que una vez, detectados estos obstáculos y dependiendo de la técnica de accesibilidad del contenido por la que se opte, se proceda a: i) la eliminación de los obstáculos y/o sustitución por vocabulario o estructuras alternativas equivalentes, en el caso de simplificación; ii) apoyar la comprensión del texto mediante definiciones explicativas o imágenes de los conceptos, para el caso de enriquecimiento; o iii) reducir el contenido y tamaño del texto proporcionando solamente las ideas más relevantes, para el caso del resumen automático, de tal manera que la persona usuaria no invierta un tiempo excesivo en la lectura y comprensión del mismo. Esta última estrategia se podría combinar a su vez con técnicas de simplificación y/o enriquecimiento para evitar la aparición de obstáculos en el resumen generado.

Tarea D.2. Definición de accesibilidad en términos de adaptación de la presentación del texto inclusivo e igualitario al perfil de usuario/a

En esta tarea se definirán los criterios necesarios que permitan lograr la accesibilidad de un texto respecto a la forma de presentarlo. Dependiendo del perfil de usuario/a, se podrán guardar unas preferencias para poder visualizar el texto de una u otra manera, así como poder escucharlo. Para ello, se utilizará e integrará información multimodal, a través de herramientas que permitan representar un texto en formato visual (p. ej. mediante nubes de palabras o conceptos; de forma esquemática) o proporcionen la lectura en voz alta del mismo por parte del sistema (p. ej. para que una persona con problemas de visión pueda acceder al texto) (García Muñoz, 2014). Así mismo, se aplicarán reglas de lectura fácil para el diseño y maquetación de los textos (paginación, composición del texto, tamaño de las imágenes), la composición de los textos más adecuada para la comprensión lectora (líneas, diagramación, listas, etc.) o reglas de redacción (signos de puntuación, números y fechas, etc.). Se podrán generar de manera automática los diferentes textos personalizados para cada perfil de usuario/a por medio de APIs de servicios web. Estos servicios se podrán generar de manera previa para cada perfil definido o se crearán en el momento necesario bajo demanda, en el caso que se quiera generar un texto accesible en función de diversos requisitos y características de las personas usuarias, pudiendo integrar de este modo elementos de diferentes perfiles.

Tarea D.3: Análisis, definición y desarrollo de técnicas automáticas de generación de lenguaje que tengan en cuenta aspectos inclusivos e igualitarios y accesibles

A partir de los modelos de lenguaje obtenidos en el módulo B, se analizarán técnicas híbridas que combinen conocimiento estadístico/probabilístico y aprendizaje automático con heurísticas para la generación automática del lenguaje (GLN). Tradicionalmente, el proceso de generación de lenguaje se ha abordado desde una perspectiva que se compone de tres grandes etapas: planificación del documento (también conocida como macroplanificación), microplanificación y realización lingüística (Reiter & Dale, 2000). En la fase de macroplanificación, el sistema debe decidir qué información debe incluirse en el texto y cómo organizarlo en una estructura coherente, dando lugar a un plan de documento/texto. A partir de este plan de documento, en la etapa de microplanificación, se generará un plan discursivo, donde se decidirán las palabras y expresiones referenciales apropiadas para construir las oraciones (p.ej. uso de pronombres u otro tipo de elementos anafóricos). Finalmente, la etapa de realización lingüística genera el texto final con la información y la estructura seleccionadas. En este proyecto, se tendrá en cuenta el proceso clásico de generación, pero integrando en las etapas pertinentes los criterios para conseguir que el texto final sea igualitario, inclusivo y accesible (lenguaje IIA). Los modelos obtenidos en el módulo B, junto con las reglas de corrección y transformación derivadas del módulo C servirán para entrenar sistemas automáticos que puedan aprender a generar un lenguaje inclusivo e igualitario, mientras que los resultados de las tareas D.1 y D.2 proporcionarán los mecanismos necesarios para lograr que el texto generado sea a su vez, accesible. Para llevar a cabo esta tarea, las etapas de macroplanificación, microplanificación y realización lingüística se abordarán bajo un único enfoque integrado, tomando como punto de partida los enfoques propuestos en Duma & Klein (2013) y Konstas & Lapata (2013), puesto que han demostrado con éxito el uso de algoritmos de aprendizaje tradicionales para integrar las tres etapas mencionadas anteriormente. Además, como resultado de esta tarea, se obtendrán unas guías que sirvan para saber en qué casos se debe transformar el lenguaje para lograr que éste sea igualitario, inclusivo y accesible, y por tanto, que puedan ser utilizadas en acciones formativas y de concienciación social sobre la igualdad, inclusividad y accesibilidad.

Tarea D.4. Desarrollo de prototipos

Utilizando como base los métodos y enfoques propuestos en la tarea D.3., junto con el conocimiento obtenidos del resto de tareas, así como de los módulos anteriores, en esta tarea se definirán, diseñarán e implementarán distintos prototipos para demostrar la validez y utilidad de los resultados intermedios y/o finales obtenidos en el proyecto.