Procesamiento de lenguaje natural. Del Análisis de Textos a la Seguridad Digital 

 El lenguaje natural es aquel que usamos para comunicarnos entre nosotros en cualquier contexto. Si alguna vez has hablado con alguien, entonces lo has empleado. Pero entonces, ¿existe un lenguaje no natural? Sí, porque necesitamos de un tipo de lenguaje para poder comunicarnos con las máquinas. Un ejemplo de ello son los lenguajes de programación, los cuales poseen reglas y estructuras bien definidas, éstos se conocen como lenguajes artificiales.

“El lenguaje natural es el medio de comunicación entre los humanos se produce de manera espontánea. Cuando hablamos, procesamos el sonido y procesamos los textos de forma intuitiva, sin embargo, esto no sucede igual con las computadoras”, explica la doctora Helena Monserrat Gómez Adorno, del Departamento Ingeniería de Sistemas Computacionales y Automatización, cuyas líneas de investigación se basan en el Procesamiento de Lenguaje Natural (PLN) usando Inteligencia Artificial (IA) como herramienta de análisis.

De acuerdo con la doctora Gómez Adorno, el lenguaje natural cambia cuando se combina con recursos multimedia como videos o imágenes. Un ejemplo claro son los memes, que integran imagen y texto. Dado que su investigación se enfoca exclusivamente en el lenguaje natural, su análisis queda fuera de su área de estudio. No obstante, explica que existen modelos conocidos como multimodales capaces de procesar texto e imagen simultáneamente, imitando la manera en la que el cerebro comprende y responde a este tipo de contenido.

El trabajo de la investigadora abarca tres principales áreas: el análisis de comentarios en redes sociales, la evaluación de expedientes y notas clínicas, y el estudio de estilos de escritura. En particular se enfoca en el desarrollo de algoritmos, con el fin de llevar a cabo sus estudios.

Cada autor es un estilo

Desde sus estudios de maestría, la doctora Gómez Adorno ha trabajado en la identificación de patrones estilísticos. Así como cada persona tiene una forma única de hablar y expresarse, también cuenta con su propio estilo al escribir. Esto hace posible encontrar ciertos patrones que delatan quién es el autor de un texto.

Este análisis de patrones estilísticos puede ser una herramienta clave en la identificación de plagio, sin embargo, “se requiere de más elementos para elaborar un dictamen definitivo. Tal como lo explica la doctora Gómez Adorno, su investigación ha permitido confirmar similitudes entre textos mediante métricas objetivas, pero hasta ahí”. Señala que esta línea de investigación está más orientada al análisis y atribución de autoría.

Haciendo de las redes sociales un lugar más seguro

En otra de sus principales áreas de investigación, la doctora Gómez Adorno apunta a evaluar la seguridad de comunidades menos representadas. Las redes sociales pueden ser lugar donde proliferan comentarios de odio, sexismo y sentimientos, en general, dirigidos a la comunidad LGBT+ o a las mujeres, de parte de usuarios que se esconden tras una pantalla. Su trabajo contribuye a la identificación de esos comentarios, facilitando la toma de acciones para contrarrestarlos. 

“Se necesitaría un ejército de personas para analizar y monitorear cada comentario en redes sociales, de ahí que el uso de algoritmos de IA es indispensable para automatizar esta tarea. ¿Te imaginas un montón de gente frente a sus computadoras leyendo cada mensaje publicado? Gracias a la Inteligencia Artificial, esto no es necesario, ya que actúa como guardián contra de comentarios ofensivos, ayudándonos a crear un entorno más seguro en las redes sociales”, platica la doctora Gómez Adorno.

Una vez identificados los mensajes de odio dirigidos a grupos vulnerables, ¿qué sigue? La doctora Gómez Adorno señala dos posibles estrategias: la censura y la generación automática de contra narrativas. En el primer enfoque, los mensajes son eliminados o bloqueados para evitar su difusión y reducir su impacto. Mientras que, en el segundo, en lugar de simplemente borrar el contenido, se generan respuestas con información que refuta el mensaje de odio. Es decir, se busca contrarrestar comentarios despectivos con argumentos que promuevan el respeto y la reflexión.

Algoritmos que mejoran la atención médica

Finalmente, respecto a su trabajo en la evaluación de expedientes y notas clínicas, la doctora Gómez Adorno comenta que esta investigación tiene como objetivo desarrollar algoritmos capaces de “identificar datos relevantes para la historia clínica de un paciente, como síntomas, diagnósticos, signos vitales y análisis realizados  que sean esenciales para su historial clínico, esto se logra al estudiar el Lenguaje Natural en la entrevista médico-paciente, estructurar la información y presentarla de manera adecuada, con visualizaciones y tendencias que ayuden a la toma de decisiones”, menciona.

Este tipo de investigación presenta varios desafíos, pues si bien todos podemos usar y entender el Lenguaje Natural, el contexto médico lo complica un poco más. En una conversación cotidiana, empleamos un lenguaje coloquial, es decir, el mismo que usamos con amigos o familiares. Sin embargo, en otros contextos, como el médico, es necesario considerar el cambio de lenguaje. Los profesionales de la salud utilizan términos especializados que sería difíciles de entender para quienes no han estudiado medicina, por ejemplo, los nombres de síntomas, enfermedades, tratamientos o medicamentos.

En este sentido, el trabajo de la doctora Gómez Adorno tiene múltiples aplicaciones que pueden beneficiar a las personas que acceden al sistema de salud, por ejemplo, si se detecta un aumento de síntomas o comorbilidades (la presencia de dos o más enfermedades en una persona al mismo tiempo), en una población, el sistema de salud puede tomar medidas preventivas, como la adquisición de medicamentos. De este modo, si un gran número de personas se ve afectado por una misma enfermedad en un determinado momento, este algoritmo, puede ayudar a prever la cantidad de medicamentos necesarios, garantizando que todos los que los requieran puedan acceder a ellos.

Entrenar algoritmos de Inteligencia Artificial que puedan identificar ciertos términos en muchas historias clínicas da la posibilidad de contabilizarlos y agruparlos de manera visual. De esta manera, se logra visualizar la información de más de un hospital al mismo tiempo para su análisis.

30 hospitales, una solución

Entre los proyectos de los que ha formado parte, se destaca una colaboración con la Secretaría de Salud de la Ciudad de México (SEDESA), en la cual participaron la doctora Gómez Adorno con el doctor Víctor Manuel Lomas Barrié como co-responsable, así como miembros del departamento de Ingeniería en Sistemas Computacionales y Automatización (ISCA) como el maestro Sergio Padilla Reynaud.

Este proyecto con SEDESA se dio a raíz de la pandemia, cuando la dependencia experimentó problemas en el manejo de expedientes electrónicos en una red que conecta a más de 30 hospitales. “Se trata de una plataforma que se desarrolló durante dos años. Su función es extraer información de las notas clínicas y presentarla de una manera visual, generando estadísticas sobre los pacientes atendidos en hospitales”, mencionó.

Cada uno de los hospitales de esta red tenía su propia base de datos, por lo que la agrupación y análisis de los datos no era lo suficientemente accesible. Esta es la problemática que el equipo coordinado por la doctora Gómez Adorno resolvió con su Sistema de Información Hospitalaria. Gracias a este proyecto fue posible analizar alrededor de 71 mil notas clínicas de un total de 37 mil pacientes.

El trabajo de la doctora Helena Gómez Adorno demuestra cómo se puede aplicar la tecnología, en especial la Inteligencia Artificial a partir el Procesamiento del Lenguaje Natural para fines sociales como la seguridad en redes sociales, el análisis de notas médicas y la atribución de autoría.