Zusammenfassung:
Actualmente algoritmos para el reconocimiento de entidades en el español son escasos, aún más si se trata del ámbito médico, es por eso que en este trabajo se desarrolló un sistema con el objetivo de reconocer y normalizar entidades biomédicas en español utilizando un corpus de reconocimiento de entidades dirigidas al dominio médico, particularmente en el caso de textos médicos en español, aplicando técnicas de Procesamiento de Lenguaje Natural (PLN) y el paradigma de cross-lingual (Usando recursos en el idioma inglés para trasladarlos al idioma español). La normalización de las entidades consiste en asignar una identificación única a cada entidad reconocida, lo que permite la integración de información de diferentes fuentes y la realización de análisis posteriores. Estos nuevos métodos y algoritmos serán integrados a un sistema web donde permita reconocer e identificar entidades médicas para posteriormente se pueda realizar algoritmos de predicción de diagnósticos a pacientes, aplicando herramientas, métodos y buenas prácticas de ingeniería de software. En resumen, el sistema desarrollado en esta tesina contribuye a mejorar la eficiencia y precisión en el reconocimiento y normalización de entidades biomédicas en español, lo que resulta de gran utilidad para la investigación y la práctica médica. La utilización de técnicas de cross-lingual y la integración de recursos en diferentes idiomas permiten ampliar el alcance y la precisión del sistema.