Sergio Albarracín Iranzo / 30 June 2021

Avances en el desarrollo de sistemas de información para la industria alimentaria

OpenData, Procesamiento de lenguaje natural, y Grafos de conocimiento

La hibridación de las tecnologías OpenData, Procesamiento de lenguaje natural, y Grafos de conocimiento, ha supuesto un enorme avance en el desarrollo de sistemas de información estratégica para la industria alimentaria. En esta línea hemos trabajado en el proyecto OpenKnowledge y hemos obtenido unos resultados que han generado expectación e interés en la industria alimentaria, beneficiaria de los avances que estas nuevas tecnologías han puesto sobre la mesa, ¿quieres conocerlos? 

Hibridación de tecnologías disruptivas

A partir del modelo de acceso a repositorios OpenData, estamos generando un puente entre nuestras aplicaciones corporativas y nuevas bases de datos, hasta ahora inaccesibles, que amplían nuestro dominio de conocimiento y abren la vía al desarrollo de nuevas aplicaciones informáticas de interés estratégico.

Al integrar en el modelo tecnología de procesamiento de lenguaje natural, estamos automatizando una actividad de enorme importancia en el marco organizativo, sin la cual, la ingente cantidad de información capturada de fuentes OpenData, tendría que ser analizada manualmente, lo que imposibilitaría una gestión en tiempo real.

Finalmente, los modelos de representación de información clásicos, basados en feeds o listados que tienen su origen en bases de datos relacionales, prestan excesiva atención a los datos y muy poca a las relaciones, cuando estas son en esencia la base para una correcta asimilación. Por ello, los sistemas de interrogación que han sido desplegados en OpenKnowledge están basados en modelos de datos en grafo, generando los llamados grafos de conocimiento, que constituyen uno de los elementos diferenciales más representativos del proyecto.

Grafo de conocimiento

Figura 1: Grafo de conocimiento generado mediante OpenKnowledge

Dominio de conocimiento: Seguridad alimentaria

Tras las entrevistas con las empresas participantes del proyecto, y el análisis de cientos de fuentes open data, se ha llegado a diversas conclusiones. Una de ellas es el interés creciente por fuentes de información que se clasifican en el ámbito de la seguridad alimentaria.

Con ello, se han seleccionado repositorios de datos abiertos enmarcados en áreas vinculadas con este dominio de conocimiento, como la legislación alimentaria, alertas, dictámenes científicos y noticias de actualidad.

Estos 4 datasets constituyen la piedra angular del modelo de datos OpenKowledge y las interrelaciones entre ellos representadas a partir de un grafo de conocimiento (datos abiertos vinculados) son un muy buen ejemplo de cómo la tecnología actual contribuye a facilitar nuevas visiones de la realidad que ayuden a tomar mejores decisiones.

Datasets integrados en OpenKnowledge

Figura 2: Datasets integrados en OpenKnowledge

Estructura semántica normalizada y búsquedas en 43 idiomas

Sin duda alguna la clave del proyecto OpenKnowledge está en el backend del sistema, es decir, en lo que a simple vista no se puede apreciar.

Un backend en el que encontramos la estructura semántica que da coherencia a los miles de datos alojados en BBDD. Una taxonomía que, partiendo de la base de estar normalizada, ha servido para diseñar una arquitectura de información basada en estándares RDF que nos permite, no sólo realizar búsquedas inteligentes sino además hacerlo en más de 40 idiomas y de modo que la inferencia de conocimiento destaque.

Atrás quedan los sistemas de representación de datos cuyos sistemas de búsqueda basados en la indexación de texto, sólo pueden devolver registros que contengan dichos términos. OpenKnowledge es capaz de devolver resultados de búsqueda que encajan en las preferencias del usuario y que no necesitan la indexación de texto para poder operar, todo ello gracias a una estructura semántica que representa el corazón del sistema.

Estructura de un concepto semántico Figura 3: Estructura de un concepto semántico en OpenKnowledge     ivace feder 2014 2020

Sergio Albarracín Iranzo (5 artículos)

Noticias
relacionadas

icono izquierdaicono derecha

¿Te ha interesado este tema?
Contacta con nosotros

Información básica sobre protección de datos

Responsable AINIA
Domicilio Calle Benjamín Franklin, 5 a 11, CP 46980 Paterna (Valencia)
Finalidad Atender, registrar y contactarle para resolver la solicitud que nos realice mediante este formulario de contacto
Legitimación Sus datos serán tratados solo con su consentimiento, al marcar la casilla mostrada en este formulario
Destinatarios Sus datos no serán cedidos a terceros
Derechos Tiene derecho a solicitarnos acceder a sus datos, corregirlos o eliminarlos, también puede solicitarnos limitar su tratamiento, oponerse a ello y a la portabilidad de sus datos, dirigiéndose a nuestra dirección postal o a [email protected]
Más info Dispone de más información en nuestra Política de Privacidad
DPD Si tiene dudas sobre como trataremos sus datos o quiere trasladar alguna sugerencia o queja, contacte al Delegado de protección de datos en [email protected] o en el Formulario de atención al interesado

Consiento el uso de mis datos personales para que atiendan mi solicitud, según lo establecido en su Política de Privacidad

Consiento el uso de mis datos para recibir información y comunicaciones comerciales de su entidad.

Sergio Albarracín Iranzo
Jefe de Sistemas de Información y Gestión Conocimiento
Suscríbete a nuestra newsletter
Mantente al día de lo más destacado sobre innovación y nuevas tecnologías.
SUSCRIBIRME
close-link

Subscribe to our newsletter

Sign-up to get the latest news straight to your inbox.
ENVIAR
Give it a try, you can unsubscribe anytime.