Miriam Ruiz
random thoughts on technology and life











{April 16, 2010}   ¿Qué son Linked Open Data y cómo se usan?

Entre 1989 y 1990, Tim Berners-Lee realizó una propuesta para la gestión de información de forma distribuida en base a hiperenlaces, que luego se convertiría en un estándar de presentación y enlaces entre documentos, perdiendo parte de la esencia de la propuesta inicial que proponía enlazar información. En 2001 se realiza una revisión de la propia idea base de la Web, y surge el concepto de Web Semántica que, partiendo de un catálogo de tecnologías base, como son las especificaciones de XML (“Extensible Markup Language” o lenguaje de marcas extensible), las URIs (acrónimo de “Uniform Resource Identifier”, identificador uniforme de recurso), RDF (“Resource Description Framework” o marco de descripción de recursos), RDFS o RDF Schema (extensión semántica de RDF), el lenguaje de consulta OWL (“Ontology Web Language”), el lenguaje de consulta SPARQL (arrónimo recursivo de “SPARQL Protocol and RDF Query Language”), etc.

Dentro de este paradigma de Web Semántica, surge el concepto de Linked Data (o datos enlazados), y cuya propuesta consiste fundamentalmente en ampliar la Web con una base de datos común mediante la publicación de bases de datos distribuidas y enlazadas entre ellas. En marzo de 2009 la nube de datos semánticos enlazados era ya bastante importante, y ha continuado creciendo de una forma importante desde entonces.

Por otra parte surge el concepto de Open Data, una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes  u otros mecanismos de control. Ambos conceptos se unen en el término Linked Open Data, o datos abiertos enlazados.

El último concepto que tengo que introducir es el de la reutilización de la información del sector público (RISP). Ésta consiste en el uso de documentos que obran en poder de organismos del sector público por parte de personas físicas o jurídicas, con fines tanto comerciales como no comerciales. El sector público -y cito literalmente las palabras de la Guía Aporta- produce una gran variedad de información relativa a diferentes materias, como por ejemplo información social, económica, geográfica, meteorológica o turística y sobre empresas, patentes y educación, que es potencialmente reutilizable por los ciudadanos y por la industria de contenidos digitales.

Hay diversas administraciones que han empezado a publicar datos abiertos enlazados, tanto a nivel nacional como internacional. Entre éstos últimos se encuentra el Gobierno del Principado de Asturias, que ha liberado ya algunos datasets que se espera que vaya ampliando progresivamente.

La idea es que vayan surgiendo espontáneamente nuevos usos para esos datos, que serían inimaginables si se hubieran mantenido cautivos en las distintas bases de datos internas de las organizaciones que los gestionan. El problema es que no todo el mundo sabe muy bien cómo explotar estas fuentes de datos de una forma sencilla. Actualmente, de todas formas, existen numerosas bibliotecas en diferentes lenguajes que hacen que esta tarea muy sencilla de realizar. Por ejemplo, para el lenguaje PHP disponemos de ARC2 (“Easy RDF and SPARQL for LAMP systems”).

Con el objeto de mostrar lo sencillo que puede ser el acceso a estas nuevas fuentes de datos, en concreto a algunos de los datasets publicados por el Gobierno del Principado de Asturias (los relativos a la oferta formativa del Servicio Público de Empleo del Principado de Asturias), desde CTIC Centro Tecnológico hemos querido publicar un ejemplo, muy muy sencillo, de cómo se podrían consultar a través de un pequeño script realizado en PHP y que podría ser desplegado sin problemas en cualquier sistema LAMP. El ejemplo se puede descargar aquí.

Termino enlazando a la presentación de Sergio Fernández (aka. Wikier) en el Día W3C realizado en el Tecnimap 2010, que creo que merece la pena que la leáis si os interesa el tema.



Sergio says:

Gracias por la mensión ;-)

Como ejemplo, yo creo que el que usamos para el Python SPARQL Wrapper es bastante ilustrativo, y con un guiño asturiano ;-)



Leave a Reply


about

This is a personal webpage that belongs to Miriam Ruiz.
If you want to contact her, you can do at:
webmistress(at)miriamruiz(dot)es.

pages
categories
archive
twitter
calendar
September 2014
M T W T F S S
« Jan    
1234567
891011121314
15161718192021
22232425262728
2930  
credits
WikiLeaks

La Lista de Sinde
en isoHunt