estrategias de

difusión web de

datos estadísticos

en Cantabria

datos tabulares

Datos tabulares

OLAP y estadística

allí donde haya problemas... ponga yo solución
cruces indiscriminados de datos restricciones en miembros calculados
integración con metadatos microservicio proveedor de metadatos
rendimiento / escalabilidad caché, balanceo de carga
valores no numéricos no aplica al sistema Mondrian
secreto estadístico optimizador lineal y ocultación de celdas
coste y dependencia tecnológica servicio IT modesto + metodologías ágiles
poca flexibilidad arquitectura modular: microservicios y plugins

Familia PC-AXIS: Estrategia de difusión de información estadística, Alberto González Yanes

arquitectura difusión

Datos tabulares

arquitectura data

Datos tabulares

formatos

consumo complejidad popularidad metadata
Icono xls manual baja muy alta alta
Icono PC-Axis manual/auto media alta alta
Icono SDMX auto muy alta muy baja alta
Icono JSON auto muy baja muy alta alta
Icono RDF auto media baja muy alta

interesante...

  • JSON-stat: simple, empotrable, con toolboxes
  • JSON-ld linked data en JSON
  • CSV + validación JSON!!

APIs... APIs everywhere

  • Necesidad de normalización y reutilización de metadatos
  • Definición del dominio de información ICANE
  • Implementación: microservice RESTful
  • Potentes herramientas facilitadoras

API restful metadata

http:// {host} + /{app} +

/{entity} + /{uri_tag}

http://www.icane.es/metadata/api/ time-series/active-population-small-areas-employed-unemployed-base-2011

documentación

Captura API metadatos

API restful data

http:// {host} + /{app} +

/ {uri_tag} + . {ext}

http://www.icane.es/data/api/ active-population-small-areas-employed-unemployed-base-2011.rdf

web semántica

La web semántica no se explica en una tarde

conceptos

Web semántica vs web de datos

Retos y Oportunidades en Archivos y Gestión Documental ante la Web Semántica, Ana Carrillo Pozas

semstats: ¿para qué?

  • mejorar acceso y facilitar análisis de datos estadísticos
  • datos bien descritos y contextualizados
  • nuevas asociaciones entre conjuntos de datos
  • facilidad para habilitar procesamiento automático de recursos web

modelo RDF

Modelo RDF en icane.es

Implementation of a Linked Open Data solution for the Statistics Agency of Cantabria's metadata and data bank, Alejandro Villar Fernández

XHTML + RDFa icane.es

Grafo RDFa en icane.es

RDFa play con datos de icane.es

vocabulario icane

Extracto de SKOS icane.es

linked open data

Entidades y relaciones en página de icane.es

Ubiquity RDFa parser aplicado a http://www.icane.es/population/

enlazado : ¿qué?

entidad # propiedad # links
Section 4 dcterms:subject 18
rdfs:seeAlso 1
Subsection 27 dcterms:subject 141
rdfs:seeAlso 43
Folder 703 skos:closeMatch 161
rdfs:seeAlso 199
ReferenceArea 6 owl:sameAs 10
rdfs:seeAlso 15
Source 2694 foaf:page 2472

Implementation of a Linked Open Data solution for the Statistics Agency of Cantabria's metadata and data bank, Alejandro Villar Fernández

enlazado: ¿con quién?

Base de datos # enlaces
Geonames 4
DBpedia 45
DBpedia española 47
INE 251 (no RDF)
Eurostat 22 (no RDF)
LEM para Bibliotecas Públicas 168
LEM de la Biblioteca del Congreso de EEUU 151

Y además... ICANE está en the Datahub y programmableweb

punto SPARQL

Captura de punto SPARQL

RDF data cube

cubo RDF DataCube dataset
dimensión Concept Scheme + Concept class + DimensionProperty
medida RDF DataCube MeasureProperty
celda RDF DataCube Observation

Recomendación W3C RDF Data Cube Vocabulary

retos

  • dificultad para comunicar propósito y valor
  • establecer vocabularios estadísticos de uso común
  • uniformizar conceptualmente dimensiones en series estadísticas
  • mantenimiento de los enlaces de datos
  • dificultad para usar datos enlazados externos y ser enlazado

datos abiertos

“El opendata es el cuasi-estado de naturaleza de la difusión de estadísticas oficiales”

Opendata en Canarias, la estadística como showcase, Alberto González Yanes

¿qué falta?

Arquitectura de difusión de datos en icane.es Arquitectura de difusión de datos en icane.es con catálogo

marco normativo

Evolución marco legal RISP

Opendata y Gobierno Abierto: La continuidad en una política pública, Emilio García García

objetivos

  • ofrecer "escaparate" alternativo de datos
  • complementar portal con catálogo NTI RISP
  • incorporar API estándar con función de búsqueda
  • cubrir carencias redes sociales
  • ser referencia de datos abiertos en Cantabria

Norma Técnica de Interoperabilidad de Reutilización de recursos de la información y su Guía de aplicación

requisitos

NTI RISP y especialmente:
  • automatización de carga y actualización de datasets
  • mecanismos HTTP 303 y 410
  • construcción de URIs
  • previsualizadores

solución

Logotipo CKAN
UK, USA, Berlin, Aragon
Icono búsqueda CKAN
búsqueda
etiquetado
navegación
Icono almacenamiento CKAN
metadatos
visualización
Icono federación de datos CKAN
federación
temas
RRSS
Icono extensión CKAN
API
extensiones

tema ICANE

Captura tema ICANE

metadatos NTI RISP

CKAN NTI RISP
Descripción dct:description
Etiquetas dct:keyword
URL dataset dct:identifier, foaf:homepage
Título rdfs:label, dct: title
Fecha de creación dct:issued
Fecha de modificación dct:modified
Extra 'accrualPeriodicity' dct:accrualPeriodicity
Extra 'URI' dct:references
Extra 'spatial' dct:spatial
Recurso dct:distribution
Autor dct:creator
Texto estático "es" dct:language
Datos estáticos contacto dct:publisher
URL licencia dct:license

esquema de URIs

catálogo
http:// {base}/catalogo
http://datos.icane.es/catalogo
conjunto de datos
http:// {base}/catalogo/{dataset}
http://datos.icane.es/catalogo/registro-establecimientos-industriales
recurso
http:// {base}/recurso/{sector}/{dominio}/{clase}/{id}.{ext}
http:// datos.icane.es/recurso/industria/registro-establecimientos-industriales/serie/inversion-industrial.rdf

negociación + 303

Captura consola ejemplo redirección 303

previsualizadores

Captura visualizador RDF

dataviz: básica

Captura chart ICANE

Google Charts: simple y con poco código

dataviz: mapas

Captura mapas ICANE

Raphael.js: estándar (SVG) y browser-compatible

dataviz: Google Geomap

Captura mapamundi ICANE

toolboxes

SPAs

APIs restful data y metadata
+
Logo HTML5 + Logo JQuery + Logo D3.js
=
Fichas municipales de Cantabria

Responsive Web Design

“Write once, run everywhere”
  • Apps móviles ¿híbridas? con Logo HTML5 : una app más
  • Ejemplo: Financial times
  • En estadística: gráficas y datos al vuelo

números: €

Componente € aprox
API metadata 9000
API data 1000
linked open data 5750
exportación JSON 1500
portal opendata 5000
dataviz 4250

uso API data

Visitas API data

uso API metadata

Visitas API metadata

API data por formato

Visitas API data por formato
Logotipo ICANE Logotipo DGOT

Acceso al repositorio con la presentación

Miguel Expósito Martín

Jefe de Sección de Informática Estadística y Banco de Datos