Inicio Contacto Mapa del sitio RSS
 
 
 
 
 
|

Documentación de Dihuen

El metabuscador Dihuen está íntegramente desarrollado con herramientas Software Libre: el buscador se implementó con ElasticSearch y la aplicación fue desarrollada con el framework Sinatra de Ruby.

A su vez, la aplicación de administración está desarrollada con el framework Rails de Ruby, la base de datos fue implementada con MySQL para guardar la información de las fuentes de datos y ElasticSearch para indexar los datos recuperados de cada una de estas fuentes.

Dihuen utiliza un protocolo para la comunicación de metadatos denominado OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting), elaborado bajo la Iniciativa de Archivos Abiertos (OAI) que proporciona la arquitectura y especificaciones técnicas necesarias para que productores y distribuidores de documentos de acceso abierto pongan a disposición de agregadores de contenidos metadatos sobre los documentos que almacenan con objeto de hacerlos visibles y accesibles a los investigadores.

El Servicio de Difusión de la Creación Intelectual (SeDICI) de la UNLP señala tres características fundamentales de este protocolo:

  • Simplicidad: Se concibió bajo la premisa de la sencillez. Conscientes de los problemas de implementación que habían tenido otras iniciativas anteriores como Z39.50 o Dients, los creadores buscaron una fórmula simple que estuviera al alcance de cualquier potencial implementador.
  • Normalización: Basado en estándares ampliamente utilizados en Internet como son el protocolo http (HiperText Transport Protocol) para la transmisión de datos y órdenes y XML (Extended Markup Language) para la codificación de los metadatos.
  • Recolección. Frente a otros sistemas de agregación de contenidos como la búsqueda distribuida (Z39.50) o los sistemas de sindicación de contenidos vía RSS, OAI-PMH ha optado por la recolección de metadatos. En este caso, existe una entidad que pone a disposición de los interesados información bibliográfica sobre los documentos que almacena. Estos, normalmente agregadores de contenidos, recogen periódica y sistemáticamente todos o parte de los metadatos expuestos para, localmente, implementar servicios de valor añadido.