Marco institucional

La Biblioteca Virtual de Derecho público aragonés es fruto de un acuerdo de colaboración entre el Gobierno de Aragón, las Cortes de Aragón, el Justicia de Aragón, la Universidad de Zaragoza, Ibercaja y la Caja de Ahorros de la Inmaculada, dirigido a la edición en Internet de todas las obras impresas relativas al Derecho público aragonés.

Partiendo como antecedente de la colaboración interinstitucional que había hecho posible la Biblioteca Virtual del Derecho Civil de Aragón, el Departamento de Presidencia y Relaciones Institucionales del Gobierno de Aragón propuso a las referidas Instituciones su colaboración en el proyecto de esta nueva Biblioteca.

Tras la aprobación por los órganos competentes de cada Institución, el 9 de noviembre de 2006 se formalizó un Convenio de colaboración suscrito por D. José Ángel Biel Rivera, Vicepresidente del Gobierno y Consejero de Presidencia y Relaciones Institucionales; D. Francisco Pina Cuenca, Presidente de las Cortes de Aragón; D. Fernando García Vicente, Justicia de Aragón; D. Felipe Pétriz Calvo, Rector de la Universidad de Zaragoza; D. José Luis Aguirre Loaso, Director General de Ibercaja, y D. Tomás García Montes, Director General de la Caja de Ahorros de la Inmaculada.

En dicho Convenio se señalaba que existe ya un estimable catálogo de obras que estudian y comentan el Derecho público de Aragón. Que se trata de un Derecho vivo, de obligada aplicación y consulta por tribunales, profesionales del Derecho, funcionarios y ciudadanos en relación con muy diversos sectores de la actividad pública. Hacer accesibles dichas obras a todos los posibles interesados a través de una Biblioteca virtual de Derecho público aragonés completaría BIVIDA y situaría a Aragón en posición avanzada dentro del conjunto de las Comunidades Autónomas en cuanto al conocimiento y accesibilidad de su Derecho público. La gestión de la realización del proyecto se encomendó al Departamento de Presidencia y Relaciones Institucionales del Gobierno de Aragón, que asumió las gestiones dirigidas a su ejecución a través de su Secretaría General Técnica.

Para garantizar el seguimiento del proyecto se constituyó una Comisión formada por D. Ramón Salanova Alcalde y D. Rafael Santacruz Blanco, Secretario General Técnico y Director General de Servicios Jurídicos del Departamento de Presidencia y Relaciones Institucionales; Dª. Carmen Agüeras Angulo, Letrada de las Cortes de Aragón; Dª. Ana Iguacel Pérez, Asesora del Justicia de Aragón; D. José Mª Rodanés Vicente, Vicerrector de la Universidad de Zaragoza; D. Jesús Barreiro Sanz, Secretario General de Ibercaja, y D. Juan Antonio García Toledo, Subdirector de la Caja de Ahorros de la Inmaculada.

Dirección científica

Dadas las características de la Biblioteca a editar y su relación con la actividad profesional que desarrollan, la dirección científica se encargó a D. Ramón Salanova Alcalde, Secretario General Técnico del Departamento de Presidencia y Relaciones Institucionales; D. Rafael Santacruz Blanco, Director General de Servicios Jurídicos, y Dª. María Antonia García Huici, Jefa del Servicio de Información y Documentación Administrativa del Departamento de Presidencia y Relaciones Institucionales.

La dirección científica ha localizado y aportado la bibliografía a editar, contando con la colaboración de Dª Soledad Kühnel Ros, Jefa de la Biblioteca del Gobierno de Aragón, y con el trabajo preliminar realizado por Dª Olga Herraiz Serrano, Dª Ana Gaspar Fuentes y Dª Carmen Borrajo Fúlez. Han colaborado en la aportación de publicaciones el Instituto Bibliográfico de Aragón, el Servicio de Documentación y la Biblioteca de las Cortes de Aragón, la Biblioteca de la Diputación General de Aragón y la Biblioteca de la Facultad de Derecho de la Universidad de Zaragoza. La dirección científica ha asumido también la confección de índices, la distribución de las obras por secciones y los descriptores por materia. Por otra parte se han redactado las páginas de introducción a la Biblioteca y propuesto elementos de su presentación. En todo ello ha contado con el asesoramiento y colaboración de DIGIBIS.

Producción

Dado que las características del proyecto exigían una especial capacitación y solvencia técnicas y una relación de confianza basada en compartir los objetivos culturales y científicos del proyecto, se adjudicó la realización de la Biblioteca a DIGIBIS, sociedad dedicada a la producción, edición y distribución de publicaciones digitales, cuya capacitación para la tarea propuesta había quedado plenamente acreditada en la anterior realización de BIVIDA.

En la realización del actual proyecto han tenido especial participación, por DIGIBIS, Dª. Tachi Hernando de Larramendi, Directora General, D. Xavier Agenjo Bullón, D. Antonio Otiñano y Dª. Francisca Hernández.

La fase de digitalización concluyó en marzo de 2007, con un total aproximado de 68.400 páginas digitalizadas, correspondientes a 87 monografías y 496 capítulos de otros títulos relacionados con la materia, 312 artículos de publicaciones periódicas, 328 leyes aragonesas y 16 sentencias del Tribunal Constitucional. Tuvieron a su cargo la digitalización Dª. Montserrat Martínez Guerra, Dª. Patricia Juez García y Dª. Noemí Barbero Urbano.

Ha habido actualizaciones relativas a las obras que se han ido digitalizando con posterioridad.

Agradecimientos a los autores

La Biblioteca virtual de Derecho público aragonés pretende recoger obras de muy diversos autores. A todos ellos el agradecimiento por su contribución al estudio y al conocimiento y difusión del Derecho público aragonés. Durante la gestación de Biblioteca se ha hecho todo lo posible por contactar con los autores para darles cuenta del proyecto, que ha sido acogido con general aprobación. También, por tanto, el agradecimiento a su generosa colaboración.

Consideraciones técnicas

Introducción

La finalidad de la Biblioteca Virtual de Derecho Público Aragonés ha sido recoger todas las publicaciones sobre esta temática y, mediante el uso de las nuevas tecnologías, permitir el acceso a toda esta documentación de una forma fácil y sencilla para cualquier usuario interesado, ya sean investigadores, profesionales, estudiantes o ciudadanos.

Por las características del material, documentación moderna en su totalidad, se planteó la posibilidad de recuperar el contenido completo de la documentación mediante búsquedas a texto libre. Por lo tanto, toda la documentación recogida es accesible de forma rápida mediante una simple búsqueda, tanto en el contenido de las obras como en sus datos identificativos.

La Biblioteca Virtual de Derecho Público Aragonés, está compuesta por artículos de revistas especializadas, monografías especializadas, capítulos de monografías, leyes autonómicas y sentencias del Tribunal Supremo.

Esta documentación ha sido tratada y procesada para ponerla a disposición de los usuarios a través de esta página web que cumple las siguientes características:

  • Catalogación en formato MARC (http://www.loc.gov/marc/) de toda la documentación
  • Edición digital en formato imagen de toda la documentación utilizando METS (Metadata Encoding and Transmisión Standard). Se trata de un esquema de XML para la codificación de la descripción, administración y estructuración de los metadatos de los objetos de las bibliotecas digitales (http://www.loc.gov/standards/mets/)
  • Dentro de la estructura METS se incluyen los metadatos de preservación que se ajustan a Recomendaciones del Reference Model for an Open Archival Information System (OAIS) [ISO 14721:2003] y que están definidas en el diccionario de metadatos PREMIS (PREservation Metadata: Implementation Strategies), elaborado por la OCLC y la RLG y la Library of Congress y que, al igual que en el caso de METS, puede consultarse en la dirección: http://www.loc.gov/standards/premis/
  • índice navegable del contenido de las monografías.
  • Acceso mediante índice de autores, índice de títulos e índice de materias.
  • OCR oculto de todas las unidades documentales, generando un fichero XML por imagen.
  • Indexación total de todos los contenidos, marcando los términos buscados en la imagen.
  • Búsqueda a texto libre sobre el contenido de toda la documentación de la Biblioteca Virtual de Derecho Público Aragonés.
  • Búsqueda por campos: autor, título, año, etc.
  • Creación de un Repositorio OAI con las obras de Derecho civil y de Derecho Público.
  • Recopilación de recursos digitales existentes sobre Derecho Aragonés.

Procesos

El conjunto de la documentación recopilada para este proyecto, con formatos y estructuras tan diferentes entre sí, se ha tenido que convertir en documentación digital y se ha homogeneizado para hacerlo accesible al usuario mediante un mismo interfaz de búsqueda. Para ello se siguieron los siguientes procesos:

1. Digitalización

Cada documento se digitalizó, uno por uno, conforme a una metodología que incluye control de calidad y validación. Se usó un escáner cenital que garantiza la calidad de las imágenes y la adecuada manipulación del material original. Así mismo, la posibilidad de digitalización de ambas páginas en un único barrido asegura que los ficheros finales estén correctamente ordenados, reduciendo así el riesgo de pérdida o de mezcla de páginas.

El producto final ha sido una copia fiel al original, manteniéndose en la edición digital las características de los originales impresos.

Características de la digitalización:

  • Resolución: 300 dpi
  • Formatos de salida TIFF y JPEG
  • Imágenes a página simple

Todas las imágenes digitalizadas han pasado un estricto control de calidad antes de ser validadas. A partir de un programa desarrollado por DIGIBIS específicamente para esta tarea y para el control de calidad, se procedió a la revisión página a página y a pantalla completa de todas las unidades digitalizadas para detectar que:

  • Se habían digitalizado la totalidad de las páginas
  • Las imágenes eran perfectamente legibles
  • No existía pérdida de información (salvo que fuera achacable al estado de conservación del original)
  • No existían imágenes repetidas

Cuando se localizaron páginas con el fondo sucio o páginas torcidas, se han utilizado programas desarrollados por DIGIBIS que han mejorado notablemente la calidad de estas imágenes y su posterior reconocimiento óptico de caracteres. En este sentido, DIGIBIS ha desarrollado, para los proyectos de digitalización que ha venido realizando en los últimos años, diferentes programas que permiten realizar un control exhaustivo de las imágenes y de las incidencias que se pueden presentar en los ejemplares.

DIGIBIS dispone de equipos dotados de periféricos de última generación, como las pantallas TFT de 19", que se posicionan verticalmente y permiten visualizar las páginas a pantalla completa, con lo que la detección de posibles errores de maquetación y tareas como la limpieza de imágenes o el restablecimiento de márgenes, como resultado del cotejo con el original, se facilitan notablemente.

La calidad de las imágenes digitalizadas está asegurada, ya que a la tecnología utilizada, que lleva incorporado un software que proporciona la máxima celeridad en los procesos de control de calidad, se unen los controles de calidad que se llevan a cabo de forma manual para evitar la pérdida de información. Precisamente, los óptimos resultados obtenidos tras la realización de estas revisiones avalan el prestigio alcanzado por DIGIBIS al garantizar el máximo nivel de fiabilidad.

2. Reconocimiento óptico de caracteres

El objetivo de este proceso es que el contenido total de cada documento sea accesible a través de búsquedas.

Tras el proceso de digitalización de la documentación y una vez que las imágenes obtenidas han pasado el control de calidad, se procede al reconocimiento óptico de caracteres (OCR) y a su transformación en ficheros XML.

Se realizó un muestreo para determinar la calidad del OCR sobre los materiales digitalizados, comprobando que el índice de error era mínimo en el grueso del texto. La mayoría de los errores eran debidos a la puntuación y a errores de repetición, por lo que se vio que se podía optar por la opción de un OCR oculto sin corregir.

Tanto los errores de puntuación como los acentos, comas o puntos son irrelevantes a la hora de recuperar la información. El motor de búsqueda utilizado, DIGIFIND, no tiene en cuenta acentos ni otros signos de puntuación en la indexación y recuperación de la información. Otro error común del resultado del OCR, pero que se soluciona con nuestro motor de búsqueda, es la utilización indistinta de mayúsculas y minúsculas.

Por otro lado, los errores más comunes, y que suelen repetirse, se solucionaron con la creación de un archivo de capacitación. Para ello, se hizo un estudio de los errores que más se repiten y se encontró la pauta que sigue el programa. Por ejemplo, vimos que la preposición "de", en el resultado del OCR, aparecía muchas veces escrita como "ele", para solucionarlo, especificamos en el programa que esa imagen que lee como "ele" debe leerla como "de". Con esta técnica pudimos mejorar el reconocimiento del programa y obtener unos resultados óptimos sin necesidad de corregir los textos.

El reconocimiento óptico de caracteres se aplicó a cada unidad documental y se generó un fichero de salida en formato XML por cada página reconocida. Los ficheros XML conservan información sobre las coordenadas de cada palabra en su imagen correspondiente. DIGIBIS ha desarrollado una aplicación que permite marcar en las imágenes los términos que el usuario introduzca en sus peticiones de información.

Hasta ahora, el formato PDF con texto oculto ofrecía la posibilidad de mostrar al usuario final la imagen del original con el texto oculto, pero no la de hacer una búsqueda sobre el conjunto de la información por la imposibilidad de indexación en la web, y con el agravante del peso de los ficheros en formato PDF, por contener en un mismo fichero todas las páginas de una misma obra.

DIGIBIS, consciente de estos problemas, ha desarrollado para este proyecto las herramientas necesarias para ofrecer al usuario una solución integrada consistente en la digitalización en formato imagen de la documentación, procesamiento de OCR oculto con salida de textos en formato XML, identificación de cada unidad documental e indización de todas las unidades documentales en una misma base de datos. De esta forma el usuario visualizará la imagen digital del original, página por página, y podrá hacer búsquedas sobre los contenidos de todas las obras, de manera que los términos buscados aparezcan marcados sobre la imagen.

Tras un estudio de mercado de tecnologías europeas de la Información y la Comunicación no hemos encontrado ninguna solución informática comparable a la que aquí se propone.

3. Catalogación

Se ha catalogado en formato MARC toda la documentación, creando registros de autoridad y bibliográficos para cada documento. La descripción se realizó conforme a las Reglas de Catalogación, a los Formatos IBERMARC para registros bibliográficos 6ª ed., al Formato IBERMARC para registros de autoridad, y a lo establecido en las ISBD (ER).

Para esta tarea DIGIBIS utilizó registros bibliográficos procedentes de otros catálogos, como, por ejemplo, el de la Biblioteca Nacional o el de REBIUN (Red de Bibliotecas Universitarias), con el fin de aprovechar recursos ya existentes. Así mismo, DIGIBIS completó y adaptó estos registros con la información que consideró necesaria así como con los términos de indización entregados. En el caso de no localizar registros en estas bases de datos, DIGIBIS catalogó completamente dichos documentos basándose en la normativa citada anteriormente.

Las materias utilizadas en la descripción han formado un vocabulario controlado que se ha utilizado para crear un índice de materias por el que acceder a la documentación, que completa los puntos de acceso a través del índice de títulos y del índice de autores.

4. Diseño de la página web

Una vez finalizada la digitalización y la descripción de la información, los recursos estaban preparados para ser accesibles a través de Internet, por lo que DIGIBIS pasó a establecer y diseñar un sitio web para tal efecto.

Cualquier usuario podrá acceder de forma libre a la totalidad de las imágenes digitales, así como a las bases de datos o catálogos. Gracias al motor de búsqueda desarrollado por DIGIBIS será posible acceder a cualquier información que se solicite en cuestión de segundos.

Esta web se ha diseñado conforme a las especificaciones del Gobierno de Aragón y en colaboración con DIGIBIS. Así mismo, el alojamiento y mantenimiento de la página se realiza en el servidor de DIGIBIS.

5. Gestión de toda la documentación

Para la gestión de todo este considerable conjunto de información DIGIBIS ha utilizado el programa DIGIBIB® 5.0, que permite:

  • Describir la documentación mediante el formato MARC, incluyendo las descripciones hechas a partir del vocabulario no controlado entregado, que se ha codificado en el campo MARC 650.
  • Enlazar los registros bibliográficos con los registros de autoridad y otros bibliográficos relacionados (por ejemplo partes componentes de publicaciones periódicas).
  • Gestionar las imágenes de cada unidad documental, permitiendo su paginación según el original y asociando cada grupo a su registro bibliográfico correspondiente.
  • Introducir el índice de las monografías mediante una tabla de contenido.
  • Indexar las descripciones y el contenido de cada documento, obtenido a partir del OCR en formato XML, con la finalidad de que el texto completo sea recuperado a partir de búsquedas a texto libre.

El desarrollo de estas tareas ha sido gestionado en su totalidad por el programa DIGIBIB® 5.0, que dispone de los siguientes módulos:

  • Catalogación
  • Autoridades
  • Importación / exportación de registros
  • Cliente Z39.50 (permite la búsqueda y recuperación de recursos distribuidos en distintas bases de datos desde un mismo punto de acceso)
  • Gestor de imágenes
  • Motor de búsqueda a texto libre Digifind. Digifnd® se ha desarrollado gracias a distintas subvenciones públicas del programa Profit. Está operativo sobre Apache Lucene.
  • Pasarela web
  • Repositorio OAI, creado a aprtir del módulo OAsIs de DIGIBIB® 5.0

Funcionalidades

La finalidad de este proyecto es crear una página web temática sobre Derecho Aragonés, donde esté accesible toda la documentación recopilada.

Los usuarios pueden acceder a las copias digitales de forma rápida y sencilla a través de búsquedas por campos para localizar una o varias unidades documentales (en las dos Bibliotecas Virtuales) o a través de búsquedas a texto libre sobre el contenido de cualquier documento (sólo en la Biblioteca Virtual de Derecho Público). Además, es posible la navegación a través de diferentes índices: autores, títulos y materias.

Existen tres formas diferentes de llegar a la documentación recopilada en esta web:

1. Búsqueda por campos

Mediante un formulario de búsqueda podemos localizar la documentación pertinente acotando por campos. Para ello introduciremos el término o términos que deseemos localizar en el campo o campos correspondientes y se recuperarán todos aquellos documentos que coincidan con la selección.

Los campos más utilizados en este tipo de búsqueda, son el de autor, título, editorial y fecha. Cabe destacar que además de buscar por fecha de publicación, este formulario de búsqueda permite recuperar documentación publicada entre dos fechas. Por ejemplo, se pueden localizar todos los documentos publicados entre los años 1999 y 2003.

2. Búsqueda a texto libre sobre el contenido de los documentos

Como novedad, esta web ofrece la posibilidad de realizar búsquedas a texto libre sobre el contenido de toda la documentación. Es decir, el usuario puede introducir los términos de búsqueda y el programa mostrará todos los documentos que contengan esta información. Los términos localizados se marcarán en las imágenes.

3. Navegación por índices

Otra opción para acceder a los documentos es a través de los índices de autores, títulos y materias. Estos índices consisten en listados alfabéticos navegables.

4. Repositorio OAI

DIGIBIS dispone de la última tecnología, desarrollos y aplicaciones informáticas para poner en funcionamiento todo lo descrito, garantizando un alto índice de visibilidad de los documentos gracias a la creación de un repositorio OAI, lo que los hará accesibles para recolectores externos. Para ello utiliza el módulo OAsIs que incorpora DIGIBIB® 5.0

Producto final

La Web sobre Derecho Aragonés está conformada por:

  • Biblioteca Virtual de Derecho Civil aragonés.
  • Biblioteca Virtual de Derecho Público aragonés.
  • Colección de diferentes recursos digitales existentes en la World Wide Web sobre Derecho aragonés.