PROYECTOS DE APLICACIÓN DE LA DESCRIPCIÓN ARCHIVÍSTICA CODIFICADA: UN AVANCE SOBRE LA IMPLANTACIÓN DE LA NORMA

Ana Teresa García Martínez
Profesora. Facultad Biblioteconomía y Documentación.
Universidad de Extremadura

RESUMEN

Se analizan los principales proyectos de aplicación de la EAD. Se incluye en primer lugar el proyecto origen de la DTD The Berkeley Finding Aid Project, con el objetivo de comprobar la utilidad del desarrollo de una codificación normalizada para instrumentos de descripción en archivos, bibliotecas y Museos; en segundo lugar se expone un proyecto de aplicación cooperativo, realizado de manera conjunta por distinta universidades americanas, con la finalidad de construir una base de datos colectiva de instrumentos de descripción en archivos, bibliotecas y museos; y también se presentan, someramente, algunos proyectos de aplicación de la EAD en Europa, con la finalidad de proporcionar acceso en línea a los instrumentos de descripción.

Se contempla el estado de la EAD, en función de la metodología de implantación y su codificación, así como las formas de acceso a los instrumentos de descripción codificados a través de Internet.

Con la presentación de estos proyectos se pretende avanzar las posibilidades de esta posible nueva norma en un entorno, como el archivístico, que ha sido poco dado al empleo de las mismas, pero que siente cada vez mas la necesidad de ello para integrarse en el futuro sistema global de información.

 

PALABRAS CLAVE

Descripción archivística --Instrumentos de descripción -- Formatos -- Normalización -- Encoded Archival Description - DTD EAD - SGML

INDICE

    1. Introducción
    2. Normalización de los instrumentos de descripción
    3. The Berkeley Finding Aid Project
    4. Proyectos de aplicación EAD cooperativos
    5. Proyectos EAD en Europa
    6. Situación de la DTD EAD
    7. Fuentes de información
    8. Anexos
  1. Introducción

Por distintas razones la comunidad archivistica no ha estado motivada para desarrollar normas que rijan el contenido intelectual y la estructura de los instrumentos de descripción. Los beneficios económicos de la catalogación compartida que motivaron a los catalogadores de materiales publicados no son asequibles a la comunidad archivística porque los elementos en sus fondos son principalmente únicos.

Uno de los motivos para normalizar el contenido y la estructura de los instrumentos de descripción sería hacerlos más familiares y así inmediatamente más inteligible a los usuarios no familiarizados con ellos.

Con el surgimiento de Internet hay que afrontar la necesidad de tener una mayor inteligibilidad de la información, que pueda ser fácilmente compartida e interpretada por la comunidad intelectual mundial. En este contexto destaca la urgencia con que hay que afrontar la importancia que tienen los instrumentos de descripción mutuamente inteligibles y los beneficios que de ellos se derivan. Internet tiene el potencial de suministrar acceso inmediato a la información de las colecciones e incluso sobre los sustitutos informáticos de los elementos de las mismas. Y este acceso puede ser asequible en cualquier momento y lugar. Aquellas instituciones que deciden tomar ventaja del poder de Internet se encontrarán con un incremento de usuarios distintos a los de habituales investigadores presenciales de siempre, y por tanto con un mayor rendimiento del servicio derivado del aumento en el uso de la colección, a la vez que se garantiza el estado de conservación de los materiales.

 

 

2. Normalización de los instrumentos de descripción

Para suministrar el acceso descrito en el apartado anterior, las comunidades de archivos deben desarrollar y adoptar una serie de normas. La manera de hacerlo es comunicar con otros, pero para hacer esta comunicación entendible mutuamente, se necesita trabajar juntos.

Para establecer la comunicación en el entorno de red, cada ordenador debe tener la capacidad de comunicar con otro. Se necesita tener la capacidad de mover información libremente de ordenador a ordenador en la red. Una norma de codificación posibilitará a las instituciones crear instrumentos de descripción que son independientes del hardware y software comercial. Esto permite que los datos sean intercambiados libremente entre plataformas y aplicaciones, y ser usados instantáneamente sin modificación o ajuste, y por tanto sin consumo de tiempo. Tal interoperatividad soportará el intercambio actual de datos de la colección, y asegurará en el tiempo la inversión en los datos.

Los instrumentos de descripción creados usando un software comercial tienen los siguientes problemas:

  1. sólo seguirán siendo útiles si se actualizan con las nuevas versiones, esta actualización implica un proceso de traslación de los datos a esa nueva versión, con el consiguiente riesgo de perdida de datos en la migración o, dando como resultado datos confusos, a pesar de que el fabricante ofrezca un 100% de fidelidad en el proceso de migración de los datos;
  2. incluso si se elige la tediosa tarea de actualizar eternamente el software, nos encontramos con otra cuestión, la de la perdurabilidad de la firma comercial, ya que si la misma no encuentra rentable el producto podría abandonar el negocio con lo que el sistema se quedaría colgado.

Si los instrumentos de descripción se codifican usando una norma, su supervivencia no dependerá de la configuración de un software o un hardware particular. Una norma de codificación garantizará que los instrumentos de descripción legibles por máquina creados hoy puedan ser usados en el futuro. Entre otras ventajas que se derivan de la aplicación de la norma a los instrumentos de descripción, estarían:

La normalización de los instrumentos de descripción se centran en el texto de los instrumentos de descripción, pero en un inminente futuro de la información se buscará que los registros de nivel de colección conduzcan a los instrumentos de descripción y los instrumentos de descripción conduzcan a las copias digitales de los materiales primarios que existen en una gran variedad de formatos: texto, sonido, imagen, manuscritos, … Las intersecciones entre estas formas de información se producirán por una pulsación de ratón o por un comando, así obtendremos la hipermedia que es el resultado de entrelazar los distintos tipos de informaciones de esta manera.

La tendencia a suministrar acceso en red a las copias digitales de los elementos de las colecciones provoca que la colección sea más accesible a través del acceso en red a los instrumentos de descripción. A la vez que se incrementa la disponibilidad de información detallada en los instrumentos de descripción incrementamos la demanda y el uso de la colección, por lo que tal incremento justifica un esfuerzo mayor en las cuestiones relativas a la conservación, esto podría resolverse haciendo copias de las partes más usadas de la colección disponible para incrementar el acceso virtual y limitar el acceso físico que pone en peligro las colecciones; de esta manera el acceso y la conservación no tienen que estar en conflicto necesariamente.

Internet hace posible trascender los límites físicos de nuestro entorno de información.

En un mundo de la información dominado por el medio físico, la ausencia de elementos (digitales) ha obligado a crear copias resumidas para representarlos. Esto incluye a los registros de catálogos e instrumentos de descripción, aunque cada uno suministra su mecanismo de acceso, es el componente descriptivo el que representa el elemento ausente; usando la descripción podemos identificar el objeto remoto y decidir si es lo que queremos. Internet al ofrecer la presencia (digital) de lo ausente (material original) cambiará el papel descriptivo de los registros de catálogos e instrumentos de descripción.

Si lo que se busca en las colecciones está disponible en Internet, en cualquier momento y desde cualquier lugar, esto le da un sentido de presencia universal, presente en la comunidad mundial. Esta universalidad requiere comunicación efectiva y la comunicación efectiva requiere normas. La normalización necesariamente crea tensión debido a la particularidad de los depósitos y las colecciones individuales. Por tanto el reto está en desarrollar una norma que posibilite la comunicación efectiva y a la vez permita a los conservadores y gestores de fondos representar adecuadamente la individualidad de la colección y la institución.

3. The Berkeley Finding Aid Project

El advenimiento y rápido crecimiento de Internet está transformando la comunicación erudita en el mundo. Para aprovechar la ventaja que ofrece las oportunidades de este desarrollo, la comunidad archivística necesitará desarrollar y adoptar normas que aseguren una comunicación útil y duradera. Una norma de codificación para instrumentos de descripción es una de tales normas.

Los instrumentos de descripción son documentos usados para describir, controlar y suministrar acceso a los fondos de materiales afines ubicados en bibliotecas, archivos y museos. Los materiales en estos fondos son los productos naturales de las actividades de individuos, familias, y organizaciones. En estos fondos se representan diferentes clases de materiales: manuscritos, correspondencia, artículos y registros legales, fotografías, cintas, vídeo, etc.

Teniendo en cuenta estas dos consideraciones previas, se establece la premisa fundamental del proyecto que parte de la idea de que la comunidad archivistica debería desarrollar y adoptar una norma de codificación para instrumentos de descripción de archivo, museo y biblioteca; esta norma debería asegurar la efectividad de la comunicación Internet de los datos de los instrumentos de descripción, y que se soporten los datos con independencia del software y hardware del ordenador utilizado para crearlos y usarlos.

The Berkeley Finding Aids Project es un esfuerzo en colaboración para probar la viabilidad y la ventaja de desarrollar una norma de codificación para instrumentos de descripción. El proyecto comenzó en octubre de 1993 y terminó en septiembre de 1995. El proyecto implica dos actividades interrelacionadas. La primera era crear un prototipo de norma de codificación para instrumentos de descripción. Esta norma prototipo tiene la forma de la DTD de SGML. Se analizaron la estructura y función de los instrumentos de descripción representativos. Los elementos básicos que aparecían en los instrumentos de descripción se aislaron y se definieron sus interrelaciones lógicas. La DTD se desarrolló sobre la base de los resultados de este análisis.

El segundo objetivo del proyecto era la construcción de un prototipo de base de datos de instrumentos de descripción. Se evaluaron el hardware y software disponibles. Se seleccionó AdeptEditor (ArborText) como el software de edición SGML, y DynaText (Electronic Book Technologies) para suministrar acceso en red a la BD. La codificación de los instrumentos de descripción y la construcción de la base de datos proporcionaba el esquema de codificación a los desarrolladores con experiencia en aplicaciones informáticas con el que refinar e informar los procesos de desarrollo de la DTD. La base de datos accesible en red pretendía suministrar, en una fase posterior del proyecto, un medio para que los usuarios internos y externos evaluaran la utilidad y ventaja de los instrumentos de descripción codificados; de esta manera también estos usuarios aportarán nuevas ideas y sugerencias a los desarrolladores de la norma de codificación. Esta cuestión se plantea así puesto que el éxito de cualquier norma depende de la amplia participación en su desarrollo y, después de ser desarrollada, del reconocimiento general de su utilidad.

Con respecto al primero de los objetivos del Proyecto, es decir la DTD, en la evolución que ha sufrido desde su concepción se debe considerar un hito importante en su desarrollo, nos referimos a los Acuerdos de Ann Arbor, adoptados en el marco del Bentley Fellowship Program en julio de 1995, que da lugar al documento que define los principios y criterios para el diseño, desarrollo y mantenimiento de un esquema de codificación SGML para instrumentos de descripción de archivos y bibliotecas, y que a continuación se reflejan:

Definiciones y parámetros

  1. Aunque el término "instrumento de descripción" abarca una amplia variedad de herramientas para describir, controlar y suministrar acceso a archivos y colecciones de manuscritos, esta norma de codificación está fundamentalmente ideada para un tipo particular de documentos conocidos como inventarios y registros. Su diseño, sin embargo, no excluye un desarrollo adicional para adaptarse a otros tipos de instrumentos de descripción, tales como guías de depósitos, o el desarrollo de normas de codificación auxiliares para alojar información de autoridades de archivos basada en las ISAAR para cuerpos corporativos, personas y familias.
  2. La norma contempla registros e inventarios de cualquier longitud que describen un rango completo de fondos de archivos, incluyendo documentos textuales y electrónicos, materiales visuales, y registros de sonido.
  3. La norma permite la creación de nuevos instrumentos de descripción y la conversión de los existentes, desde los formatos impresos, de procesador de texto, o de base de datos. Aunque que la conversión de las guías existentes puede requerir revisiones menores en el contenido o reorganización de la información, la gran tarea de edición que era necesaria se ha reducido.

Principios generales

  1. La información de los instrumentos de descripción describe, controla y suministra acceso a otra información, por lo que no tiene un final en sí mismo. Los instrumentos de descripción no son objetos de estudio sino más bien herramientas que conducen a tales objetos.
  2. Aunque el esquema de codificación no define o prescribe el contenido intelectual de los instrumentos de descripción, si define la designación de contenido y está ideado para ser usado con las normas de contenido de datos disponibles como la ISAD(G). Identifica los elementos esenciales de datos en los instrumentos de descripción y establece los códigos y convenciones necesarias para capturar y distinguir información en aquellos elementos para una manipulación o acción futura. Aunque hay elementos que debieran aparecer en un instrumento de descripción, los factores económicos e intelectuales condicionan la profundidad y el detalle del análisis empleado. Tomando esto en consideración, el esquema de clasificación se diseña con un mínimo de elementos requeridos, pero que permite establecer progresivamente niveles de descripción tan detallados y específicos como se desee.
  3. La norma mantiene y mejora la funcionalidad actual de los registros e inventarios existentes. Identifica y suministra el marcado para las estructuras y contenido de los instrumentos de descripción que soportan las siguientes funciones: descripción, control, navegación, indexación, y presentación online e impresa. Si alguna estructura no soporta alguna de estas funciones, no se suministrará el marcado específico para ella. Los términos descripción y control no se refiere sólo a los materiales originales sino también a las representaciones digitales y sustitutos.
  4. La norma está ideada para facilitar el intercambio y portabilidad de herramientas descriptivas. Incrementará la inteligibilidad de los instrumentos de descripción en y a través de las instituciones, permite compartir datos idénticos en dos o más instrumentos de descripción, asistencia en la creación de bases de datos colectivas, y permite reusar los datos codificados para múltiples propósitos de salida. También asegura que los instrumentos de descripción legibles por máquina resistan a los cambios de plataformas hardware y software porque están basados en una norma independiente de la plataforma.
  5. Las necesidades de los usuarios públicos, personal de referencia y conservación, y autores de los instrumentos de descripción, están dando prioridad al diseño de la norma, de modo que ninguna carga de implementación será asumida por aquellos usuarios más capacitados para tener la responsabilidad, a saber desarrolladores de DTD, autores de hojas de estilo, y personal técnico en el soporte de otras aplicaciones. Los diseñadores buscaron crear una DTD que fuese fácilmente dominada e incorporada a la producción rutinaria de instrumentos de descripción por personal que poseyera un conocimiento básico de SGML.

Características estructurales

  1. El esquema de codificación está basado en SGML (ISO 8879) en forma de DTD, denominada EAD (Encoded Archival Description)
  2. Se consultarán y emplearán como apropiadas las normas complementarias o relacionadas, tales como TEI, Directrices para la Codificación e Intercambio de Texto Electrónico, el formato MARC, ISAAR
  3. La norma de codificación consta de tres partes: una DTD conforme a SGML; una biblioteca de etiquetas que contienen las definiciones de los elementos y atributos, y ejemplos del uso de la etiqueta; y directrices de aplicación.
  4. Para asegurar la amplia aplicación internacional de la norma, se ha usado un lenguaje neutral en la construcción del modelo de datos. Para los nombre de los elementos, palabras tales como ’colección’, ‘archivos’ ‘series’ ‘fondos’, etc., se reemplazaron por términos genéricos como ‘unidad’ y ‘componente’ que no son específicos de ningún escenario individual o institución. El uso extensivo de los atributos en la DTD permite refinar el significado de los elementos en un contexto institucional o nacional específico.

Control y mantenimiento

El control y mantenimiento se garantiza por una agencia de mantenimiento que trabaja en concierto con comunidades archivísticas nacionales e internacionales, y con ayuda en la capacidad asesora por otros grupos de usuarios interesados.

Otro aspecto a destacar del proyecto se refiere a la codificación del modelo de datos que soporta la EAD, en el que se ha intentado codificar los instrumentos de descripción en formato MARC, pero con resultados variados. SGML es el mejor vehículo, ya que tiene la flexibilidad de manejar la estructura jerárquica compleja de los instrumentos de descripción y capturar la individualidad de los fondos únicos. También puede SGML facilitar acceso a los sustitutos informáticos de los elementos de los fondos. La disponibilidad en Internet de la completa información funcional del fondo y los sustitutos de los elementos promete un cambio brusco en el acceso y la conservación.

En las fases tempranas del desarrollo del proyecto se consideró usar el formato MARC como la base de la norma, puesto que era conocido y muchas instituciones intentaban usarlo para codificar instrumentos de descripción; pero se consideró que no era el mejor esquema disponible por tres razones principales:

  1. MARC era inadecuado porque los registros tenían una longitud máxima de 100.000 caracteres. La limitación en el tamaño es un obstáculo porque muchos instrumentos de descripción tienen una longitud mayor.
  2. Dificultad para representar la información estructurada jerárquicamente, debido a su limitado alojamiento. Ya que los instrumentos de descripción son documentos estructurados jerárquicamente, la estructura plana de MARC lo hace insatisfactorio.
  3. Cuestiones de mercado, es muy costoso llevarlo a cabo.

SGML es un marco o modelo prometedor para desarrollar un esquema de codificación para instrumentos de descripción por numerosas razones. No tiene los problemas del MARC mencionados anteriormente. SGML acomoda jerárquicamente la información interrelacionada en tantos niveles como se necesiten. No hay restricciones inherentes de tamaño en los documentos SGML. SGML es una norma internacional adoptada por una número creciente de instituciones gubernamentales, educativas, de investigación e industriales.

SGML no es en sí una norma de codificación de texto, sino una norma para desarrollar uniformemente normas para definir tipos o clases de documentos. En SGML una norma para un tipo o clase particular de documento se llama DTD. Cada comunidad que usa y comparte un tipo particular de documento debe asumir la responsabilidad de desarrollar un esquema de codificación específico para el tipo.

SGML trata de la designación de elementos lógicos, que son como los pilares de los documentos, y la interrelación de estos elementos. El prototipo DTD de SGML para instrumentos de descripción desarrollado en Berkeley especifica qué elementos lógicos se pueden presentar, con grados de especificidad variable, así como la interrelación de elementos. El marcado que designa los elementos que constituyen una clase de documento se llama marcado descriptivo; la codificación textual que usa marcado descriptivo frecuentemente se denomina ‘texto estructurado’ frente al texto ASCII que es llamado ‘texto plano’.

El marcado descriptivo de SGML posibilita la máxima flexibilidad en el uso del texto. La indexación y visualización, y formateo de impresión pueden ser controlados por el usuario del texto.

 

4. Proyectos de aplicación EAD cooperativos

The California Digital Library permite la búsqueda y hojeo de instrumentos de descripción de 13 instituciones diferentes de la nación y está expandiéndose para incluir más. Estos se ofrecen como documentos HTML usando el servidor DynaWeb de Inso.

Esta base de datos de instrumentos de descripción está constituida por Online Archive of California, American Heritage Virtual Archive, Museums and the Online Archive of California, y California Heritage Digital Image Access Project, que son cuatro proyectos complementarios para crear una base de datos online interrogable colectiva de instrumentos de descripción de colecciones de archivos.

A continuación se da una breve descripción de cada uno de los proyectos integrantes en el desarrollo de la base de datos conjunta:

The Online Archive of California Project

Es un proyecto piloto de dos años para desarrollar un prototipo de base de datos colectiva de 30.000 páginas de datos de instrumentos de descripción de archivos codificados usando la EAD. Esta base de datos servirá como sustrato para el desarrollo de un archivo digital de gran escala en el Sistema de la Universidad de California asequible vía Internet a diversas comunidades de usuarios.

Para facilitar el desarrollo del prototipo de base de datos, los participantes en el proyecto han creado plantillas genéricas y personalizadas para usar durante el proceso de codificación.

En la Planning Conference on UC Implementation of EAD celebrada en UCLA en 1995, EL Consejo de Archivos de UC, UC Heads of Special Collections, varios sistemas bibliotecarios, y representantes de UC Division of Library Automation, Stanford, USC, y otros unánimemente acordaron que el proyecto piloto jugaría un papel crítico en facilitar la rápida implementación de las nueva norma por las bibliotecas de investigación en California.

El objetivo global del proyecto es el desarrollo de un juego de herramientas de implementación y un prototipo de base de datos colectiva, suministrando un banco de pruebas para evaluar la efectividad de la EAD, la norma emergente para instrumentos de descripción archivísticos electrónicos, como esquema de codificación para una base de datos colectiva que suministra acceso integrado a los fondos de archivo de todas las unidades de archivos universitarios y colecciones especiales de UC.

American Heritage Virtual Archive Project

Es un proyecto en colaboración entre la Universidad de California (Berkeley), Stanford University, Duke University, y University of Virginia diseñado para explorar factores intelectuales, políticos, técnicos y económicos implicados en la creación y mantenimiento de una base de datos compartida de instrumentos de descripción EAD de representaciones digitales de los elementos descritos en tales instrumentos de ayuda. El proyecto se centra en colecciones que documentan la historia y la cultura americana.

Para los sitios participantes en el proyecto se disponen copias de borradores de las directrices de aplicación de la EAD y la biblioteca de etiquetas; las directrices de conversión retrospectiva, como suplemento a las directrices de la SAA ; plantillas ; y otra información y herramientas relacionada con el proyecto.

 

Museums and the Online Archive of California

Con ests proyecto se indaga en uno de los más serios problemas con los que se encuentra los buscadores de conocimiento en cualquier lugar, la distribución geográfica y el acceso limitado a las colecciones de materiales únicos - fuentes primarias para la investigación en todas las áreas de la herencia cultural de California- que están alojados en bibliotecas, museos y archivos en todo el mundo. Se propone resolver este problema creando un prototipo de ‘archivo de museo virtual’ que integre instrumentos de descripción normalizados para museos y colecciones especiales de bibliotecas en una única fuente, suministrando así acceso a las colecciones contenidas en los archivos, bibliotecas y museos de todas partes del estado de California.

Se creará este prototipo en una base de datos de instrumentos de descripción, conjunta y online, ya existente, la OAC, que se está desarrollando como recurso principal para el público, colegios, y universidades, posibilitando una educación e investigación interdisciplinaria.

El prototipo MOAC constará de instrumentos de descripción EAD para 20 colecciones, que incluyen 35.000 imágenes y registros de elementos. Siete museos se unirán a Bancroft Library en el desarrollo del banco de pruebas. Esta abundancia de conocimiento cultural de las colecciones contenido en los museos de antropología, arte e historia de California enriquecerá OAC como recurso para la investigación y educación. Los instrumentos de descripción EAD de MOAC suministrarán la descripción necesaria para la búsqueda de información y navegación en Web para acceder a la información a nivel de elemento y de colección.

El prototipo se usará como banco de pruebas para la implementación de la EAD de museos, y como tal, será uno de los primeros proyectos en colaboración a gran escala que intente cubrir el vacío existente entre museos, archivos y bibliotecas suministrando acceso normalizado a sus colecciones en la misma base de datos colectiva.

Este proyecto también intenta crear un modelo para otros proyectos de desarrollo de normas de acceso en colaboración para bibliotecas y museos.

Otro objetivo del proyecto es usar el banco de pruebas para demostrar que el uso de la norma EAD puede ayudar a los museos a conseguir la máxima economía en la creación y conservación de información digital, así como la interoperatividad y permanencia de esta información. El proyecto diseña su flujo de trabajo de manera que se pueda acomodar a diferentes tipos de instituciones, los que son tecnológicamente ricos y los que no lo son. El modelo también probará y comparará los modelos centralizados y descentralizados para la creación de datos y el suministro de acceso a recursos en red. El proyecto prolongará el trabajo previo de desarrollo en normas llevadas a cabo en comunidades de bibliotecas y museos para establecer una colaboración sinergética.

También desarrolla un método para numeración única de objetos digitales (registros individuales, imágenes, instrumentos de descripción) de las colecciones de museos de manera que puedan ser gestionados rigurosamente en un entorno de red sin miedo a la duplicación.

The California Heritage Collection, es un archivo digital que contiene fotografías, imágenes, y manuscritos de 160 colecciones aproximadamente en la Bancroft Library. Es el resultado de el California Heritage Digital Image Access Project. The California Heritage Collection proporciona acceso al nivel de colección a más de 28000 representaciones digitales de materiales de fuentes primarias que documentan la historia de California a través de los instrumentos de descripción EAD. Mediante este sistema prototipo, un investigador puede usar Pathfinder, el interfaz del Web para el catálogo online de Berkeley, para acceder selectivamente a los recursos de historia de California desde la Bancroft Library. Un usuario que encuentra un registro a nivel de colección en Pathfinder que tenga un instrumento de descripción asociado puede recuperar el instrumento de descripción pulsando sobre la localización URL subrayada.

El investigador usa un visualizador para navegar a través de los instrumentos de ayuda afines, que incluye pequeñas imágenes en la línea que representan imágenes completas o grupos de imágenes. Pulsando sobre el icono o la imagen en la línea se suministrará la visualización completa de la imagen o imágenes asociadas. Los instrumentos de descripción se ofrecen como ficheros HTML convertidos, en la transferencia, desde ficheros SGML vía el servidor DynaWeb de Inso.

5. Proyectos de aplicación en Europa

La implantación de la norma en el ámbito europeo es mucho menor que en el americano, pero son significativos los esfuerzos que se están llevando a cabo en el campo archivístico, sobre todo teniendo en cuenta que se ha empezado a trabajar en este campo unos años más tarde. A continuación vemos algunas muestras de lo que se está realizando.

Durham University Library

Los instrumentos de descripción codificados EAD de las Colecciones Especiales y Archivos de la Biblioteca Universitaria Durham están disponibles en formato SGML o HTML. Usando browser Web estándar es posible ver una lista actual disponible de guías online, o seguir el enlace desde la descripción de la colección a guías individuales. El sitio Durham usa el sistema Dynaweb para convertir los ficheros EAD SGML a HTML en la transferencia, y detectar si el browser soporta los marcos antes de formatear los resultados. También se suministra acceso directo a los usuarios de Panorama. Están disponibles aproximadamente cien instrumentos de descripción.

 

Public Record Office

The Public Record Office (PRO) estableció el Core Executive Project para dar acceso a los instrumentos de descripción de los registros seleccionados de los departamentos de política central del Gobierno Británico desde 1916, como parte del Programa AD2001 de PRO. Al proyecto de instrumentos de descripción online se le quedó pequeña la estructura de la Guía impresa PRO; se formularon propuestas para reestructurar la guía y normas para los datos, y se estableció una jerarquía de nivel siete de la EAD compatible con la ISAD (G), la norma internacional para descripción archivística. Tiene la particularidad de ofrecer juntas las historias administrativas de los creadores del registro con las descripciones de los registros propiamente: actualmente estos elementos están separados en el formato impreso.

Ya está disponible los instrumentos de descripción de los registros de los tres departamentos. La guía de los registros del Departamento de Asuntos Económicos fue codificada primero como proyecto piloto. También se ha llevado a cabo el instrumento de descripción que cubre los registros de la Oficina del Primer Ministro.

Los instrumentos de descripción están disponibles en SGML original y también en versiones HTML creadas sobre la marcha desde el original SGML usando DynaWeb de Inso.

University of Liverpool Special Collections

En este sitio están disponibles dos instrumentos de descripción

El primero una guía de los documentos Glasier, disponible en dos versiones codificadas usando EAD: una lista básica y una lista que incluye un índice de nombres de los registros; estas versiones SGML requieren el visor Panorama. Una tercera versión de la lista, codificada con USMARC-AMC y EAD, está disponible en una base experimental usando el sistema de recuperación de información Cheshire. La versión Cheshire solo trabaja con versiones 3 y 4 de Netscape.

El segundo instrumento de descripción, consta de bases de datos de índices de la Colección Scott Macfie, por el momento sólo está en formato SGML. Es un primer borrador de los índices para las fotografías, impresos, ilustraciones, material audiovisual, manuscritos, de la Colección, y parte de la colección de los recortes de prensa. En breve se añadirán los índices para otras áreas de la colección y los índices de los archivos de la Gypsy Lore Society.

University of Warwick,

El Modern Record Centre de la Universidad de Warwick está comenzando a poner sus instrumentos de descripción en forma electrónica. El primer instrumento de descripción para codificar en EAD fue el catálogo del National Union of Press Telegraphists (MSS.39/PT). Está disponible una versión HTML además de la versión SGML que se puede visualizar usando Panorama.

 

6. Situación de la DTD EAD

El desarrollo de la DTD EAD como instrumento de descripción, comenzó en la Universidad de California, Berkeley, bajo la dirección de Daniel Pitti, cuya denominación en su origen fue FINDAID DTD, y en el mismo marco en que se adoptan los Acuerdos de Ann Arbor se produce el cambio de denominación definitiva a EAD DTD.

Desde la versión alpha de 1996 hasta la versión 1.0 publicada en agosto de 1998 la EAD ha sufrido una serie de revisiones para ir perfilándola y adaptándola a las necesidades de las instituciones y exigencias en la funcionalidad de los instrumentos de descripción, todo ello basándose en la constante prueba y evaluación de los distintos proyectos que implementan la norma (véase anexo 1). Para facilitar esta tarea se ideó la elaboración de unas plantillas, generales o personalizadas, para codificar más fácilmente los instrumentos de descripción.

Acceso a instrumentos de descripción EAD a través de Internet

Teniendo en cuenta que a través de un navegador WWW no podemos visualizar adecuadamente documentos SGML, se han establecido unos mecanismos para facilitar el acceso a los instrumentos de descripción.

Así nos encontramos con Panorama, una de las soluciones que consiste en añadir al navegador un programa o plug-in que se encarga de hacer las transformaciones necesarias para visualizar los documentos SGML a través del navegador que visualiza documentos HTML. Este plug-in para visualización SGML en Internet trabaja en línea para Netscape Navigator, aunque pronto estará disponible para Microsoft Internet Explorer 4.0

Panorama tiene características que mejoran el proceso de visualización y visualiza documentos SGML usando el browser del Web, Con la hoja de estilo de Panorama los usuarios pueden tener más control sobre la visualización de sus documentos, especificando fuentes, tamaño de fuente, color y otros atributos; también los usuarios pueden añadir notas comentarios a sus documentos SGML.

Aunque para aplicar este plug-in existen unos mínimos requerimientos técnicos, a saber, Windows95/NT, procesador 80486 a 33 Mhz, con 8 MB de RAM y 7 MB de disco duro.

Para conseguir una copia gratuita de Panorama nos podemos dirigir al sitio más cercano que están en Europa y volcarlo a nuestra máquina vía ftp://ftp.softquad.co.uk/pub/products/panorama/windows/viewer/pv2eval.exe

Otra de las soluciones que se han establecido es la conversión en la transferencia, en este caso la conversión se inicia desde el servidor, el software del servidor contempla un proceso de transformación de código SGML en HTML, aunque este método presenta el inconveniente de la pérdida de capacidad de búsqueda respecto al original; entre los software más utilizados en este sistema está DynaWeb de Inso.

 

 

Codificación EAD

Para la creación de las descripciones de archivo codificadas se necesitan varios ficheros SGML y documentos de apoyo, la mayoría de los ficheros están disponibles electrónicamente vía FTP en el servidor de la Library of Congress (ftp.loc.gov) y son los siguientes:

eadsgml.dcl

ead.dtd

eadgrp.dtd

eadbase.ent

eadnotat.ent

eadchars.ent

Los documentos tales como la biblioteca de etiquetas EAD actualmente están disponibles solo en forma impresa disponibles en la SAA, y facilita en gran medida el uso de la EAD. Otra documentación que también se puede necesitar son las directrices de aplicación y la guía de uso.

Para facilitar la tarea de codificación de los instrumentos de descripción se idearon unas plantillas, que pueden ser generales o específicas para un instrumento de descripción, para ello contamos con un generador de plantillas EAD, concebido para la conversión retrospectiva de los instrumentos de descripción existentes; el generador está pensado para producir la base de una instancia completa de instrumento de descripción, que incorporará, donde corresponda, el título de la colección del archivo, la fecha de la unidad, el nombre del codificador, así como el procesador y el autor del instrumento de descripción; insertará notas de alcance y contenido y biografías en los instrumentos de descripción con todos los párrafos correctamente cercados por etiquetas <p>; incluso puede tomar una biografía cronológica y dividirla en pares de etiquetas de fecha <date> y acontecimiento <event> envueltas en un elemento <chronlist>.. Después de almacenar la instancia generada se debe abrir el fichero en el editor SGML y completar el instrumento de descripción creando una lista contenedora. Además se deberán añadir las etiquetas o secciones que no contempla el generador de la plantilla, tales como enlaces externos u otros.

El generador se implementa a través de un fichero de configuración que controla la apariencia de las formas de entrada, el número de controles y lo que hace cada control; el fichero de configuración también contiene el texto de la plantilla EAD que se usa en la institución. Además tiene la posibilidad de crear un fichero de configuración con características específicas.

Las plantillas están divididas en dos secciones, el panel de control y las ventanas de entrada de texto, a las que se accede desde los botones situados en el apartado ‘Insert Section’. Existen unas instrucciones simples para rellenar correctamente estas plantillas.

Modelos de plantilla EAD: véase anexo2

 

7. Fuentes de información

8. Anexos

Anexo 1: Cuadro cronológico de la evolución de la DTD EAD

Fecha

Acontecimientos

1993

Inicio del proyecto, bajo la dirección de Pitti. Requerimientos de la norma y elección de SGML para su codificación

Marzo1995

DTD FINDAID desarrollada sobre la base de los ejemplos suministrados por los archiveros a Berkeley

Julio 1995

Establecimiento de los principios del diseño de la norma en los Acuerdos de Ann Harbor .

DTD EAD, denominación definitiva de la norma

Agosto 1995

Reunión anual SAA. Presentación EAD

Grupo de trabajo EAD con representación de LC, RLG, OCLC entre otros

Agencia de mantenimiento de la norma. Library of Congress

Octubre 1995

Pitti distribuye versión para la primera implementación

Revisión del modelo de datos

Enero 1996

Versión alpha de la EAD, tras la revisión de la versión, de la librería de etiquetas y de las directrices de aplicación

LC dispone en Internet la EAD DTD y su documentación.

Interés internacional en SGML, especialmente en Europa.

Abril 1996

Reunión para reafirmar los principios básicos, identificar modificaciones DTD, y discutir el estilo y contenido de la documentación de apoyo.

Diciembre 1996

Versión beta, publicada tras la revisión y modificación de la versión alpha

Noviembre 1997

Reunión grupo de trabajo para mejorar la DTD destacando las relaciones con otros formatos, que dará lugar a la versión 1.0

Agosto 1998

Publicación versión 1.0 EAD, considerada como DTD de SGML/XML

 

Anexo 2: Modelos de plantilla EAD

Modelo 1: plantilla normalizada de los Archivos Universitarios de la Universidad de California

img001.gif (6092 bytes)

I

A continuación de este primer cuadrante se recogen la estructura de las secciones contempladas en el apartado ‘insert section’, que es la misma para todas excepto para ‘series description’ el modelo es el siguiente:

img1002.gif (656 bytes)

Para la descripción de serie la plantilla establece una estructura diferente al resto de las secciones, y para cuantas series sean necesarias (en este modelo hay 15 apartados idénticos de descripción de serie):

img1003.gif (2826 bytes)

 

Modelo 2: Plantilla genérica

img1005.gif (4658 bytes)

El resto de la plantilla mantiene la misma estructura que la del modelo 1, y en ésta también se reflejan quince series

Como se puede apreciar la plantilla específica y la genérica son prácticamente iguales, la diferencia se produce en el panel de control, al incorporar distintas secciones y en los campos de información relativos al instrumentos de descripción; estas especificaciones se pueden realizar a través del generador de plantillas EAD.

 

 

Glosario de abreviaturas

EAD: Encoded Archival Description

DTD: Document Type Definition

HTML: HyperText Markup Language

MOAC: Museums and the Online Archive of California

OAC: Online Archive of California

PRO: Public Record Office

SAA: Society of American Archivist

SGML: Standard Generalized Markup Language

UC: University of California

URL: Uniform Resource Locator