Om Marcus2Oria

Digitale fulltekstarkiv integrasjon søk (NB 2014/377) er en fortsettelse på Digitale fulltekstarkiv med den hensikt å få Universitetsbiblioteket i Bergen sin digitale satsing Marcus inn i Oria, søkemotor for Bibsys konsortiet.

Søknaden spesisiferer også at prosjektet skal gjøre det lettere for andre å ta inn sine lokale samlinger i Oria. Dette er reflektert i dokumentasjonen av prosjektet, samt i hvordan enkeltmodulene prosjektet består av kan gjenbrukes hver for seg.

Deltagere i prosjektet er Seksjon for Digitale System og Tjenester ved Universitetsbiblioteket i Bergen og Bibsys.

Prosjektet består av en ant fil som kjører modulene, et RelaxNG skjema, som beskriver Primo Normalized XML (PNX), som vi også bruker for validering av poster samt kode-generering og et sett med xslt 2.0 stilark som gjør enkeltoppgavene: spørre etter data fra marcus sitt åpne endpoint, kjøre ut resultatet av spørringen som PNX, sjekke forskjeller mellom høstinger og oppdeling av resultat til mindre xml-filer som kan håndteres av Primo.

En demonstrasjon av kode kan klones fra github . og kjøres på et system der ant er installert.

git clone https://github.com/ubbdst/marcus2oria.git
cd marcus2oria
ant

en vil da få ut 2 dokumenter av hver klasse i marcus som kjøres igjennom hele systemet og returnerer ut en tar.gz fil.

For å gjennomføre prosjektet har vi brukt følgende biblioteker som ligger i./lib: jing ant task som er en task for validering av xml basert på RelaxNG, Saxon9.6 HE, og Saxon9B (for refleksiv bruk av java i xslt for sammenligning av poster).