Innhold:
From: Annike Selmer <annike.selmer@nbr.no> To: bibliotek <bibliotek@rbt.no>, folkebib-nett <folkebib-nett@bibtils.no> Subject: Foreløpig invitasjon til Dublin Core-seminar 26.10.98 Date: Fri, 19 Jun 1998 15:08:55 +0200BIBSYS og Nasjonalbiblioteket inviterer til Dublin Core-seminar mandag 26. oktober 1998 kl. 10-17 i Ingeniørenes hus i Oslo.
Dublin Core Metadata Element Set, forkortet til Dublin Core, er et enkelt og fleksibelt format for dokumentbeskrivelse utviklet med henblikk på å lette gjenfinning av elektroniske dokumenter distribuert via internett.
Formatet har sitt navn etter Dublin i Ohio, USA, der utviklingen startet i 1995. Formatet har på kort tid fått stor internasjonal utbredelse og består av 15 beskrivelseselementer (som f.eks. forfatter, tittel, emne, informasjonsbærer osv.). En bærende idé bak utviklingen er at formatet skal være så enkelt at forfatter eller utgiver av en elektronisk publikasjon selv kan utforme beskrivelsen og integrere den i selve dokumentet.
For mer informasjon om Dublin Core, se:
http://www.bibsys.no/meta/ ellerMålsettingen for seminaret er å gi en bred presentasjon av Dublin Core og formatets anvendelsesområder samt presentere en del prosjekter og tiltak basert på utnyttelse av Dublin Core i Norge og i våre naboland.
http://purl.oclc.org/metadata/dublin core/
Seminaret er rettet mot enkeltpersoner og institusjoner som er involvert i produksjon, distribusjon og formidling av elektroniske publikasjoner og informasjon via internett: forfattere, forlag, bibliotek, forskningsinstitusjoner, mediaprodusenter, nettverksdistributører, offentlig forvaltning, organisasjoner, etc.
Endelig invitasjon vil bli sendt ut i august.
For ytterligere informasjon om seminaret kan man henvende seg til Annike Selmer i Nasjonalbiblioteket: tlf: 22 55 33 70 eller e-post: annike.selmer@nbr.no.
Annike Selmer Nasjonalbiblioteket Postboks 2674 Solli, 0203 Oslo Besøksadresse: Bygdøy Allé 21 telefon: 22 55 33 70 telefaks: 22 55 38 95Er det noen likhet mellom Dublin Core og keiserens nye klær ?
To: bibliotek@rbt.no, folkebib-nett@bibtils.no Subject: Re: Foreløpig invitasjon til Dublin Core-seminar 26.10.98 Date: Mon, 22 Jun 1998 11:03:03 +0200 From: Knut Hegna <knuthe@ifi.uio.no>
Jeg forstår "metadata", ikke som katalogposter, men som kvalifiserte data (felt) knyttet til et elektronisk dokument. Metadata i denne forstand er nyttig og bra og kan i visse tilfeller være til hjelp når man skal innlemme et elektronisk dokument i sin samling og i sin katalog. Det er MULIG at metadata kan bidra til å forbedre gjenfinning i de store søkemaskinene, men forbedret gjenfinning bestemmes ikke bare av at det fins kvalifiserte data (forfatter, tittel, emne etc), men også av HVILKE felt som tas i bruk og HVORDAN de er utfylt (konsistens).
Formater for metadata fins det flere av. Dublin Core er ETT slikt metadataformat.
Jeg syns det virker nokså snevert når Nasjonalbiblioteket nå inviterer til et promoteringsseminar for Dublin Core uten å ta opp bibliotekfaglige innvendinger mot dette og å presentere andre metadataformater som er mer gjennomarbeidet.
Hva med å utfordre Den norske katalogkomite på dette emnet?
En ny, nokså nøktern vurdering av metadata (Dublin Core inklusive) fins i en rapport fra en underkomite i American Library Association (ALA), se "Task Force on Metadata and the Cataloging Rules":
http://www.ala.org/alcts/organization/ccs/ccda/tf-tei2.html
Med hilsen -- Knut Hegna Førstebibliotekar | Senior academic librarian Universitetet i Oslo | University of Oslo, Informatikkbiblioteket | Informatics libraryBakgrunn for Dublin Core seminaret
From: "Annike Selmer" <annike.selmer@nbr.no> To: <knuthe@ifi.uio.no> Cc: <bibliotek@rbt.no>, <folkebib-nett@bibtils.no> Subject: Bakgrunn for Dublin Core seminaret - svar til Kunt Hegna Date: Mon, 29 Jun 1998 15:48:39 +0200
At Nasjonalbiblioteket nå ønsker å rette søkelyset på metadataformatet Dublin Core ved å arrangere et faglig seminar har blant annet sammenheng med et initiativ fra CENL (Conference of European National Librarians) samt at nasjonalbibliotekene i våre naboland (Danmark, Sverige og Finland) har igangsatt prosjekter basert på bruk av Dublin Core.
Nasjonalbiblioteket er fullt innforstått med at verken Dublin Core eller andre metadataformater kan erstatte tradisjonelle katalogdataposter i bibliotekkataloger eller nasjonalbibliografiske databaser, men vi kan ikke lukke øynene for at nasjonal bibliografisk kontroll av informasjonsressurser av det omfang som internett representerer, krever nye tilnærmingsmåter i tillegg til den tradisjonelle nasjonalbibliografien.
Nasjonalbiblioteket har ingen interesse i å undertrykke bibliotekfaglige innvendinger, men vi har et ansvar for å bidra til tiltak og løsninger som kan gjennomføres på et nasjonalt plan og som i størst mulig utstrekning fremmer samarbeid på tvers av landegrensene. At mange nasjonalbibliotek har fattet interesse for Dublin Core skyldes vel blant annet at formatet både er generelt og enkelt, i motsetning til en del andre formater som til dels er temmelig kompliserte, eller utviklet med henblikk på spesielle anvendelsesområder.
Vennlig hilsen Bendik RugaasTakk for svaret !
To: Annike Selmer <annike.selmer@nbr.no> Cc: bibliotek@rbt.no, folkebib-nett@bibtils.no Subject: Dublin Core : bibliografisk kontroll Date: Tue, 30 Jun 1998 12:31:20 +0200 From: Knut Hegna <knuthe@ifi.uio.no>
Jeg skulle gjerne fulgt opp dette, men Rugaas bringer inn et begrep som jeg først vil vite hva betyr : "nasjonal bibliografisk kontroll". Siden dette er sentralt i hans innlegg vil jeg gjerne ha svar på 2 spørsmål:
1) Hva er "bibliografisk kontroll" ?
2) Hva tar man sikte på å kontrollere ?
Svarene på disse spørsmålene, sammenholdt med hva Dublin Core er, kan også gi svar på om Dublin Core er egnet til "nasjonal bibliografisk kontroll".
Jeg har spurt forskjellige bibliotekarer hva som ligger i uttrykket "bibliografisk kontroll". Jeg har fått forskjellige svar. Jeg syns ikke jeg finner gode svar på dette i litteraturen.
Det kan være interessant å få vite hva Nasjonalbiblioteket legger i dette (kanskje de to bibliografiske avdelingene kan komme med hvert sitt svar ?).
Mens jeg venter på svaret på ovenstående:
Litt om ordet "metadata":
Jeg syns definisjonen (som jeg selv har brukt en gang) "data om data" er nokså intetsigende. Jeg forsøkte i forrige innlegg å presisere det til "data om data i data", dvs kvalifiserende opplysninger om dokumentet hektet på dokumentet selv, slik at data og metadata utgjør en enhet.
Det er i en slik sammenheng det - etter min mening - er interessant å diskutere "metadata". Det skiller det også fra en katalogpost, som også er "data om data", men som er skilt fra dokumentet og inngår i en ganske annen helhet (katalog).
Av dette utleder jeg også at metadata er dokument- orientert, mens en katalogpost er samlingsorientert.
Noen få ord om Dublin Core:
I starten (1995/6) var Dublin Cores formål å legge grunnlaget for bedret søk i søkemaskinene (Alta Vista etc). Initiativet kom - så vidt jeg vet - fra IT-hold. De hadde oppdaget at geniale metoder for fritekstsøk ikke var tilstrekkelig i de store mengdene med data som søkemaskinene etterhvert inneholdt. Det trengtes kvalifiserte data knyttet til den elektroniske informasjonen, mente de. Derfor satte de i gang med å finne opp hjulet på ny. De viktigste svakhetene ved Dublin Core i forhold til kunnskapsorganisatoriske prinsipper er etter min mening
De fleste jeg diskuterer med er enige i at Dublin Core står langt fra de kvalitetene man forlanger av en katalogpost og at de ikke kan sammenliknes.
For målet er jo også helt forskjellig.
For bibliotekkatalogene har svake metadata (som Dublin Core) bare interesse som "formelle opplysninger på fremtredende plass", de må bearbeides før de kan brukes i en bibliotekkatalog. På den annen side kan bibliotekene produsere gode metadata ut fra sine kataloger (og regler) som gir konsistens. Men her ville det være en nedtur å lage Dublin Core data, det fins mer avanserte, f.eks. MARC. MARC er riktignok upopulært, men det fins andre også f.eks SGML DTD-er som implementerer MARC.
Så hva skal da Nasjonalbibliotekets siktemål med Dublin Core være ? Å få forleggere til å legge Dublin Core metadata på sine elektroniske dokumenter ? Av innbydelsen til seminaret går det fram at den rettes til bl.a forleggere. Det er blitt meg fortalt at den norske katalogkomiteen for noen år siden gjorde forlagene oppmerksom på at det fantes en ISO-standard for utforming av tittelbladet (metadata) i bøker. Det førte ikke til noe, bortsett fra en som ville ha seg frabedt katkoms forsøk på innblanding.
Til slutt:
Jeg er ikke bibliotekar eller katalogisator, og jeg finner det noe underlig å befinne seg i en posisjon der drevne bibliotekarer med faglig innsikt heller skulle vært.
Men nå senker jeg snart lansen (legger musen død), river av meg den blanke rustningen (logger ut) og drar på ferie (skrur av strømmen). Så får de som ønsker utdyping av mitt syn på metadata og Dublin Core, lese her:
http://www.ifi.uio.no/~knuthe/bergen/foredrag.htmli tillegg til den referansen jeg ga i forrige innlegg:
http://www.ifi.uio.no/~knuthe/dok/NBF98.html
http://www.ala.org/alcts/organization/ccs/ccda/tf-tei2.html
Vennlig hilsen og god sommer.
"Kunt"
-- Knut Hegna Førstebibliotekar | Senior academic librarian Universitetet i Oslo | University of Oslo, Informatikkbiblioteket | Informatics library http://www.ifi.uio.no/~knuthe/Knut Hegna spør
From: Helge Høivik <helge.hoivik@jbi.hioslo.no> To: Annike Selmer <annike.selmer@nbr.no>, Knut Hegna <knuthe@ifi.uio.no> Cc: bibliotek <bibliotek@rbt.no>, folkebib-nett <folkebib-nett@bibtils.no> Subject: Definisjoner av "bibliografisk kontroll" Date: Wed, 1 Jul 1998 12:09:09 +0200
>>Hva er "bibliografisk kontroll" ?
Jeg er også på jakt etter et godt svar, men har (foreløpig) denne arbeidsdefinisjonen:
"Bibliografisk kontroll er kunsten å organisere tekster slik at de kan gjenfinnes og omfatter disipliner som katalogisering, indeksering, klassifisering, tesauruskonstruksjon m.v."
Helge Høivik
From: "Morten Haugen" <orland@online.no> To: "Helge Høivik" <helge.hoivik@jbi.hioslo.no>, "Annike Selmer" <annike.selmer@nbr.no>, "Knut Hegna" <knuthe@ifi.uio.no> Cc: <bibliotek@rbt.no>, <folkebib-nett@bibtils.no> Subject: SV: Definisjoner av "bibliografisk kontroll" Date: Wed, 1 Jul 1998 12:54:44 +0200
Definisjonen virker grei og dekkende for en praktiker ute på landet, selv om den krever en fire-fem supplerende definisjoner for å forstås av andre. Spesielt ville jeg nok ha utdypet "gjenfinnes", dersom det var mitt jobb å lage en definisjon.
Om man vil kalle det er "kunst" er vel også et åpent spørsmål ... 8-)
Med vennlig hilsen
__________________________________________ Morten Haugen, Ørland folkebibliotek, 7130 Brekstad Tlf 72 52 42 72 ; Fax 72 52 53 10 epost: orland@online.no __________________________________________ "If you can bear to hear the truth you've spoken twisted by knaves to make a trap for fools" (Kipling)Helge Høivik ga følgende «arbeidsdefinisjon»
Date: Wed, 1 Jul 1998 14:28:43 +0200 (MET DST) To: Helge Høivik <helge.hoivik@jbi.hioslo.no> From: Randi Meyer <randi.meyer@ub.uio.no> Subject: Re: Definisjoner av "bibliografisk kontroll" Cc: bibliotek@rbt.no
"Bibliografisk kontroll er kunsten å organisere tekster slik at de kan gjenfinnes og omfatter disipliner som katalogisering, indeksering, klassifisering, tesauruskonstruksjon m.v."
Hvorvidt det å organisere en tekst er en kunst eller ikke, skal være usagt, men det er ikke bibliotekarene som gjør det (det måtte i så fall være Fredrik Skagen).
Hvis du organiserer en tekst, går du inn i teksten og redigerer den, det vi arbeider med er den formelle beskrivelsen av dokumenter.
Randi Meyer
Randi Meyer Konverteringsseksjonen, UBO 0242 Oslo 22 85 92 94Som en kommentar til Knut Hegnas to innlegg på listen med spørsmål om hvorfor nasjonalbiblioteket "ensidig" ønsker å fremme bruken av Dublin Core (DC), vil jeg forsøke å redegjøre for Nasjonalbiblioteket, avd. Ranas motiv.
From: Hilde Hogas <hilde.hogas@nbr.no> To: bibliotek@rbt.no, folkebib-nett@bibtils.no Date: Wed, 1 Jul 1998 15:19:36 MET Subject: Dublin Core
NB Rana har ansvar for alt pliktavlevert norsk materiale, også elektroniske dokument. Vi har i flere år arbeidet fra flere innfallsvinkler med dette materialet - innsamling, bevaring og formidling. En av oppgavene er bibliografisk registrering av det pliktavleverte materialet. I denne forbindelse er metadata interessant for oss fra et helt praktisk utgangspunkt, nemlig å forenkle registreringsarbeidet og å forbedre grunnlaget for det. Vi ser ikke for oss at DC skal "ta over" for MARC-format og katalogiseringsregler.Her ligger vår helt praktisk tilnærming til "nasjonal bibliografisk kontroll" - bibliografisk beskrivelse med den hensikt å holde oversikt over norske utgivelser og å sikre gjenfinning av dem.
Vi ser for oss to mulige gjenfinningsmodeller for elektroniske dokument og begge kan tjene på bruken av metadata. 1) Tradisjonell bibliografisk beskrivelse, f.eks. i BIBSYS. Her vil vi ha nytte av metadata som grunnlag for registreringen og da helst i form av en konvertering mellom f.eks. DC og BIBSYS-MARC. Takket være arbeidet i Nordisk metadataprosjekt (http://linnea.helsinki.fi/meta/) er dette nå mulig. 2) På lengere sikt kan vi tenke oss pliktavlevering av elektroniske dokument i retning av en mer total nedlasting av hele det norske "vevområdet". En slik modell vil gjøre det umulig å katalogisere hvert enkelt dokument i f.eks. BIBSYS og da vi vil bli totalt avhengige av automatiske gjenfinningsmetoder. Her vil også metadata, f.eks. DC gi grunnlag for en bedre og mer presis gjenfinning.
NBR deltar for tiden i det EU-finansierte prosjektet BIBLINK (http://hosted.ukoln.ac.uk/biblink/). Målet med dette prosjektet er nettopp å prøve ut bruken av metadata for å forenkle den bibliografiske registreringen av elektroniske dokument. Planen er å påvirke utgivere (flere utgivere er knyttet til prosjektet) til å levere metadata "om" sine elektroniske dokument til "sitt" nasjonalbibliotek. Nasjonalbiblioteket skal deretter konvertere metadatapostene til MARC-format og hente dem inn i eget biblioteksystem, f.eks. BIBSYS. Her kan man bruke nasjonalbibliotekets bibliotekfaglige ekspertise til å forbedre kvaliteten på den bibliografiske posten. Deretter kan MARC-posten konverteres tilbake til en metadatapost og returneres til utgivere som ønsker å inkludere en "kvalitetssikret" metadatapost i sitt elektroniske dokument ved utgivelse. Prosjektet har altså som mål å oppnå 1) en forenkling av arbeidet registrering av elektroniske dokument på nasjonalbiblioteket, ikke minst ved å få tilgang til flere og sikrere opplysninger om dokumentet enn det som ofte er tilfelle i dag og 2) å "spre" ideen om bruk av metadata på elektroniske dokument.
Dette er i seg selv ikke argumenter akkurat for DC og valget trenger derfor en smule begrunnelse.
I BIBLINK-prosjektet er DC valgt som metadataformat etter en lang og grundig utredning: "Study of metadata" som også finnes på prosjektets vevside. Konklusjonen er at DC er tilstrekkelig utbredt og godt nok til å passe den typen elektroniske dokument som er aktuelle i prosjektet, nemlig et utvalg av elektroniske dokument som normalt fortjener en registrering i nasjonalbibliografien. I prosjektet vil vi legge til noen felter som ikke finnes i DC, f.eks. utgiversted og pris. Gjennom arbeidet med BIBLINK, i samarbeid med flere andre nasjonalbibliotek i Europa, føler vi oss rimelig trygge på at DC er godt valg i forhold til de praktiske oppgavene vi står overfor. Vi har selvfølgelig også fulgt med i det arbeidet som har vært gjort i Nordisk metadataprosjekt (hvor også DC er valgt som metadataformat).
I diskusjonen omkring metadata og DC er spørsmålet om hvor spesifikt og dekkende formatet skal være sentralt. Formatet bør helst både være så enkelt at "allmuen", dvs. ikke-bibliotekfaglig personale kan hanskes med det, samtidig som man i bibliotekene kunne ønske seg noe bortimot et komplett MARC-format. Det sier seg selv at dette ikke lar seg kombinere (og det er selvfølgelig ikke ønskelig å finne opp kruttet, dvs. MARC-format på nytt). BIBLINK prosjektet prøver seg på en løsning der nasjonalbiblioteket skal forbedre dataene, først og fremst for eget bruk, men også for å "hjelpe" utgiverne til å inkludere metadata med høy kvalitet i sine dokument. Det gjenstår å se om prosjektet lykkes.
Jeg er helt enig i at DC ikke har den kvaliteten man må forlange av en katalogpost, det skorter både på form og kontroll av innhold. Noe av dette kan avhjelpes med gode retningslinjer for bruk (og ev. utvidelser), men man må samtidig passe seg for at det ikke blir for komplisert. Her har igjen Nordisk metadataprosjekt gjort et godt arbeid, bl.a med å lage en "metadatagenerator" (http://www.lub.lu.se/cgi-bin/nmdc.pl) som vil hjelpe utgivere til å lage gode metadata på en relativt enkel måte. Jeg tror at DC-poster først og fremst vil bli laget ved hjelp av slike verktøy og at det her er mulig å bake inn hjelpefunksjoner og retningslinjer som forbedrer kvaliteten på DC-posten, f.eks. emneord og anbefalt registreringsmåte for personnavn.
Det er mulig at det er like vanskelig å overbevise utgivere om at det er lurt å knytte metadata til dokumentene sine som det var å få dem til å lage standardiserte tittelsider, men det kan også hende at det er noe enklere. En skulle tro at utgivere er opptatt av at dokumentene de lager skal kunne spres til mange og dermed vil de ha en egeninteresse i god gjenfinning av dem.
Vi har bevisst gått inn for å rette dette seminaret mot utgivere (av forskjellig slag) fordi det er her det "trenges mest". Utgivere vet generelt mindre om dette enn bibliotekfolk og for at vi skal ha noen DC-poster å samle inn/konverete/forbedre er vi avhengige av at noen lager dem! Samtidig vil selvfølgelig ikke "utestenge" verken interesserte og kompetente bibliotekfolk eller deres meninger verken i forberedelsene til seminaret eller på selve seminaret. Det er også positivt at vi får en diskusjon i dette forumet, det bidrar både til informasjonsspredning og at gode problemstillinger kommer fram.
Med hilsen Hilde Høgås
__________________________ Hilde Høgås IT-avd. Nasjonalbiblioteket, avdeling Rana hilde.hogas@nbr.no Tlf: 75 12 12 03, Fax: 75 15 54 60
Date: Thu, 2 Jul 1998 15:52:15 +0200 (cut) From: Ole Husby <Ole.Husby@bibsys.no> To: bibliotek@rbt.no Subject: Hva er metadataKnut Hegna skriver:
" ...
Jeg syns definisjonen (som jeg selv har brukt en gang) "data om data" er nokså intetsigende. Jeg forsøkte i forrige innlegg å presisere det til "data om data i data", dvs kvalifiserende opplysninger om dokumentet hektet på dokumentet selv, slik at data og metadata utgjør en enhet.
Det er i en slik sammenheng det - etter min mening - er interessant å diskutere "metadata". Det skiller det også fra en katalogpost, som også er "data om data", men som er skilt fra dokumentet og inngår i en ganske annen helhet (katalog).
Av dette utleder jeg også at metadata er dokument- orientert, mens en katalogpost er samlingsorientert.
... "
Jeg er enig i at definisjonen "data om data" er nokså intetsigende. Men jeg mener at "data om data i data" er direkte feil, eller i det minste i motstrid med den forståelse som mange har av begrepet metadata. I noen tilfeller (eksempel: Dublin Core med HTML-notasjon) kan metadata inkluderes i primærdokumentet, men metadata kan likså gjerne være separate katalogposter (f.eks. MARC). Metadata er en UTVIDELSE av "bibliografiske data", "katalogposter" o.l. Og for ordens skyld: DC (Dublin Core) forutsetter ikke at metadata skal inkluderes. Vi kan godt ha separate katalogposter i DC.
Ut fra denne forståelsen blir det nokså meningsløst å diskutere for eller mot "metadata". Spørsmålet blir heller: Hvilke metadatasystemer bør brukes i hvilke sammenhenger?
I praksis er metadatabegrepet ofte knyttet til de nye nettdokumentene. Her ligger nye problemer og utfordringer, men også nye muligheter, som f.eks. å inkludere metadata i dokumentet. (Og inkluderte metadata trenger ikke være DC, det kan f.eks. være SGML-baserte MARC-data).
Det er sjølsagt mulig å innsnevre begrepet metadata til bare å omfatte inkluderte metadata. Men jeg mener det må være lurt å se på dette fagområdet fra en vid synsvinkel, som både omfatter tradisjonell katalogiseringskunnskap og særtrekk ved nettdokumenter av forskjellig type.
Og jeg tror forøvrig IKKE at DC - like lite som MARC - har sjanse til å bli metadatasystemet som kan brukes i alle sammenhenger. Men jeg finner det rimelig at også nasjonalbibliotek engasjerer seg i både det ene og det andre. DC er fortsatt i en utviklingsprosess, og informasjon, retningslinjer og faglig påvirkning fra norske faginstanser vil sikkert bidra til å påvirke denne prosessen i riktig retning.
Ole Husby BIBSYS ole.husby@bibsys.no N-7034 TRONDHEIM phone: +47-73 59 29 59 N o r w a y http://www.bibsys.no/
To: bibliotek@rbt.no, folkebib-nett@bibtils.no Subject: Svar: Hva er metadata ? Date: Fri, 03 Jul 1998 08:01:22 +0200 From: Knut Hegna
Det er fint å få en diskusjon og mulig avklaring på hva "metadata" er. Det vil tjene den videre diskusjonen.
Husby mener at det er direkte feil å knytte metadata så sterkt til sammenbinding med primærdokumentet som jeg gjør (data(1) OM data(2) I data(1+2)).
Jeg sier ikke at metadata representerer denne sammenbindingen, men at det er en del av den. Jeg sier dette ut fra hvordan "metadata" I PRAKSIS blir brukt og med henvisning til hvordan ordet er kommet til (behovet for å knytte kvalifiserende opplysninger til elektroniske dokumenter).
Husby henviser også til hvordan det i praksis blir brukt og her er vi jo enige. Når nå Nasjonalbiblioteket innkaller til seminar, så er det først og fremst for å få forleggere og andre til å inkludere metadata i sine elektroniske dokumenter.
Denne forbindelsen mellom en beskrivelse av dokumentet og dokumentet selv, kjenner vi fra før. Den kan være gjengitt i dokumentet (som f.eks en CIP-post), den kan også være en henvisning til en post i en etablert katalog (Library of Congres nr). Sånn sett kunne vi i Informatikkbiblioteket nøye oss med å påføre våre elektroniske hovedoppgaver postidentifikasjonsnummer i bibsys-katalogen for å tilordne primærdokumentet metadata.
Jeg syns likevel diskusjonen om "metadata" først og fremst dreier seg om dokumentbeskrivelse knyttet til dokumentet selv, som kan gjenbrukes i større eller mindre grad av bibliotek, søkemaskiner osv. Begrenser vi det til det, vil diskusjonen dreie seg om hvilken form og hvilket innhold slike opplysninger skal ha og hvem som skal ha ansvaret for dem og ikke "for eller mot" metadata. For at en slik diskusjon om form/innhold av metadata skal bli meningsfull, bør man i forkant også diskutere grundig hvilke mål man ønsker å oppnå (f.eks slik Cutter gjorde i 1904 i "Rules for a dictionary Catalogue").
Når Husby skriver at metadata er en UTVIDELSE av "bibliografisk beskrivelse", så er jeg på en måte enig, men utsagnet må ikke oppfattes som at metadata (f.eks Dublin Core) i kvantitet og kvalitet overgår AACR2/MARC når det gjelder beskrivelse av f.eks bøker. Jeg oppfatter utvidelsen til å dreie seg om at metadata også dekker beskrivelse av (dokumentliknende) "objekter" bibliotekene vanligvis ikke befatter seg med.
Til slutt: jeg skulle kommentert Hilde Høgås sitt innlegg også, men det var nokså omfattende og henviste dessuten til et dokument i BIBLINK-prosjektet som jeg må lese først, så svaret får vente til etter ferien.
Det er allerede flere enn vanlig som har tatt ordet i denne biblioteksfaglige debatten. Jeg håper det blir enda flere.
Her er forøvrig BIBLINK-prosjektets definisjon av metadata:
Metadata is defined as "data which assists in the identification, description, evaluation and selection of an information object". Metadata can exist for objects at various levels of granularity e.g. it can refer to collections of documents, a single document or a chapter within a document; it can refer to a series, an individual journal, or an article within a journal; it could refer to a web-site, to a particular logical archive on that site, to a web page, or to an image embedded in that page.
Med vennlig hilsen og et fortsatt ønske om god sommer.
Knut Hegna
Date: Sat, 4 Jul 1998 00:04:17 +0100 To: bibliotek@rbt.no, folkebib-nett@bibtils.no From: Øivind BergSom formann i Katalogkomitéen og ansvarlig for nasjonalbibliografien er jeg vel forpliktet til å forsøke å svare på Knut Hegnas utfordring. Ordet «kontroll» har på norsk mange betydninger. I sammenheng med bibliografisk virksomhet dekker betydningen «oversikt» bedre enn f.eks. «styring» eller «regulering». Uansett er begrepet «bibliografisk kontroll» godt innarbeidet i det bibliotekfaglige vokabular. Et av IFLAs kjerneprogram heter på engelsk «Universal Bibliographic Control» (UBC). Jeg vil ikke prøve meg på noen formaldefinisjon av begrepet «nasjonal bibliografisk kontroll», men en anvendelig bruksdefinisjon kan være: «det å sørge for en løpende oversikt over hva som til enhver tid publiseres i et land». Dette gjøres gjennom bibliografisk registrering av publikasjonene. En arbeidsgruppe nedsatt av IFLA for å utarbeide funksjonelle krav til bibliografisk informasjon opererer med følgende basisfunksjoner for bibliografiske poster / katalogposter:Subject: Bibliografisk kontroll og Dublin Core
At oppmerksomheten i første rekke rettes mot Dublin Core skyldes at dette formatet er valgt (etter grundige vurderinger av alternative formater) i flere prosjekter der europeiske nasjonalbibliotek er involvert.
Innlemming av nettverksbaserte dokumenter i nasjonalbibliografien må for øvrig på lik linje med andre typer dokumenter baseres på utvalgskriterier. Dersom dette skal kunne fungere slik at brukerne med en rimelig grad av sikkerhet vet hva en kan vente å finne i nasjonalbibliografien, forutsettes det fra Nasjonalbibliotekets side at det utvikles praktiske opplegg for innsamling og oversikt over alle dokumenter som er tilgjengelig via internett. Sett fra Nasjonalbibliotekets side er således det å anskaffe elektroniske dokumenter et langt større problem enn det å beskrive dem. En annen sak er at mengden av dokumenter på internett (sammenliknet med antall trykte publikasjoner) gjør at en forholdsmessig mindre andel av totalen vil kunne registreres bibliografisk av ressursmessige årsaker.
Med vennlig hilsen
Øivind Berg,
UBO / Bibliografisk avd.
Date: Thu, 27 Aug 1998 14:11:38 +0100 To: bibliotek@rbt.no, folkebib-nett@bibtils.no From: Annema Hasund Langballe <a.m.h.langballe@ub.uio.no> Subject: Bibliografisk kontrollSom medlem av IFLAs Standing Committee i Section on Bibliography, som igjen hører inn under Division on Bibliographic Control, var jeg beskjemmet tidligere i sommer da en definisjon ble diskutert. Som mange andre visste jeg hva det var uten å kunne gi en kort, god forklaring. Jeg slo opp på IFLANET både under divisjonen, komiteen og under UBCIM-programmet - men like definisjonsløst er det alle steder.
Så da vi hadde komité-møte i Amsterdam i forrige uke og diskuterte en informasjonsfolder om oss selv, foreslo jeg at folderen også skulle gi en definisjon av hva vi holder på med. Flere forslag ble innlevert etter et par dagers betenkningstid. Nedenstående stammer fra vårt danske medlem og ble noe språklig forbedret av vårt amerikanske. Det ble levert videre til lederen av divisjonen og foreslått inkludert i folderen:
"Bibliographic Control requires the development and maintenance of a system of descriptions of documents that are arranged according to accepted standards within cataloguing, indexing, and classification, in order to ensure the identification, retrieval of and access to the documents."
Hilsen Annema Hasund Langballe, Bibliografisk avdeling, UBO
To: bibliotek@rbt.no, folkebib-nett@bibtils.no Subject: Dublin Core - et metainnlegg Date: Mon, 14 Sep 1998 12:59:44 +0200 From: Knut HegnaNå har jeg endelig fått samlet (eller var det somlet) meg til å fortsette den diskusjonen som startet i sommer. Mitt innlegg er uforskammet langt og for å ikke fylle opp epostkassa til alle dem som syns det er en uinteressant diskusjon, har jeg lagt mitt svar i følgende URL:
http://www.ifi.uio.no/~knuthe/dok/bkdc.html
For dem som har mistet/glemt/fortrengt de tidligere innleggene, har jeg tillatt meg å samle dem i URL-en:
http://www.ifi.uio.no/~knuthe/dok/DCdisk.html
Med vennlig hilsen
-- Knut Hegna Førstebibliotekar | Senior academic librarian Universitetet i Oslo | University of Oslo, Informatikkbiblioteket | Informatics library http://www.ifi.uio.no/~knuthe/Her følger innlegget:
Høivik gir en arbeidsdefinisjon :"Bibliografisk kontroll er kunsten å organisere tekster slik at de kan gjenfinnes og omfatter disipliner som katalogisering, indeksering, klassifisering, tesauruskonstruksjon m.v." (Randi Meyer reagerte på bruken av uttrykket organisere tekster, men jeg tror de fleste skjønner hva Høivik sikter til.)
Høgås anlegger en praktisk tilnærming til uttrykket : "bibliografisk beskrivelse med den hensikt å holde oversikt over norske utgivelser og å sikre gjenfinning av dem.
Berg gir en bruksdefinisjon: «det å sørge for en løpende oversikt over hva som til enhver tid publiseres i et land». Dette gjøres gjennom bibliografisk registrering av publikasjonene.
Endelig gjengir Annema Hasund Langballe en autoritativ fersk definsjon fra årets IFLA-møte:
Bibliographic Control requires the development and maintenance of a system
of descriptions of documents that are arranged according to accepted
standards within cataloguing, indexing, and classification, in order to
ensure the identification, retrieval of and access to the documents.
Denne definisjonen er nokså lik den som Høivik gir, men jeg syns den passer bedre som svar på spørsmålet: hva er kunnskapsorganisasjon ?. Ordet "requires" er problematisk. Det betyr at det som følger etter er en nødvendig betingelse for det som kommer foran. Gjennom det antydes at det er mer som skal til, at det ikke er tilstrekkelig (nødvendig, men ikke tilstrekkelig betingelse). Dersom "requires" byttes ut med "is", så avgrenser man spørsmålet om bibliografisk kontroll til spørsmålet om bibliografisk beskrivelse og kunnskapsorganisasjon. Jeg finner dette utilfredsstilllende.
Alle disse tilnærmingene peker i retning av å knytte den bibliografiske kontrollen sterkt opp mot den bibliografiske beskrivelsen. Jeg mener man mister aspektet med dekningsgrad/fullstendighet og utvalgskriterier. Jeg vil foreslå at bibliografisk kontroll er:
Det tilligger hver enkelt bibliografiske kontrollør å sette seg mål og å gjennomføre dem både med hensyn på utvalgskriterier, ønsket dekningsgrad, og omfang av og hensikt med beskrivelsen. Målene behøver ikke være like for de ulike typene materiale.
I det biblioteket jeg arbeider vil vi gjerne dekke litteratur om flest mulig programspråk, men ikke alt som skrives om alle programspråk. Vi vil katalogisere og klassifisere dette i den hensikt å sørge for en god identifikasjon av hvert enkelt dokument og å sette dette dokumentet i en sammenheng - i relasjon til andre dokumenter i samlingen (samle det som hører sammen og skille forskjellige dokumenter fra hverandre). Vi står nokså fritt med hensyn til dekningsgrad og utvalgskriterier, vi har som deltakere i BIBSYS sterke beskrankninger på den formelle bibliografiske beskrivelsen, men står igjen fritt når det gjelder emneord og klassifikasjon. Dette er vår form for bibliografisk kontroll.
NB må selvsagt stille seg høyere mål enn den minimumsdefinisjonen jeg har satt opp. NB må også stille seg større oppgaver enn det enkelte bibliotek. NB er de siste som skal forenkle katalogiseringen, de skal være et forbilde for resten av bibliotekmiljøet og sikre at målet med å katalogisere et dokument én gang, blir oppfylt.
Pliktavleveringsloven vil tilføre NB materiale av mange slag. Det gjelder både papirbaserte og elektroniske medier. På samme måte som det papirbaserte materialet får ulik behandling alt etter "karakter" (reklametrykk, løpesedler, tidsskrifter, aviser, bøker), må det elektroniske behandles ulikt. Som Berg skriver det: Innlemming av nettverksbaserte dokumenter i nasjonalbibliografien må for øvrig på lik linje med andre typer dokumenter baseres på utvalgskriterier.
NB kan ha bibliografisk kontroll over alt det elektroniske materialet uten å behandle det likt bibliografisk. Når NBR i dag laster ned alle innlegg i elektroniske nyhetsgrupper (news), inneholder de kategoriserende data nok i seg selv - avsender, tittel, tidspunkt og navn på nyhetsgruppe. Bortsett fra tittel er disse automatisk generert. Meldingen identifiseres ved det og NB tar vare på den. Den bibliografiske kontrollen er god nok for denne typen data.
Norske vevsider har i utgangspunktet få data av denne typen (automatisk generert), forfatter og tittel vil være høyst usikre. Høgås skriver at man på lengre sikt vil laste ned hele det norske vevområdet. Det vil være helt urealistisk å håpe at noen form for menneskelig utført bibliografisk beskrivelse av dette blir mulig, selv ikke med det enkle Dublin Core. Hovedproblemet med vevområdet vil dessuten være å fange opp dynamikken i det.
NBs Dublin Core-seminar retter seg ikke til en hvilket som helst vevforfatter, men til "seriøse" institusjoner og personer som publiserer "seriøse" dokumenter på nettet eller på annet elektronisk vis. For dette materialet må NB stille seg høyere mål for den bibliografiske kontrollen. Dersom det skal inn i nasjonalbibliografien vil det kreve en bibliografisk beskrivelse som går langt utenpå Dublin Core i form og innhold. Her vil Høiviks og Langballes (IFLAs) definisjon av bibliografisk kontroll passe. Her dreier det seg om kunnskapsorganisasjon (ikke data/informasjonsorganisasjon) og i en slik sammenheng er Dublin Core et blindspor.
NB må stille seg klare mål for omfanget av den bibliografiske kontrollen som skal anvendes på de ulike typene elektroniske dokumentene. Har NB utarbeidet slike differensierte målsettinger ?
Viss NB ikke har kapasitet til å gi beskrivelsene den bibliografiske autoritet og fullstendighet som trengs, hvem skulle ellers gjøre det ? Er det ressursene som svikter, må det tilføres ressurser slik at dette blir mulig.
Jeg syns det er nokså motsetningsfylt når Berg sier:
La oss se på forholdet mellom to formater: Dublin Core og USMARC Hva skjer ved konvertering mellom Dublin Core og MARC. Bernhard Eversberg gjengir i dokumentet "Was sind und was sollen Bibliothekarische Datenformate" en tabell over de 33 mest brukte feltene i over 4 mill. poster fra Library of Congress. Tabellen inneholder også opplysning om hvilket Dublin Core felt som er mest aktuelt for hvert enkelt MARC-felt:
Fore- komst | Marc- felt | Beskrivelse | Dublin Core |
---|---|---|---|
100% | 245 | Tittel | TITLE |
260 | Utgivelse(Sted, forlag, år) | PUBLISHER | |
300 | Fysisk beskrivelse (Sidetall etc.) | ??? | |
050 | LC Classification (Systematisk oppstillingssignatur) |
SUBJECT | |
008 | Koder, bla språk, land, etc |
LANGUAGE TYPE | |
?95% | 650 | Emneord) | SUBJECT |
72% | 100 | Første forfatter | CREATOR |
67% | 020 | ISBN | IDENTIFIER |
500 | Fotnote | DESCRIPTION | |
63% | 082 | Dewey-klassifikasjon | SUBJECT |
50% | 043 | Geografisk kode | COVERAGE |
49% | 504 | Bibliografinote | DESCRIPTION |
43% | 700 | Biinnførsel personnavn | CONTRIBUTOR |
25% | 651 | Geografisk emneord | COVERAGE |
18% | 250 | Utgavebemerkning | ??? |
710 | Biinnførsel korporasjon | CONTRIBUTOR | |
490 | Rekke/serie ukontrollert | RELATION | |
17% | 440 | Rekke/Serie | RELATION |
14% | 600 | Personnavn som emne | SUBJECT |
9.4% | 740 | Biinnførsel tittel | TITLE |
8.2% | 830 | Tittel på overordnet verk | RELATION |
7.3% | 110 | Korporativt ordningsord | CREATOR |
( 7% | 041 | Språk -> 008'35-37 ) | LANGUAGE |
6% | 610 | Korporasjon som emne | SUBJECT |
4% | 520 | Innholdsnote | DESCRIPTION |
3.8% | 130 | Standardtittel | TITLE |
3.3% | 505 | Bind eller kapittelangivelse | DESCRIPTION |
2% | 111 | Konferanse (med 711 : 2.5%) | ??? |
1% | 653 | Frie ukontrollerte emneord | SUBJECT |
655 | Sjanger som emne | SUBJECT | |
630 | Verktittel som emne | SUBJECT | |
060 | NLM-klassifikasjon | SUBJECT | |
810 | Serietittel under korporasjon | RELATION | |
730 | Standardtittel som biinnførsel | TITLE | |
533 | Opptrykksnote | RELATION? |
Som det går fram av tabellen er det f.eks en rekke av MARC-formatets emnefelt som blir konvertert inn i Dublin Core SUBJECT (i følge den offisielle definisjonen som ligger på http://purl.oclc.org/metadata/dublin_core/). Men i den konverteringen forsvinner vesentlige opplysninger om innholdet (omtalt person, kontrollerte emneord, Dewey-klassifikasjon, alt inn i samme suppa). En konvertering tilbake til utgangspunktet vil bli umulig. Disse formatene er inkompatible.
Noen vil innvende at det er mulig - for hver enkelt opplysning - å oppgi hvilket skjema som brukes i Dublin Core-feltet, og å henvise til en autorisert utgave av skjemaet, slik det for eksempel kan se ut i en html-fil (en dewey-klassifikasjon):
<META name="DC.subject" scheme="DDC" content="152.4">der vi tidligere kunne skrive "082 $a 152.4". Dublin Core-data i HTML-syntaks er ganske mye mer komplisert enn MARC i linjeformat. Dette er selvsagt noe demagogisk skrevet, fordi det sikkert vil dukke opp programmer som gjør ferdig det meste av syntaksen, vi vil ikke en gang se den. Men det gjør vi ikke med MARC-feltkoder heller.
<LINK REL=DDC HREF=http://www.oclc.org/fp/>
Men la oss nå anta at Dublin Core utvikler seg (videre) til å takle ethvert MARC-felt korrekt (f.eks gjennom definisjon av et nytt felt FIELD : <META name="DC.field.600" scheme="USMARC" content="Ibsen, Henrik Johan">), så vil det ihvertfall bli mulig å konvertere fram og tilbake. Men hva er da vitsen ?
Hovedinnvendingen min til Dublin Core er fortsatt at det ikke er knyttet opp mot et regelverk for hvordan innholdet i de enkelte feltene skal registreres (som AACR2). Uten regelverk og med ulike produsenter av slike "metadata" vil det helt sikkert oppstå inkonsistens, noe som vil berøre presisjonen i søkemaskinene og ikke minst i bibliotekkatalogene. God presisjon oppnås ved to virkemidler, ved detaljering av informasjonen (inndeling i felt) og gjennom normaliserte data. Inkompatibiliteten mellom USMARC og Dublin Core gjelder ikke bare form, men også innhold.
Dublin Core data fra andre kilder enn bibliotekene vil derfor bare tjene som 2.rangs "formelle opplysninger på fremtredende plass". "2.rangs" fordi de formelle opplysningene som brukerne ser på skjermen er viktigere (de syns!) som faktisk identifikasjon (som tittelbladet er det i en bok). Dermed er spørsmålet om man får ut av det noe som står i forhold til arbeidsmengden nedlagt både hos utgiver og bibliotek.
Det hadde vært fint om produsentene ville føye til NBs autoriserte katalogdata i sine elektroniske dokumenter. I følge Høgås skal dette skje ved at produsenten sender over til NB sine metadata som oppgraderer dem og sender dem tilbake. Jeg mener likevel at dette er en unødvendig komplisert måte å gjøre det på (fram og tilbake er dobbelt så langt i dette tilfellet). Det ville faktisk være tilstrekkelig :
I øyeblikket har jeg en magefølelse av at det foregår en forflatning av de kunnskapsorganisatoriske prinsipper som det ligger lang tids diskusjon og erfaring til grunn for og som har lagt grunnlaget for de beste, mest konsistente og grundige gjenfinningsredskapene vi har i dag. Dette faktum blir mer og mer erkjent også på nettet. Vi ser det gjennom uttalelser som "librarians should rule the net".
Begrunnelsen for forflatningen tillegges den enorme mengden informasjon som er tilgjengelig og som sies å kreve en forenkling for å rekke over det. Jeg mener tvertimot - økende informasjons- og kunnskapmengde krever bedre og mer detaljerte metoder. Derfor syns jeg det er verdt å ta en diskusjon om dette, jeg hadde bare håpet at flere som har bedre forståelse enn meg av de kunnskapsorganisatoriske prinsipper ville delta.
Vi kan gjøre mer. Det datagrunnlaget vi har i bibliotekkatalogene er langt fra utnyttet i sin fulle bredde, slik mulighetene nå ligger til rette i teknologien. Selv om mye er gjort (f.eks når det gjelder videresøk ved hjelp av lenker), så kan mye ennå gjøres i brukergrensesnittene for å utnytte dataene enda bedre (sammenstilling av bibliografiske elementer, vise fram den bibliografiske strukturen bedre for å lette manøvreringen ytterligere).
Jeg vil her bare referere til en av de store innen kunnskapsorganisasjon - Charles A. Cutter - som i forordet til 4.utgave av "Rules for a dictionary catalog" (1904) skriver:
that the golden age of cataloging is over,
and that the difficulties and discussions
which have furnished an innocent pleasure to so many
will interest them no more.
Another lost art.
Kanskje kan diskusjonen om Dublin Core og andre metadataformater bringe det kunstneriske element tilbake i bibliotekfaget ?
1998-09-16 : Rettet to korrekturfeil og føyd til setningen: "Dette er vår form for bibliografisk kontroll." i avsnitt 12 forfra.