Metadata makes the world going round - en orientering om användning av Metadata och XML

Sara Kjellberg och Sigfrid Lundberg
Biblioteksdirektionen, Lunds universitet

Innehållsförteckning



    

Metadata makes the world go around

Sara Kjellberg och Sigfrid (Sigge) Lundberg

LäS MER!

En referenslista finns med några grundläggande artiklar.

PROGRAM

Nedan återfinns agendan för utbildningsdagen.

10.00-10.15

Inledning och presentation av dagen

10.15-10.55

Var finns metadata, vem gör dem och varför?

Introduktion till metadata: Vad är metadata? Definitioner Varför har man den t.ex. sökning, identifiering, urval och åtkomst De olika skaparna av metadata set, standardskapare och applikationsimplementatörer (Sara 15 min)

Metadata som handelsvara : Vad behövs på nätet? (Sigge 10 min)

ÖVNING: Vilka data behöver man? Metadatamodellering : (Sara + Sigge 15 min)

11.00-11.45

Hur ser metadata ut?

Begreppet namnrymd (namespace) Genomgång av Dublin Core (Sara 20 min)

Metadata med flera namnrymder Vad är RDF ? Genomgång av MusicBrainz (Sigge 25 min)

11.45-12.45

LUNCH

12.45-14.20

Hur använder man dem?

ÖVNING : Bygg en metadatamodell för film 3 grupper (Sara + Sigge 15 min)

Genomgång av övningen för- och nackdelar med de 3 versionerna jämför http://www.imdb.com (Sigge 15 min)

Om samsökning på olika sätt: - decentraliserad sökning (Z39.50) - central inhämtning av datan - Open URLs (Sigge 10 min)

Exemplet Renardus och interoperabilitet Applikationsprofiler (Sara 20 min)

ÖVNING (gemensam diskussion) : Hur gör vi en samtjänst för nordisk film av de 3 filmmetadataseten? (Sara + Sigge 25 min)

14.20-14.50

FIKA

14.50-16.30

Hur återanvänder man dem?

Vad innebär återanvändning Skapa en gång, använd flera (Sigge 15 min)

Dokument, data och metadata. Återanvädning av information i dokument . (Sigge 15 min)

ÖVNING: Dokument och data Analysera ett dokument med avseende strukturer som skulle ligga till grund för markering ''' (Sara + Sigge 30 min)

Introduktion till OAI som exempel på återanvändning av metadata (Sara 15 min)

Avrundning och en blick in i kristallkulan semantiska webben (Sara 15 min)

16.30-16.45

UTVäRDERING



    

Vad är metadata?

Det är svårt att komma ifrån den mest enkla definitionen av dem alla:

Metadata är data med information om data

En mer formell definition är:

"Metadata is data associated with objects which relieves their potential users of having to have full advance knowledge of their existence or characteristics."
http://www.ukoln.ac.uk/metadata/desire/overview/

Metadata kan vara exempelvis en beskrivning av en bok i den gamla kortkatalogen på biblioteket:

I biblioteksvärlden har vi länge använt metadata för att:

Eller som det uttrycks i IFLAs "Functional Requirements for Bibliographic Records" , metadata används för:

http://www.ifla.org/VII/s13/frbr/frbr.htm :-)

Saker som påverkar skapandet av metadata är om metadatan skapas:

<< Föregående || Programmet || Nästa >>



    

Metadatans ekologi

Finns två vägar för att använda sig av metadata:

För att underlätta sökning, identifikation, urval och åtkomst på en bredare basis än enbart i varje enskild applikation krävs det att metadatan går att återanvända.

Det har skapats en mängd standarder för olika ändamål:

Standarderna stödjer interoperabilitet d.v.s återanvändning genom att ta hänsyn till:

Mer om detta i avsnittet om återanvändning.

<< Föregående || Programmet || Nästa >>



    

Olika affärsidéer ger olika typer av metadata

Stuff är

Naturligtvis är skruvar, tvättmaskiner och sytråd också stuff, och måste katalogiseras...

Typer av aktörer

<< Föregående || |Programmet || Nästa >>



Detailjister inom metadataindustrin

<< Föregående || Programmet || Nästa >>



   

Producenter och grossister

<< Föregående || Programmet || Nästa >>



ägare av upphovsrätt

<< Föregående || Programmet || Nästa >>



Standardiseringsinitiativ

<< Föregående || Programmet || Nästa >>



 

Metadataformulär

Från idé till exemplar

efter FRBR från IFLA

<< Föregående || Programmet || Nästa >>



   

Övning: Metadatamodellering

Titta på Studeras avancerade sökformulär, http://www.studera.nu/hittautb/index.jsp Vilken typ av data behövs för att bygga denna tjänst?

<< Föregående || Programmet || Nästa >>



   

Dublin Core Metadata Element Set

Skapats för att:

15 element

Innehåll

Upphovsrätt

Manifestation

Se beskrivningar för respektive element:
http://dublincore.org/documents/dces/

<< Föregående || Programmet || Nästa >>



     

Regler

Syntax

<META NAME="DC.Creator.Author" Content="Kjellberg, Sara">

<META NAME="DC.element name" CONTENT="value of element">

Dublin Core Metadata Initiative, DCMI, är ett exempel på en standard som har en definierad XML namespace .

<< Föregående || Programmet || Nästa >>



     

Namespace - Namnrymd

[Definition:] An XML namespace is a collection of names, identified by a URI reference [RFC 2396], which are used in XML documents as element types and attribute names. XML namespaces differ from the "namespaces" conventionally used in computing disciplines in that the XML version has internal structure and is not, mathematically speaking, a set. These issues are discussed in "A. The Internal Structure of XML Namespaces".
Namespaces in XML, World Wide Web Consortium 14-January-1999
http://www.w3.org/TR/REC-xml-names/

Alltså en namespace:

Dublin Core Metadata Glossary, Final Draft, 24 februari, 2001
http://library.csun.edu/mwoodley/dublincoreglossary.html

Med namespace menas en offentligt tillgänglig metadatavokabulär som presenterar de ingående elementen.

DCMI:s element i Dublin Core Metadata Element Set, Version 1.1 [DCMES] har URI:
http://purl.org/dc/elements/1.1/

DCMI:s termer definierade i DCMI Type Vocabulary [DCMI-TYPE] har URI:
http://purl.org/dc/dcmitype/

http://dublincore.org/documents/dcmi-namespace/

<< Föregående || Programmet || Nästa >>



Resource Description Framework

<< Föregående || Programmet || Nästa >>



MusicBrainz

Inspelad musik, metadata för CD-skivor Allt i ett:

Databasen kan användas för nedladdning av metadata till program för kopiering av CD-skivor

http://www.musicbrainz.org/

<< Föregående || Programmet || Nästa >>



Övning: En metadatamodell för film

En metadatamodell är en specifikation för de fält som behövs för att en tjänst skall fungera enligt specifikationen. Vilken bestäms av businessmodellen

Här formulerar vi ingen spec, det får ni göra själva. I stället vill vi ha en samling fält och en kort motivering som ersätter specifikationen.

Internet movie database

<< Föregående || Programmet || Nästa >>



NWI samsökte webbindex:

<< Föregående || Programmet || Nästa >>



Samsökning och Metadatadelning

<< Föregående || Programmet || Nästa >>



Öppen länkning

Ett ofta tillräckligt bra sätt att fuska. Syftet är att möjliggöra för användare att

Exempel: AXL från Axiell BookIT ? och Biblioteksdirektionen LU http://www.folkbibliotek.lund.se/

Det sker genom att sökfrågor omdirigeras till databaser användaren har tillgång till (licenser OK)

Hemligheten är kodning av metadata i form av en URL

<< Föregående || Programmet || Nästa >>



Vad är RENARDUS?

Målet för Renardus är att bygga en gemensam tjänst där användaren kan söka och bläddra bland Internetbaserade resurssamlingar i Europa:
http://www.renardus.org

Inom projektet undersöktes förutsättningar för:

Informationrelaterade förutsättningar:

Arbete utfört i projektet:

<< Föregående || Programmet || Nästa >>



Application Profile - Applikationsprofil

"A set of metadata elements, policies, and guidelines defined for a particular application."

En applikationsprofil:

Dublin Core Metadata Glossary, Final Draft, 24 februari, 2001
http://library.csun.edu/mwoodley/dublincoreglossary.html

En applikationsprofil är en metadataimplementering som använder och kombinerar olika metadatastandarder och vokabulärer för att bygga en semantisk och syntaktisk helhet anpassad specifikt för en särskild tjänst/applikation.

RENARDUS applikationsprofil:

http://renardus.sub.uni-goettingen.de/renap/renap.html

Collection Level Description, CLD

<< Föregående || Programmet || Nästa >>



Övning: Nordisk filmdatabas

Jämka samman datan i de tre metadata-seten som vi skapade tidigare m.hj. av:

<< Föregående || Programmet || Nästa >>



Användning och Återanvändning

<< Föregående || Programmet || Nästa >>



Indexering av dokument med metadata och strukturell markering

Introduktion till inbakad metadata med hjälp av XML, exemplet TEI:

Strukturella data:

<< Föregående || Programmet || Nästa >>



Övning: Dokument Och Data

Fundera över vad som skulle behöva markeras i texterna nedan för att man skulle kunna bygga detaljerade textkritiska, ordentligt sökbara, digitala utgåvor

<< Föregående || Programmet || Nästa >>



OAI för delning och återanvändning av metadata

OAI - Open Archives Initiative

http://www.openarchives.org

OAI har som mål att stödja och utveckla interoperabilitet för att öka spridningen av information/dokument.

Open Archive vs. Open Access

Men OAI är en teknisk lösning som kan underlätta Open Access

OAI är:

OAI är klistret för att binda samman olika samlingar (data providers) i en gemensam söktjänst (service provider). Ytterligare ett exempel är vårt svenska Uppsök http://uppsok.libris.kb.se/sru/uppsok

http://sigge.lub.lu.se/2004/metadata_makes_the_world.../oai2_img.html

En "service provider" hämtar/"harvesterar" metadatan med hjälp av OAI-PMH .

<< Föregående || Programmet || Nästa >>



Open Archives Initiative - Protocol for Metadata Harvesting

Protokoll för att hämta metadatan som har ett antal enkla kommandon:

Testa OAI Repository Explorer:
http://oai.dlib.vt.edu/cgi-bin/Explorer/oai2.0/testoai - oai-dc som metadataPrefix - raw XML som visningsformat

En "data provider" måste stödja OAI-PMH för att en "service provider" skall komma åt metadatan det innebär bl.a. att metadatan skall:

Samarbete mellan OAI och DCMI har lett till ett gemensamt XML schema för Dublin Core utan kvalifierare:
http://dublincore.org/schemas/xmls/simpledc20020312.xsd

<< Föregående || Programmet || Nästa >>



Semantiska Webben och avrundning

W3C

"having data on the Web defined and linked in a way that it can be used for more effective discovery, automation, integration, and reuse across various applications. The Web can reach its full potential if it becomes a place where data can be shared and processed by automated tools as well as by people."
http://www.w3.org/2001/sw/Activity

Vad syftar den semantiska webben till?

Vad betyder det scenariot enligt Tim Berners Lee?

http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21

<< Föregående || Programmet || Nästa >>



Läs mer!

Bibliografier

Andra resurser

NB i princip varje metadatainitiativ har en egen diskussionslista för intresserade.

<< Programmet



    

Sara Kjellberg

http://www.kult.lu.se/index.php?page=627

Bibliotekarie och doktorand i biblioteks- och informationsvetenskap, med erfarenhet av arbete med metadata inom ämnesportaler och e-publicering. Undervisar inom Bivil vid Lunds universitet.



    

Sigfrid (Sigge) Lundberg

http://sigge.lub.lu.se/

Programmerare som arbetare med metadata inom e-publicering och digitalt bevarande. Har även deltagit i standardutveckling inom området.