Bilag H - Hjælpepostformat

danMARC2 Slots- og Kulturstyrelsen
Start S&oslah Sitemap Kapitelstart
 
Bilag H - Hjælpepostformat

Hjælpepostformat.
Del 1 : Navneformsposter, titelposter, emneordsposter

INDLEDNING

Indhold
Hjælpepostformatets del 1 indeholder format til personnavne, korporationsnavne, titler og emneord samt noter til disse. Felterne til titler og emneord er i overensstemmelse med de normative titler og de emneordssystemer, som hovedformatet understøtter.

Formatets opbygning og forholdet til USMARC
I sin opbygning svarer hjælpepostformatet til danMARC2 med en ramme med feltkode og delfeltkoder, en kommenterende tekst og sidst eksempler. Hvor det ikke har været i konflikt med danMARC2 er anvendt de samme feltkoder og delfeltkoder som i USMARC. DanMARC anvender generelt flere delfelter end USMARC. Endnu flere kommer til, fordi værdier fra indikatorerne skal lægges over i delfelter.

Fra USMARC er så vidt muligt medtaget alle de felter, der er obligatoriske samt nogle af de valgfri. I de felter og delfelter, som er overtaget, er der ikke ændret noget ved det indholdsmæssige.

Formatets anvendelsesområde
Hjælpepostformatet er tænkt til at kunne håndtere poster med navneformer på personer, korporationer, titler og emneord. Det er udarbejdet ud fra en forestilling om et nationalt autoritetsregister, som kan udveksle poster med udlandet, men det kan også anvendes lokalt eller f.eks. i et regionalt fællessystem.

Den vedtagne navneform inddateres i felt 1XX. Ikke vedtagne navneformer inddateres i 4XX felterne og kan således danne udgangspunkt for se-henvisninger med navneformen i 1XX som henvisningsmål.

Navneformer, der kan give anledning til se også-henvisninger inddateres i 5XX-felterne med navneformen i 1XX som henvisningsmål.

Det understreges, at hjælpepostformatet kun må indeholde identificerede former, dvs. at man har konstateret det er samme person, korporation, etc.

Oversigt over danMARC2 til hjælpeposter
Begreberne postetiket og adresseliste findes ikke i danMARC2s hjælpepostformat, som på det punkt følger hovedformatet. I USMARC er postetiket og adresseliste positionsbestemte koder. Postetiketten (i USMARC: leader) består af 24 tegn og adresselisten (i USMARC: directory) af 12 tegn. Ved konvertering til USMARC skal ikke anvendte positioner i postetiket og adresseliste have maskingenereret de krævede tegn, enten 0 (nul) eller blanktegn.

001-090 Numre og koder
1XX Vedtagne former
4XX Ikke vedtagne former eller se-henvisninger
5XX Se også-henvisninger
667-680 Noter
880 Data i andet tegnsæt

For yderligere oplysninger om det danske format, se danMARC2, 2. udgave.

Delfelter med fast betydning i hjælpepostformatet Delfelt *å, feltnumerator, anvendes til at knytte to eller flere felter i samme post sammen. Delfeltet er nævnt i mange af hjælpepostformatets felter, men kan principielt anvendes i alle felter.

Delfelt *å står først i feltet og indeholder et tal fra 1 og opefter. Delfelt *å kan gentages.

Verifikation (i USMARC: authentication). Da det er meningen, at hjælpepostformatet også i givet fald skal kunne anvendes til et nationalt autoritetsregister med henblik på udveksling med udlandet, er betydningen af verifikationsdelfelter og -koder strammet i forhold til hovedformatet. De inddateres sidst i feltet.

Et tomt delfelt *0 knyttet til et felt betyder, at det er en form, der anvendes i nationalbibliografien.

Delfelt *2 anvendes i emnedatafelter og indeholder oplysninger i form af en kode for det anvendte emneordssystem. Koden skal godkendes af Katalogdataudvalgets Sekretariat, før den tages i brug.

Delfelt *9 anvendes i klassifikationsdatafelter og indeholder oplysninger i form af en kode for det anvendte klassifikationssystem. Koden skal godkendes af Katalogdataudvalgets Sekretariat, før den tages i brug.

Alfabetiseringsangivelse
Når data i et givet delfelt skal sorteres (alfabetiseres) anderledes end tegn for tegn fra venstre mod højre, anvendes alfabetiseringssymbol eller alfabetiseringsdelfelt.

Alfabetiseringssymbol
Et specielt tegn (et alfabetiseringssymbol) angiver, hvor alfabetiseringen i et givet delfelt skal starte. Som alfabetiseringssymbol anvendes ¤ (hexadecimalt: A4).

110 *a Det ¤Kongelige Bibliotek

Alfabetiseringsdelfelt
Et alfabetiseringsdelfelt er betegnet med et stort bogstav (A-Ø) og skal umiddelbart efterfølges af en delfeltkode med det tilsvarende lille bogstav.

100 *A lacour *a La Cour *h Inger 100 *a Frederik *E 9 *e IX *f konge af Danmark

Der kan i princippet anvendes alfabetiseringsdelfelt foran ethvert delfelt i en post. I praksis anvendes alfabetiseringsdelfeltet, hvor flere ord skal alfabetiseres som ét ord eller bogstaver skal sorteres som tal.

Lokale felter og delfelter
Ønskes formatet udbygget til lokalt brug, anbefales det at anvende bogstavfeltkoder, dvs. feltkoder der består af bogstaver eller en kombination af bogstaver og tal.

Et delfelt *& er i alle felter reserveret til lokal anvendelse.

Ingen andre felter eller delfelter inden for intervallet 001-880 må anvendes til rent lokale oplysninger.

Der bør desuden ikke anvendes lokale feltkoder til information, hvortil der er defineret fælles feltkoder i formatet.

Tegnsæt
Som tegnsæt anvendes ISO 8859-1, også kaldet latinsk alfabet nr. 1. Det er et 8-bit tegnsæt med plads til 256 forskellige tegn, idet der dog kun er defineret 190 forskellige grafiske tegn (synlige tegn). For at kunne anvende ISO 8859-1 til bibliografiske data har 3 tegn fået en speciel betydning:

* delfeltkode (hexadecimal værdi 2A)
@ skiftenøgle (hexadecimal værdi 40)
¤ alfabetiseringsmærke (hexadecimal værdi A4)

Skiftenøglen anvendes for at give plads for andre tegn inden for rammerne af ISO 8859-1. Som referencetegnsæt anvendes principielt ISO 10646, som er et 4-dimensionalt tegnsæt med over 4 milliarder tegn-muligheder. Foreløbig anvendes 2 dimensioner, kaldet BMP - Basic Multilingual Plane, og et fremmed tegn angives på formen: @2030, hvor de første 2 tegn, dvs 20 (hexadecimal værdi), angiver grundplanen, medens de sidste 2 tegn, dvs. 30, angiver tegnets placering i planen. Som (enkelte) eksempler på grundplaner kan nævnes:

00 Basic Latin, Latin-1 Supplement (= ISO 8859-1)
01 Latin Extended-A, Latin Extended-B
04 Cyrillic
05 Armenian, Hebrew (Basic and Extended)
22 Mathematical Operators
4E CJK Unified Ideographs (Chinese, Japanese, Korean)
9F CJK Unified Ideographs (Chinese, Japanese, Korean)

Skelnen mellem gammel dansk å (Søndergaard) og dobbelt aa (dataanalyse) kodes specielt:

@å Lille gammelt å (aa)
@Å Stort gammelt Å (Aa)

Meget specielle tegn, som ikke kan genfindes i ISO 10646, kodes ved at angive den hexadecimale værdi for tegnet i fællestegnsættet med et foranstillet U, fx

@UF9 Upadhmaniya

Hvis de tre tegn med speciel betydning anvendes med deres normale betydning kodes de således:

@@ commercial at
@* asterisk
@¤ currency sign

Kontroltegn som fx Start of Text, End of Text, Backspace, Line Feed og Tape Mark gøres synlige, idet tegnenes placering i ISO 10646 overføres til de tilsvarende ledige positioner i ISO 8859-1, hvorved de kan udskrives som henholdsvis @0002, @0003, @0008 @000A og @0013.

En danMARC-hjælpepost har følgende liniebillede:

@0002
[ID-nummer]
001 *a .......
004 *r ....... *x ...
008 *p ...... *v...
100 *a ….. *h …
@0003

Vedligeholdelse af danMARC2s hjælpepostformat
Anmodning om nye koder, ændringer eller tilføjelser til hjælpepostformatet sker som for hovedformatet ved skriftlig henvendelse til

Katalogdataudvalgets Sekretariat
Biblioteksstyrelsen
Nyhavn 31 E
1051 København K

På Biblioteksstyrelsens hjemmeside findes særlige blanketter til henvendelse om rettelser i danMARC2.

Katalogdataudvalget tager stilling til oprettelsen af nye koder eller ændring af eksisterende.