• Ingen resultater fundet

Optimering af en elektronisk intranetordbog COWIterm

N/A
N/A
Info
Hent
Protected

Academic year: 2022

Del "Optimering af en elektronisk intranetordbog COWIterm"

Copied!
52
0
0

Indlæser.... (se fuldtekst nu)

Hele teksten

(1)

Forfatter:

Martin Christoffersen

COWIterm

Optimering af en elektronisk intranetordbog

Vejleder:

Henrik Køhler Simonsen

April 2009

(2)
(3)

Executive summary

[COWIterm – Optimisation of an electronic intranet dictionary]

Throughout 2008, I have had the challenges – and the pleasure – of developing COWIterm, an electronically based intranet dictionary for the employees of COWI, a Danish engineering consultancy group. However, the development has been within the frames set by COWI with regards to both data presentation and data search. Therefore, my purpose in this thesis is to discuss different theories pertaining to terminology and lexicography as well as existing electronically based intranet dictionaries in order to examine the possibilities within the electronic online media, for the purpose of optimising COWIterm for the intended user groups and functions.

The first thing to do when planning a dictionary is to establish the intended user groups, cf Bergenholtz

& Tarp (1994). The primary user group, set by COWI, consists of technicians and engineers with Danish as their native language, and the functions relevant comprise production of English texts and translation from Danish to English. Furthermore, I have assumed a secondary user group for whom the same functions apply, consisting of translators and other language employees.

A secondary function is production of texts in Danish as well as translation from English to Danish by people not having Danish as a native language, resulting in a tertiary user group consisting also of primarily technicians and engineers; however; this group is more difficult to define, as it could be anyone not having Danish as a native language.

I continue with outlining the theory of lexicography (Bergenholtz & Tarp, 1994), and the different word types are described, lemma and equivalent selection are touched upon, and I establish the contents of a microstructure (presentation of data) and how these data can be made searchable (the macrostructure).

Afterwards, theories of terminology (Madsen, 1999) are described, including concept systems and the process of making definitions.

Next, I incorporate theories on online reference works including the theories of the lexicographic convergence model as well as the lexicographic document template, cf Simonsen (2007) and Burke (1998), and establish that there are almost unlimited possibilities for data presentation and data search methods, including the elements of multimedia (sound, images, videos).

In the discussion, I juxtapose the theories of traditional lexicography and terminology with those of electronic lexicography and internet reference works relevant for COWIterm in order to explore the optimum layout for an electronic based intranet dictionary such as COWIterm.

I argue inter alia for the implementation of internal subject classifications of COWI's six main business areas, as this will help identifying 1) relevant texts to be included in the corpora; 2) relevant terms in those texts. Furthermore, it would be necessary to include annual reports and contracts as well as other economic and legally binding documents in the corpora, as the secondary user group can be assumed to produce and translate such texts.

(4)

I base my conclusion on a model, showing the ideal way of constructing an electronically based intranet dictionary such as COWIterm, consisting of a result page in the upper third of the screen, above it only an input field for making a new search as well as the possibility of selecting a subject and a text genre for the new search. In the lower two-thirds of the screen, the information related to the term clicked upon in the result list appears, and space is reserved for different kinds of multimedia in the left hand side of the entire screen.

(5)

0 Indholdsfortegnelse

1 Indledning ... 7

2 Problem ... 8

3 Afgrænsning ... 9

3.1 Teoretisk afgrænsning ... 9

3.1.1 Fagleksikografi ... 9

3.1.2 Terminologi ... 9

3.2 Empirisk afgrænsning ... 9

4 Metode ... 10

4.1 Specialet ... 10

4.2 COWIterm ... 10

5 Brugergrupper ... 12

6 Ordbogsfunktioner ... 14

7 Teori ... 15

7.1 Fagleksikografi ... 15

7.1.1 Ordtyper ... 16

7.1.2 Lemmaselektion ... 17

7.1.3 Ækvivalentselektion ... 18

7.1.4 Mikrostruktur ... 19

7.1.5 Makrostruktur ... 28

7.2 Terminologi ... 30

7.2.1 Begrebssystemer... 30

7.2.2 Definitioner ... 31

7.2.3 Dannelse af og krav til fagudtryk ... 34

7.3 Elektronisk virksomhedsleksikografi ... 36

7.3.1 Elektronisk makrostruktur ... 36

7.3.2 Elektronisk mikrostruktur ... 37

8 Diskussion ... 39

8.1 Lemma- og ækvivalentselektion ... 39

8.2 Diskussion af makrostruktur ... 41

8.3 Diskussion af mikrostruktur ... 42

8.4 Brugermedbestemmelse... 48

9 Konklusion ... 50

10 Litteraturliste ... 52

(6)

Ovenstående indholdsfortegnelse kan simplificeres ved nedenstående model, som specialet struktureres efter. Man kan øverst på hver side følge med i, hvor langt henne man er i specialet.

(7)

1 Indledning

Virksomheder agerer i stigende grad i et internationalt og videnstungt miljø med mere og mere internationalt samarbejde. For at kunne give det rigtige tilbud til de rigtige kunder er det vigtigt, at kunderne – og de interne afdelinger imellem – ikke forvirres af inkonsekvent og uklart sprogbrug. Det er derfor vigtigt, at en ensartet terminologi anvendes, for internt i virksomheden at kunne koordinere sådanne projekter, da misforståelser kan være kostbare i både tid og penge (Almsten & Kristensen, 2008, s.

26). Kirchmeier-Andersen (2003) argumenterer for, at "virksomheder skal være omhyggelige med deres sproglige kommunikation, ellers risikerer de at miste kunder og penge, og i værste fald at blive offentligt til grin".

"[E]n konsekvent sprogbrug [bliver] mere og mere nødvendig hvis man vil arbejde systematisk med den viden der ligger gemt i de elektroniske dokumenter" (Kirchmeier-Andersen, 2003, s. 17), og term- og videnbaser er vigtige værktøjer i opbyggelsen og vedligeholdelsen af den rigtige sprogstrategi (Kirchmeier- Andersen, 2003, s. 18).

Dette er ikke mindst relevant for store, internationale virksomheder som COWI, med deres mange tusinde medarbejdere, hvis sprogbrug og kommunikation – både internt og udad til – sagtens kan blive meget rodet og uensartet, hvis ikke der er nedfældet retningslinjer. COWI udfører løbende projekter på stort set alle kontinenter og med mange forskellige samarbejdspartnere – hvilket er tydeligt ved nogle få klik på COWIs hjemmeside, jævnfør COWI A/S – så vigtigheden af en ensartet terminologi kan ikke underdrives, og Geeb (1998) argumenterer for en fleksibel og innovativ intranetløsning. Terminologi

"handler om ord og om velfungerende kommunikation" (Almsten & Kristensen, 2008, s. 26), og den rette terminologi er derfor også afgørende for COWIs billede udad til.

(8)

2 Problem

I løbet af 2008 har jeg haft fornøjelsen af og udfordringerne med at arbejde med udviklingen af COWIterm – en intranetordbog mellem dansk og engelsk til brug for virksomheden COWIs medarbejdere.

Under udarbejdelsen har jeg, meget naturligt, været nødsaget til at læse leksikografisk og terminologisk teori, og i processen er jeg selv flere gange kommet på idéer, der kunne gøre ordbogen mere brugervenlig.

Desuden har jeg fået idéer udefra til, hvordan ordbogen kunne forbedres – med ordbogens målgrupper og funktioner, jævnfør Bergenholtz & Tarp (1994, s. 16-25), in mente. COWI har imidlertid, i hvert fald som udgangspunkt, ønsket en ganske simpel ordliste med et tilhørende kommentarfelt, da det ville være det nemmeste at sætte op og gå videre ud fra.

På basis af disse erkendelser og erfaringer er det derfor mit formål med dette speciale

at analysere og diskutere forskellige datasøgnings- og datapræsentationsmetoder i virksomhedsordbøger med henblik på forbedring af COWIterm

For på bedst mulig vis at finde frem til en løsning vil udforskningen af følgende underspørgsmål indgå i min analyse og besvarelse:

 Hvilke datasøgningsmetoder diskuteres i litteraturen og i praksis?

o Ville det i COWIterm være relevant at kunne filtrere efter fag?

o Ville det i COWIterm være relevant at kunne filtrere efter tekstgenre?

 Hvilke datapræsentationsmetoder findes i litteraturen og i praksis?

o Hvilke datapræsentationsmuligheder ville være relevante i COWIterm?

o Er det administrativt forsvarligt kun at have et kommentarfelt til alle andre angivelser end lemma/ækvivalent?

o Hvor meget skal brugerne selv have lov til at skræddersy den mængde data, de bliver præsenteret for?

(9)

3 Afgrænsning

Jeg har afgrænset dette speciale både teoretisk og empirisk, og nedenfor har jeg anført hvilke afgrænsninger, der vil blive taget til hjælp for at kunne centrere analysen omkring mit problem.

3.1 Teoretisk afgrænsning

Min teori består af litteratur, der især behandler fagleksikografi og terminologi. De to områder vil kort blive beskrevet herunder:

3.1.1 Fagleksikografi

"Leksikografi er udarbejdelse af ordbøger" (Bergenholtz & Tarp, 1994, s. 27). Deraf kan så udledes, at fagleksikografi er udarbejdelse af fagordbøger. Der findes imidlertid forskellige former for leksikografi.

Udover den praktiske leksikografi, som er det egentlige arbejde med udarbejdelsen af ordbøger, findes der tre typer metaleksikografi, hvori leksikografernes teoretiske overvejelser om og undersøgelser af ordbøger bliver behandlet (Bergenholtz & Tarp, 1994, s. 27). Det drejer sig om brugerforskning, ordbogskritiske undersøgelser samt systematisk ordbogsforskning. Inden for brugerforskning undersøges brugervenligheden i diverse ordbøger og generelle brugervejledninger opstilles; leksikografer inden for ordbogskritiske undersøgelser udarbejder ordbogsanmeldelser og modeller til dette arbejde; og endelig udarbejder leksikografer inden for systematisk ordbogsforskning nye eller forbedrede teorier, der kan bruges ved udarbejdelse af nye ordbøger. (Bergenholtz & Tarp, 1994, s. 28). I dette speciale er det primært systematisk ordbogsforskning, der vil blive fokuseret på.

3.1.2 Terminologi

Definitionen på en term er ifølge Madsen (1999) "et sprogligt tegn, som har en specifik betydning i et fagsprog" (Madsen, 1999, s. 16), og terminologi bliver derved studiet af og arbejdet med termer (udtrykket fagterm er altså en pleonasme). Termer kan for langt størstedelen også være en del af et begrebssystem inden for det pågældende fag (Madsen, 1999, s. 13). I lingvistikken snakker man om, at en term både har et udtryk og et indhold. Udtrykket, hvilket i de fleste tilfælde vil være et fagudtryk, når det kommer til COWIterm, er den skrevne repræsentation af termen, og indholdet er et ligeledes fagligt begreb, som består af karakteristiske træk. En intension består af ét eller af en række karakteristiske træk, hvorunder entiteter ude i virkeligheden kan høre. Den samling entiteter, der defineres af en sådan intension kaldes for en ekstension (Madsen, 1999, s. 16-18). "[U]dtrykket entitet refererer til et hvilket som helst fænomen, det være sig materielt eller immaterielt" (Madsen, 1999, s. 18).

En terminologi kan også henvise til den samling termer, som er speciel for et bestemt fag, men denne betydning vil der i dette speciale blive set bort fra.

3.2 Empirisk afgrænsning

Min empiri består primært af de tekster, jeg har fået adgang til af COWI med henblik på at udarbejde en ingeniørteknisk ordbog med tilføjelse af andre relevante ord såsom økonomiske og juridiske termer samt andre ord, der generelt kan være besværlige at oversætte.

Sekundært inkluderes diskussion af datasøgnings- og datapræsentationsmetoder i andre elektroniske virksomhedsordbøger.

(10)

4 Metode

I dette kapitel vil jeg beskrive, hvorledes resten af specialet vil udforme sig, og dernæst vil jeg give en kort beskrivelse af tilblivelsen af COWIterm.

4.1 Specialet

På baggrund af de indledende afsnit (Indledning, Problem, Afgrænsning og Metode) vil jeg beskrive teori inden for de relevante områder, leksikografi og terminologi. I forening med mit problem vil jeg her fokusere på, hvilke relevante søgemuligheder og datapræsentatiosmetoder, der findes i litteraturen og i praksis.

Dernæst vil jeg i diskussionen, på baggrund af teoriafsnittet samt de forslag og tilføjelser til løsningen af mit problem, som jeg har udarbejdet under mit arbejde med COWIterm, udlede, hvordan ordbogsartikler bør opstilles i en elektronisk onlineordbog som COWIterm.

Til sidst vil jeg i konklusionen svare på, hvordan COWIterm optimalt set bør opstilles for at tilgodese så stor en del af brugergruppen som muligt på baggrund af både teori og diskussion.

4.2 COWIterm

Fra marts til december 2008 har jeg, via min kontaktperson i COWI, Anja Fabech Jensen, haft adgang til to ens korpora på dansk henholdsvis engelsk, hvert bestående af 178 tekster af meget varierende længde (fra under en halv side og op til 17 siders løbende tekst), med henblik på at udvælge relevante termer til brug i COWIterm. Teksterne er løbende blevet udvalgt dels på baggrund af mine månedlige statusrapporteringer, hvor det har været muligt at identificere hvilke områder under COWI, der har været underrepræsenteret i COWIterm. De engelske tekster er blevet produceret på baggrund af de danske kildetekster (se Figur 1). Arbejdet er foregået således, at jeg har identificeret relevante termer i den danske tekst og parret dem med ækvivalenter i den engelske tekst. Derefter er de blevet lemmatiseret og tilføjet COWIterm. Et udsnit af den færdige ordbog i tekstformat kan ses i Figur 2.

Figur 1 Et tekstpar. Kildetekst på dansk og måltekst på engelsk.

(11)

Figur 2 Lille uddrag af COWIterm, som den færdige version så ud i tekstformat. Ændringer og rettelser må i skrivende stund forventes at være indarbejdet.

(12)

5 Brugergrupper

Det er vigtigt først at gøre sig klart, hvem ordbogens målgruppe er, samt hvor meget sproglig henholdsvis faglig viden denne gruppe besidder. Dette er en forholdsvis simpel opgave ved koncernordbøger, da målgruppen mere eller mindre allerede er defineret (Bergenholtz & Tarp, 1994, s. 15- 18+73). I begyndelsen af arbejdet med COWIterm blev det defineret for mig, at ordbogen primært skulle anvendes til oversættelse til og tekstproduktion på engelsk, og at den primære målgruppe for COWIterm er teknikere og ingeniører. Tillige har jeg antaget en sekundær brugergruppe, som består af oversættere og andre sprogmedarbejdere, da det må formodes, at denne gruppe også vil benytte ordbogen som et værktøj i deres arbejdsforløb. En sekundær funktion er oversættelse til og produktion på dansk af personer med andet modersmål end dansk, hvilket resulterer i en tertiær målgruppe.

I Figur 3 har jeg angivet hvor stor fremmedsproglig indsigt henholdsvis faglighed, de tre grupper besidder, samt hvor store ordbogskundskaber, de formodes at have. Tillige har jeg sat mig selv ind i figuren som referencepunkt. Grunden til, at der skal skelnes mellem brugere med forskellig faglighed henholdsvis fremmedsproglig indsigt gør sig gældende dels med hensyn til hvilke elementer, der skal indarbejdes i ordbogsartiklerne, og dels med hensyn til sproget og den tekst, som artiklerne består af. Lægfolk har oftest brug for flere informationer end fagfolk har, og ligeledes har folk med lille sproglig viden brug for flere informationer omkring for eksempel uregelmæssig bøjning og ordforbindelser end folk med stor sproglig viden (Bergenholtz & Tarp, 1994, s. 17).

Graden af ordbogskundskaber er vigtig i den henseende, at folk, der ikke er vante til at slå op i ordbøger, skal hjælpes mere på vej, både i søgeforløbet men også i selve artiklerne. Selvom mediet er skiftet fra papir til et elektronisk medium, er det stadig de samme typer information, brugerne forventer at – og som de oftest kan – finde. Graden af ordbogskundskaber kan give udslag i udformningen af artiklerne samt mængden og udformningen af forkortelser, for eksempel i forbindelse med de faglige markeringer, da nogle kan have svært ved at tyde disse tekstuelle og sproglige signaler.

Jeg har antaget i Figur 3, at en persons ordbogskundskaber er nogenlunde analoge med vedkommendes

Figur 3 Hvor stor viden COWIterms brugergrupper besidder. Model videreudviklet fra Bergenholtz & Tarp (1994), jævnfør punkt 7.1.4 Mikrostruktur (under ordforbindelser).

(13)

fremmedsproglige indsigt, da det må formodes, at oversættere og andre sprogmedarbejdere jævnligt slår op i en ordbog og dermed opbygger erfaring på dette område i modsætning til teknisk uddannede, der som oftest ikke har med sprog at gøre.

COWIterms primære brugergruppe (rød cirkel) består af fagfolk inden for ingeniørfag og de besidder en stor faglighed bestående af teknisk viden. Til gengæld er graden af deres fremmedsproglige indsigt begrænset. Graden af denne gruppes ordbogskundskaber er ligeledes lav, hvilket til sammen gør, at ordbogen og dens tekstuelle og sproglige signaler skal være meget let tilgængelige for at denne gruppe kan få nytte af ordbogen.

COWIterms sekundære brugergruppe (blå cirkel), som består af oversættere og andre sprogmedarbejdere, ligger ikke langt fra mig selv; dog må det formodes, at denne gruppe er i besiddelse af noget mere faglighed end mig selv. Da de dog ikke arbejder med tekniske processer og maskiner til hverdag, har jeg angivet denne gruppe til at besidde middel faglighed, dog ikke langt fra grænsen til stor faglighed. Denne gruppe besidder tillige stor fremmedsproglig indsigt samt en høj grad af ordbogskundskaber.

Den tertiære brugergruppe består, ligesom den primære brugergruppe, af personer med høj faglighed og viden inden for teknik og ingeniørfag. Deres fremmedsproglige indsigt er dog sværere at definere, da det er en blandet gruppe af alle udefrakommende, der kunne tænkes at benytte COWIterm, men da denne gruppe ikke har dansk som modersmål og man ikke kan antage, at gruppen har engelsk som modersmål, er de ringere stillet end den primære gruppe. Ligeledes er det ukendt, hvor ofte de slår op i en ordbog samt graden af kendskab til vestligt producerede ordbøger, og til sammen gør alt dette, at gruppen i Figur 3 er defineret til at have mindre fremmedsproglig (i dette tilfælde dansk) indsigt end den primære målgruppe.

Hvad angår fremmedsproglig indsigt i den primære gruppe kunne man forestille sig, at en vis del heraf besidder terminologi på fremmedsproget, men at de mangler grammatik og generel sproglig viden til at kunne skrive eller oversætte en tekst, hvorimod man i den sekundære gruppe kunne forestille sig, at det er den fagsproglige viden (terminologi), der halter bagefter.

Som det kan ses af Figur 3 (grønne cirkler) har jeg flyttet mig i løbet af ordbogsprojektet. Dels har jeg lært samt kender nu til mere teknisk terminologi og sprogbrug, og dels besidder jeg nu flere ordbogskundskaber, da jeg forstår motivationen for de forskellige valg i ordbøger.

(14)

6 Ordbogsfunktioner

Som tidligere nævnt er COWIterm primært intenderet til funktionerne oversættelse til og produktion på engelsk. Til produktion af tekster på et fremmedsprog angiver Bergenholtz & Tarp (1994) en række elementer, der bør inkorporeres, og disse udgør 1) ortografi, genus, udtale, uregelmæssighed, kollokationer, andre informationer om sprogbrug; 2) norm, faglig markering og/eller faglig forklaring (Bergenholtz & Tarp, 1994, s. 21). Tillige diskuteres, om dataene skal placeres i en ordliste, der går fra dansk-engelsk eller engelsk-dansk, men det anbefales, at data præsenteres i begge ordlister (Bergenholtz &

Tarp, 1994, s. 19-20).

Til oversættelse anbefales det at inkorporere følgende elementer: 1) til modersmålet: ordklasse, genus, udtale, uregelmæssighed; 2) til fremmedsproget: ortografi, genus, udtale, uregelmæssighed, kollokationer, andre informationer om sprogbrug; 3) ækvivalent(er); 4) eventuelt om graden af ækvivalens; 5) norm, faglig markering og/eller kort forklaring (Bergenholtz & Tarp, 1994, s. 21).

Hvad angår produktion på og oversættelse til dansk af den tertiære målgruppe, er det de samme elementer som angivet ovenfor, der er relevante. Dette er tilfældet, fordi dansk for den tertiære brugergruppe er et fremmedsprog, og dermed gælder de samme retningslinjer som for oversættelse af dansk til engelsk og produktion på engelsk for den primære og sekundære brugergruppe, for hvem engelsk er fremmedsproget. Dog er den tertiære brugergruppe yderligere handikappet i denne forbindelse, da engelsk ikke kan siges at være modersmålet.

Som det kan ses af overstående, er der sammenfald mellem nogle af de informationer, der medtages i forbindelse med de to funktioner, hvilket letter arbejdet med at producere ordbøger, der kan benyttes i multiple situationer. Hvis alle informationer alligevel bliver gjort tilgængelige for alle brugere på begge sprog, er det dog af mindre betydning, hvilke informationer der præsenteres i hvilken forbindelse.

Eftersom ordbogen sekundært også er til brug for folk med andet modersmål end dansk, er der ligeledes forklaringer, eksempler med mere ved det danske lemma, hvilket igen gør, at ordbogen bliver anvendelig til reception og forståelse af tekster på dansk (Bergenholtz & Tarp (1994, s. 20-21).

(15)

7 Teori

I det følgende kapitel vil jeg beskrive den teori, som vil ligge til grund for diskussionen af mit problem, det vil sige, som allerede nævnt i underkapitel 3.1 Teoretisk afgrænsning, teori omhandlende fagleksikografi og terminologi samt teori omkring onlineleksikografi.

7.1 Fagleksikografi

Madsen (1999) inddeler det terminologiske arbejdsforløb i tre faser, "som resulterer i udarbejdelse af terminologiske artikler til en termbase eller en fagordbog" (Madsen, 1999, s. 124):

1) Forarbejde

- Afgrænsning af arbejdsområdet

- Indsamling af dokumentationsmateriale og kontakt med fageksperter - Bedømmelse og udvælgelse af dokumentationsmateriale

- Eventuel efterjustering af afgrænsningen 2) Terminologisk arbejde

Parallelt for begge sprog:

- Identificering af termer og indsamling af oplysninger (definitioner, teksteksempler etc.) - Systematisering (udarbejdelse af begrebssystemer)

Efter registrering af terminologi på begge sprog:

- Sammenligning mellem de to sprogs begreber (definitioner og begrebssystemer) 3) Terminografisk arbejde

- Udarbejdelse af terminologiske enheder (artikler)

(Madsen, 1999, s. 124) Denne arbejdsmetode er ikke helt ulig den, som Bergenholtz & Tarp (1994) beskriver, og som vil blive præsenteret i det følgende.

Når man planlægger en ordbog, skal man først og fremmest fastlægge ens brugergruppe og derudfra i hvilke situationer, ordbogen skal anvendes (Bergenholtz & Tarp, 1994, s. 15). Dette er som regel en forholdsvis simpel opgave ved udarbejdelsen af branche- og koncernordbøger i forhold til ved udarbejdelsen af andre ordbøger, da brugergruppen her allerede er defineret, jævnfør kapitel 5 Brugergrupper. Dog skal man alligevel gøre sig nogle overvejelser i denne forbindelse, såsom hvor stor faglig henholdsvis sproglig viden, den enkelte bruger besidder (Bergenholtz & Tarp, 1994, s. 17-18), samt om ordbogen skal benyttes ved reception, produktion eller oversættelse af tekster (Bergenholtz & Tarp, 1994, s. 15).

Ordbogens empiri baseres optimalt set på et tekstkorpus svarende til de tekster, som brugergruppen må forventes at skulle beskæftige sig med (Bergenholtz & Tarp, 1994, s. 15), da disse tekster indeholder den terminologi, som brugerne eftersøger. Hermed bliver der som sådan ikke tale om et enkelt eller nogle få fagområder, da en virksomhedsbaseret intranetordbog som COWIterm kan spænde over så vidt forskellige fag og begreber som regnskabsnormer over erstatningssager til produktsortiment.

(16)

Bergenholtz & Tarp (1994) beskriver alle elementer indeholdt i en ordbog, og behandler derfor kun på et begyndende og nu forældet stadium elektroniske ordbøger, men mange af grundelementerne og overvejelserne omkring for eksempel opbygningen af mikrostrukturen er stadig yderst relevante. Jeg vil i det følgende starte med at definere de forskellige ordtyper og angive retningslinjer for, hvordan disse behandles. I tilknytning hertil kommer en kort redegørelse for lemma- og ækvivalentselektion. Herefter vil jeg gå mere i dybden med de forskellige dele af mikrostrukturen efterfulgt af en gennemgang af makrostrukturer.

7.1.1 Ordtyper

Når man skal udvælge hvilke ord, der skal lemmatiseres, må man først have gjort sig nogle tanker omkring, hvad et ord er. Bergenholtz & Tarp (1994) nævner ortografiske, fonologiske, grammatiske samt leksikalske ord.

Et ortografisk ord er en sammensætning af bogstaver, der har mellemrum eller sætningstegn omkring sig, men det kan ikke indeholde mellemrum og/eller sætningstegn, da det så ville udgøre to eller flere ortografiske ord. Selvom et begreb som "fuldstændigt endossement" ville kunne slås op i rette ordbog – og i visse sammenhænge også anses som et enkelt ord – består det af to ortografiske ord: "fuldstændigt" og

"endossement". Ofte er det sådan med termer, der består af flere ortografiske ord, at betydningen ikke er kompositionel, hvilket vil sige, at man ikke kan udlede betydningen af de begreber, der indeholdes i de enkelte ortografiske ord (Bergenholtz & Tarp, 1994, s. 100) (Trask, s. 1) (Madsen, 1999, s. 14).

Fonologiske ord findes i talesprog, og "kan isoleres ved hjælp af grænsesignaler, som kan være endda meget forskellige fra sprog til sprog" (Bergenholtz & Tarp, 1994, s. 100). Således deles en talestrøm på for eksempel engelsk op i fonologiske ord ved at tælle hovedtryk: Ét hovedtryk dækker ét fonologisk ord, og således kan hele eller dele af sætninger udgøre et enkelt fonologisk ord uden hensyntagen til opdelingen i ortografiske ord (Trask, s. 2).

Et grammatisk ord kan bestå af kun en ordstamme eller af en stamme samt et fleksionsmorfem. Dette kan illustreres ved hjælp af stammen "træ" og fleksionsmorfemet "-er". Desuden kan visse ortografiske ord repræsentere flere grammatiske ord (Bergenholtz & Tarp, 1994, s. 100) (Trask, s. 4-5).

Et leksem (også kaldet leksikalsk ord) er betegnelsen for en gruppe grammatiske ord med samme stamme og fleksionsparadigme. For eksempel er "træ" og "træer" to forskellige repræsentationer af det abstrakte leksem TRÆ. Det er som hovedregel leksemerne, der lemmatiseres i ordbøger, da denne form helt og fuldkomment udgør stammen og derfor ikke har yderligere affikser eller fleksionsmorfemer tilknyttet. Derfor omtales denne repræsentation af leksemet (leksemer er jo abstrakte enheder) som grundformen. Det kan dog være hensigtsmæssigt ligeledes at lemmatisere uregelmæssigt dannede grammatiske ord, da disse ellers kan være svære at finde i ordbogen. I sådan en situation er hovedformålet med artiklen at henvise til det rette leksem, hvor forklaring med mere så vil være angivet (Bergenholtz &

Tarp, 1994, s. 100-101) (Trask, s. 3).

Herudover kan man også med fordel lemmatisere orddele (også kaldet streglemmata), det vil sige affikser og ordstammer, da en sådan selektion kan give "brugeren indblik i regelmæssige orddannelser, som ikke alle kan lemmatiseres" (Bergenholtz & Tarp, 1994, s. 115) samt forkortelser, da disse er hyppige i visse fagsprog, og det er ikke altid indlysende, hvilken uforkortet term forkortelsen står i stedet for (Bergenholtz

(17)

& Tarp, 1994, s. 105+115). Initialord er en type forkortelser, der dannes ved at trække begyndelsesbogstaverne i en ordrække sammen. Initialord (eller initialforkortelser, som de også kaldes), der kan udtales som et selvstændigt ord (for eksempel "NATO"), kaldes for et akronym, jævnfør Trask (s. 9- 10) samt Madsen (1999, s. 108). Andre eksempler på forkortelser er ellipseord og teleskopord. Ellipseord dannes ved afkortning, hvor enten den første eller den sidste del af ordet skæres væk. Det er oftest sådan, at det fulde ord er gammeldags eller i hvert fald sjældnere brugt end det afkortede ord. Teleskopord dannes ved at udtage forskellige dele af ofte flerordstermer og sætte dem sammen, så de kan udtales som et selvstændigt ord. Dette er dog en noget sjældnere praksis på dansk end på engelsk (Trask, s. 9-11) (Madsen, 1999, s. 108-109).

Madsen (1999) skelner herudover mellem tre typer ord, nemlig rodord, sammensætning og afledning.

Således består rodord kun af en rod uden nogen former for affikser, hvor afledninger består af en rod samt et eller flere affikser. Rodord og afledninger er til sammen, hvad Bergenholtz & Tarp (1994) kalder for grammatiske ord. Sammensætninger betegnes som bestående af minimum to ordstammer med eller uden affikser, der på dansk skrives som ét ortografisk ord (ofte med et bindebogstav, som regel "e" eller "s"), men som på engelsk tit består af to ortografiske ord (Madsen, 1999, s. 102). Sammensætninger som beskrevet her er analogt med hvad Bergenholtz & Tarp (1994, s. 101) benævner ordgruppeleksemer.

Derudover nævnes også ordgrupper (Madsen, 1999, s. 106), der dækker over det samme som flerordstermer, som består af to eller flere ortografiske ord.

Det foreslås, at hvis ikke grundformen benyttes i det pågældende fagsprog, skal den grammatiske form, der benyttes, lemmatiseres. Grundformen kan man så anføre eventuelt udelukkende som et henvisningslemma (Bergenholtz & Tarp, 1994, s. 101).

Det foreslås også, at man lemmatiserer relevante grammatiske termer, og især de termer, der bliver anvendt ved grammatiske angivelser. På denne måde behøver brugeren ikke at søge hjælp andetsteds for at finde ud af, i hvilke sammenhænge et bestemt ord kan bruges (Bergenholtz & Tarp, 1994, s. 115).

Udover Madsens (1999) og Bergenholtz & Tarps (1994) inddeling af ord, diskuterer Trask (What Is A Word?) en række andre ordtyper i dybden, som jeg af pladshensyn ikke vil komme nærmere ind på her.

7.1.2 Lemmaselektion

Bergenholtz & Tarp (1994, s. 101-102) diskuterer en række forskellige måder at finde frem til den rette terminologi på, når man arbejder med enkelte fagområder. Det er dog ikke relevant her, da specialet ikke omhandler et bestemt fag men en koncerns samlede fagsprog, som spænder over en uudtømmende række fag og fagområder.

"Det er ikke ualmindeligt, at bilingvale ordbøger bliver vendt, dvs. at Lb-ækvivalenterne [sic] i en La-Lb- ordbog bliver selekterede til en -Lb-La-ordbog" (Bergenholtz & Tarp, 1994, s. 102), hvilket kun kan anbefales for ikke-kulturbundne fag. Under alle omstændigheder ved vending af ordbøger skal man sørge for at læse ordbogen igennem og rydde op i eventuelle enslydende lemmata samt kontrollere ækvivalentrelationer, diverse forklaringer samt eksempler (Bergenholtz & Tarp, 1994, s. 102).

Normalt udgøres lemmabestanden i fagordbøger af

(18)

1) rene termer

2) både rene termer og andre udtryk, som ikke er fællessproglige 3) alle udtryk, om hvilke det antages, at de forekommer regelmæssigt

4) udtryk, som forekommer med en fastlagt mindstefrekvens i et givet fagsprogligt korpus

(Bergenholtz & Tarp, 1994, s. 103) Ved flerfagsordbøger bliver man nødt til at anvende enten model 2) eller 3), skønt disse "indebærer

introspektive skøn, som ikke sikrer en systematisk og konsekvent selektion" (Bergenholtz & Tarp, 1994, s.

104).

7.1.3 Ækvivalentselektion

"Det er […] af største betydning, at leksikografen har et pålideligt, aktuelt, systematisk sammensat og lettilgængeligt redskab til sin rådighed, når ækvivalenterne skal udvælges. Et tekstkorpus, der er sammensat med ovennævnte mål for øje, udgør et sådant redskab"

(Bergenholtz & Tarp, 1994, s. 105-106).

Har man ikke noget korpus til sin rådighed, anbefales det, at man kontrollerer ækvivalenter til brug i en bilingval ordbog frembragt på anden vis ved at foretage opslag i faglige, monolingvale L2-ordbøger og eventuelt sammenholde disse resultater med opslag i tilsvarende L1-ordbøger. Giver dette stadig ikke noget entydigt resultat, må man søge i yderligere materiale såsom lærebøger eller tekster fra producenter, optimalt set på begge sprog (Bergenholtz & Tarp, 1994, s. 107).

Derudover er der fem procedurer, der bør gennemgås, når der skal selekteres ækvivalenter i korpora:

1) Leksikografen vil via introspektion have kendskab til en række lemmatas ækvivalenter, som så hurtigt kan verificeres ved søgning i et L2-korpus.

2) Ved tilfælde, hvor man ikke er helt sikker, men alligevel kan afgrænse mulighederne, kan man søge i korpusset på de muligheder, man mener at have, eventuelt meget gerne med trunkeringer, så man er sikker på at få alle former og dermed alle sammenhænge med.

3) Hvis ikke en brugbar ækvivalent findes ved hjælp af ovenstående metoder, kan man prøve at søge på ord i den kontekst, hvori lemmaet står. Dog skal man kun søge på ord, hvor der med stor sandsynlighed kan antages en enkelt ækvivalent uden heller at søge på for generelle, samt for sammenhængen uvæsentlige, søgeord.

4) Hvis hverken introspektion, kvalificerede gæt eller sproglig kontekst kan hjælpe en til at finde den rette ækvivalent, må man skabe sig et overblik over, hvilket produkt teksten omhandler. Herefter kan man så søge i L2-korpus efter samme produkt og finde termen i en parallel sammenhæng.

5) Denne sidste mulighed for ækvivalentselektion ved hjælp af korpus er forholdsvis tidskrævende og derfor den sidste udvej. Den indebærer en gennemlæsning af de nærmeste afsnit omkring forekomsterne af lemmaet og derefter søgning efter andre ord inden for det tema, hvori lemmaet indgår. De L2-tekster, hvor de fremkomne fund indgår, læses omhyggeligt igennem, indtil man støder på en parallel tematisk kontekst. Denne metode må anvendes oftest, når der skal udarbejdes bilingvale ordbøger inden for kulturbundne fag.

(Bergenholtz & Tarp, 1994, s. 107-109)

(19)

7.1.4 Mikrostruktur

Mikrostrukturen er den måde, hvorpå selve ordbogsartiklerne er opbygget. Når man slår et ord op, hvilke forskellige oplysninger kan man så finde, og hvordan er de repræsenteret (Bergenholtz & Tarp, 1994, s. 216). Det være sig udtale, grammatiske angivelser, faglige og sproglige markeringer, ækvivalent(er), faglige forklaringer, ordforbindelser, eksempler, synonymer og antonymer samt henvisninger.

Bergenholtz & Tarp (1994) belyser vigtigheden af, at der er system i, i hvilken rækkefølge de forskellige elementer i en ordbogsartikel bliver præsenteret. Dette kan man gøre ved først at lave et skema over hvilke informationer, der skal stå hvor i artiklen – blandt andet fordi det ikke er alle informationer, der skal med i alle artikler. Det kommer an på lemmaet; på både ordklassen (det er jo for eksempel kun verber, der kan være transitive) og på hvor meget forklaring, lemmaet har brug for. Netop for at sikre, at de forskellige ordklasser bliver behandlet til fulde – og ens – kan man oprette et artikelskema for hver ordklasse. Dette er især relevant, hvis man påtænker også at inkludere fleksioner (Bergenholtz & Tarp, 1994, s. 216).

Bergenholtz & Tarp (1994) er her selv lidt ustrukturerede, måske fordi det lange afsnit omkring mikrostruktur i bogen nærmest er løbende tekst. Jeg vil dog i det følgende prøve at skabe lidt orden i det.

Jeg vil i øvrigt ligeledes kun fokusere på funktionerne oversættelse og produktion, da disse er de primære funktioner i projektet hos COWI, jævnfør kapitel 6 Ordbogsfunktioner.

Udtaleangivelse er noget, der angives i mange ordbøger, og det kan gøres på forskellige måder alt efter, hvor detaljeret det skal være. Man kan gøre det i selve lemmaet ved hjælp af trykstreger, eller man kan danne et separat felt umiddelbart efter lemmaet – før enhver grammatisk angivelse – med fonetisk skrift.

Det samme gør sig selvsagt gældende for en udtaleangivelse for ækvivalenten. Oplysninger om udtale er ikke direkte relateret til ordbogsfunktionerne oversættelse og produktion, da disse omhandler skrevet sprog, men det kan alligevel være en fordel at have med, "da kendskab til udtalen for mange mennesker har en hukommelsesstøttende funktion" (Bergenholtz & Tarp, 1994, s. 136+220).

Grammatiske oplysninger til lemmaet bør "placeres i et grammatisk felt efter lemmaet, men før ækvivalenten, og grammatiske oplysninger til ækvivalenten bør placeres i et grammatisk felt efter denne"

(Bergenholtz & Tarp, 1994, s. 217). Det bør således altid være sådan, at oplysninger specielt tilhørende lemmaet kommer umiddelbart efter lemmaet og før ækvivalenten, og at oplysninger specielt tilhørende ækvivalenten kommer umiddelbart efter ækvivalenten og før eventuelle øvrige oplysninger, der har relevans for både lemma og ækvivalent.

Bergenholtz & Tarp (1994) angiver de forskellige elementer, som grammatikfeltet kan og i de fleste tilfælde bør indeholde, hvilke er: ordklasse, køn, morfologi og syntaks. Det er ligeledes vigtigt at standardisere rækkefølgen af de feltinterne oplysninger indeholdt i grammatikfeltet, da det vil lette arbejdet for brugeren med at finde de relevante oplysninger (Bergenholtz & Tarp, 1994, s. 217). Især ved verber skal man passe på ikke at forvirre brugeren; det anbefales således kun at angive fleksionsmønstre ved uregelmæssige bøjninger, da de regelmæssige bøjninger som regel ikke vil være noget problem, og derfor kan være forvirrende. Hvis det skulle vise sig, at et forholdsvist kompliceret grammatisk fænomen går igen ved flere lemmata, kan det være en fordel at oprette – og henvise til bestemte dele af – en ordbogsgrammatik (Bergenholtz & Tarp, 1994, s. 114-115).

(20)

Faglige markeringer til lemmata og/eller ækvivalenter angives oftest som forkortelser, og angiver korte faglige oplysninger. Der findes to hovedtyper, som defineres som "faglige markeringer, der angiver, hvilket fagligt tilhørsforhold et lemma/en ækvivalent har, og faglige markeringer, der angiver et sprogligt semantisk indhold inden for et eller flere fagsprog" (Bergenholtz & Tarp, 1994, s. 226). Disse to hovedtyper deles yderligere op. Der findes således faglige markeringer, der angiver en bestemt terms faglige eller delfaglige tilhørsforhold. Især ved polysemi kan den faglige markering også tilkendegive egenskaber ved den respektive ækvivalent, eventuelt med angivelse af hvilket produkt, materiale eller funktion, egenskaben dækker. Ligeledes kan den faglige markering "give oplysninger, om det drejer sig om f.eks.

processen eller funktionen, eller om det apparat, der udfører denne proces eller funktion" (Bergenholtz &

Tarp, 1994, s. 155). Endelig kan der angives en faglig norm som en særlig type faglig forklaring, såsom "DS"

(Dansk Standard) og "ISO". Dette kræver dog, at brugeren er bekendt med normen for at kunne få det fulde udbytte af denne, men fordelen er, at vedkommende kan være sikker på, at han har lokaliseret den rigtige term (Bergenholtz & Tarp, 1994, s. 154-155+226).

En faglig markering kan have forskellige funktioner, og optimalt set vil den supplere den faglige forklaring, så den faglige forklaring ikke behøver at indeholde angivelse omkring fagområde. Men den faglige markering kan også stå i stedet for en faglig forklaring og alligevel være fuldt tilstrækkelig til brug for visse funktioner (Bergenholtz & Tarp, 1994, s. 156).

De faglige markeringer kan være særdeles nyttige, men de skal bruges med omtanke, og man må altid tage hensyn til ordbogens funktioner samt brugergruppe: "Er de faglige markeringer korrekt anvendt, vil en fagmand kunne have stort udbytte af ordbogen i forbindelse med produktion på og reception af et fremmedsprog, samt i forbindelse med oversættelse til og fra modersmålet" (Bergenholtz & Tarp, 1994, s. 157). Det anbefales i langt de fleste tilfælde også at inkorporere faglige forklaringer, specielt ved kulturbundne termer (jævnfør afsnittet om faglige forklaringer nedenfor) (Bergenholtz & Tarp, 1994, s.

157).

Spørgsmålet om, hvornår der skal gives faglige markeringer, er der ikke noget entydigt svar på, men det anbefales, at man ved flerfaglige ordbøger bringer flest mulige angivelser om fagligt tilhørsforhold. I den forbindelse, skal man være påpasselig ved udformningen af de forskellige forkortelser, der anvendes som faglige markeringer. Disse skulle meget gerne være så sigende, at det er muligt at gætte sig til meningen af dem og altså således, at de fordrer et minimum af opslag til forkortelseslisten i brugervejledningen (Bergenholtz & Tarp, 1994, s. 158-159).

Til sidst er der spørgsmålet om beskrivelsessproget, som anbefales skrevet på brugerens modersmål, men i det omfang det kan lade sig gøre, er det en god idé alligevel at anvende internationalismer – især hvis brugergruppen kan have forskellige modersmål (Bergenholtz & Tarp, 1994, s. 160).

Placeringen af den faglige markering bør være efter eventuelle grammatiske oplysninger, men hvis termen kan anvendes inden for flere forskellige fag med forskellige betydninger, anvendes polysemiindeks, og i så fald kan den faglige markering stå enten før eller efter de grammatiske oplysninger: Hvis de grammatiske oplysninger dækker både lemma samt alle delbetydningerne, placeres disse umiddelbart efter lemmaet, og altså før den faglige markering, men hvis delbetydningerne har forskellige grammatiske egenskaber, bør disse placeres efter den faglige markering (Bergenholtz & Tarp, 1994, s. 226-227).

(21)

Placeringen af det vel nok mest betydningsfulde element i en bilingval produktions- og oversættelsesordbog, ækvivalenten – samt rækkefølgen af eventuelt flere ækvivalenter – er ikke så ligetil, som man ellers kunne foranlediges til at tro.

"Som udgangspunkt kan man sige, at i oversættelses- og produktionsordbøger bør ækvivalentfeltet placeres forholdsvis tidligt i rækkefølgen af felter, da ækvivalenten her spiller en betydelig rolle"

(Bergenholtz & Tarp, 1994, s. 224). Således undgår man at skulle lede for længe efter ækvivalenten, når man skal oversætte eller producere et stykke tekst og hurtigt skal have fat i oversættelsen af et bestemt ord. Men der er også andre faktorer, der spiller ind ved placeringen af ækvivalentfeltet, såsom om der er tale om kulturbundne eller ikke-kulturbundne fag.

Ved ikke-kulturbundne fag vil forklaringen til lemma og ækvivalent langt oftest være den samme, så her bør ækvivalenten i en oversættelses- og/eller produktionsordbog stå før forklaringsfeltet, da forklaringen i så fald vil dække begge termer. Ved kulturbundne fag "vil de faglige forklaringer til mange lemmata være indholdsmæssigt forskellige fra forklaringerne til ækvivalenterne, for så vidt der overhovedet findes ækvivalenter" (Bergenholtz & Tarp, 1994, s. 224). I dette tilfælde kan man gøre en af to ting: Man kan enten give en samlet forklaring, der dækker både lemma og ækvivalent, eller man kan give dem hver sin forklaring (Bergenholtz & Tarp, 1994, s. 224). Hvis man vælger at give dem hver sin forklaring, er det vigtigt at placere lemmaets forklaring efter lemmaet og ækvivalentens forklaring efter ækvivalenten, da der så ikke vil være tvivl om, hvilken forklaring der hører til hvad. Dog bør den faglige forklaring komme efter eventuelle grammatiske oplysninger og udtaleangivelser (Bergenholtz & Tarp, 1994, s. 225). Det samme gør sig selvsagt gældende ved polyseme lemmata, hvor artiklen, ud over polysemiindeks, bør struktureres på en sådan måde, at forklaringerne til de enkelte ækvivalenter kommer umiddelbart efter disse.

I forbindelse med organiseringen af flere ækvivalenter til ét lemma, "er der flere faktorer, der skal tages hensyn til, bl.a. antallet af ækvivalenter" (Bergenholtz & Tarp, 1994, s. 221). Både monoseme lemmata og polyseme lemmata kan have flere ækvivalenter på det pågældende sprog. Ved monoseme lemmata foreslår Bergenholtz & Tarp (1994), at man i de fleste tilfælde samler alle ækvivalenter i ækvivalentfeltet, men i visse tilfælde kan man også placere blot én ækvivalent i ækvivalentfeltet og de resterende i synonymfeltet. Der er forskellige omstændigheder, der spiller ind i forbindelse med denne strukturering og også i forbindelse med hvilken ækvivalent, man i så fald skal placere i ækvivalentfeltet.

Ligeledes, hvis man vælger at placere flere ækvivalenter i ækvivalentfeltet henholdsvis synonymfeltet, hvordan disse så skal organiseres. Overvejelser, som for eksempel om der i faget, der dækkes, er brug for stilistisk variation, såsom inden for erhvervskorrespondance, eller om dette ikke kan tilrådes, såsom i fag inden for teknik, er nogle, leksikografen bliver nødt til at gøre sig. Hvis det er et fag, hvor stilistisk variation tilskyndes, bør alle ækvivalenter placeres i ækvivalentfeltet, mens man i fag inden for teknik som regel skal holde samme term gennem hele teksten for at undgå forvirring, og derfor har man kun behov for en enkelt ækvivalent. Hvad angår organiseringen af ækvivalenterne, kan man benytte en ren alfabetisk tilgangsmåde og enten placere samtlige ækvivalenter i ækvivalentfeltet i alfabetisk rækkefølge; eller man kan placere den første ækvivalent i den alfabetiske rækkefølge i ækvivalentfeltet og de øvrige i synonymfeltet (også i alfabetisk rækkefølge). Denne fremgangsmåde er klart nemmest og mindst tidskrævende for leksikografen men derimod ikke til så stor hjælp for den ufagkyndige.

Leksikografen kan også vælge at lave en frekvensanalyse på de forskellige ækvivalenter og følgende

(22)

placere dem alle i ækvivalentfeltet herefter. Eller man kan placere den ækvivalent med den højeste frekvens i ækvivalentfeltet og resten i synonymfeltet – enten alfabetisk eller efter frekvens. Til sidst er der også den mulighed, at leksikografen selv tager stilling til brugen af de forskellige ækvivalenter og efterfølgende placerer dem herefter (Bergenholtz & Tarp, 1994, s. 221-222).

Det er ikke anbefalelsesværdigt i en fagordbog at placere alle ækvivalenter til polyseme lemmata i ækvivalentfeltet – i hvert fald ikke uden polysemiindeks samt "en eller anden form for betydningsadskillende markering" (Bergenholtz & Tarp, 1994, s. 223). Hvis to eller flere ækvivalenter forefindes inden for samme betydningsadskillende markering, må man gøre sig de samme tanker som ovenfor (Bergenholtz & Tarp, 1994, s. 222-223). Dog skal man holde sig for øje, at "[u]anset hvilken løsning man vælger, må rækkefølgen af ækvivalenter hhv. synonymfeltet klart fremgå af ordbogens brugervejledning" (Bergenholtz & Tarp, 1994, s. 223), hvilket understreger nødvendigheden af en udførlig brugervejledning til en hvilken som helst ordbog.

Det er blandt andet her, at der kommer til at herske lidt tvivl om rækkefølgen af felter i mikrostrukturen.

I beskrivelsen af både den faglige forklaring og af kollokationsfeltet foreslås, at de hver især placeres umiddelbart efter det grammatiske felt til ækvivalenten. Jeg vil dog mene, at det mest naturlige vil være først at få en forklaring på, hvad lemmaet omhandler, så man er sikker på at have fat i det rigtige lemma og så derefter finde frem til eventuelle kollokationer.

Ved ikke-kulturbundne fag vil det være naturligt at placere den faglige forklaring efter ækvivalenten, da forklaringen således dækker både lemma og ækvivalent, og det er hurtigere for brugeren at finde ækvivalenten. Ved kulturbundne fag vil forklaringerne til henholdsvis lemma og ækvivalent ofte være forskellige, hvorfor man her kan gøre en af to ting. Enten kan man lave én forklaring til lemmaet og én til ækvivalenten, eller man kan lave en sammenfattende forklaring til både lemma og ækvivalent og indsætte den efter ækvivalenten. Både ved kulturbundne og ikke-kulturbundne fag fungerer det bedst, hvis den faglige forklaring står efter eventuelle grammatiske oplysninger og udtaleangivelser. Ved polysemi skal forklaringerne selvsagt stå logisk, for eksempel med en forklaring af lemma og forklaringer ved hver af delbetydningerne (Bergenholtz & Tarp, 1994, s. 224-225).

"Det kan […] være meget svært at give nøjagtige retningslinjer for, hvornår der er behov for faglige forklaringer ved tekstproduktion og oversættelse, da det i høj grad vil afhænge af forudsætningerne hos den konkrete bruger" (Bergenholtz & Tarp, 1994, s. 146). Det er derimod lettere at give retningslinjer for mængden af faglige forklaringer, hvis ordbogen tillige intenderer funktionen reception og/eller faglig indføring i faget. Hvis ordbogen tillige indeholder ord fælles med almensproget, må man gøre op med sig selv, om det er relevant ligeledes at forklare disse (Bergenholtz & Tarp, 1994, s. 146-147).

Ved faglig indføring har brugeren selvsagt brug for mange flere informationer, end oversætteren og tekstproducenten har, da man må gå ud fra, at en, der producerer fagtekster, har styr på fagområdet men at vedkommende har brug for ordbogen som et hukommelsesstøttende værktøj. Oversætteren kan i princippet oversætte de fleste ord udelukkende ved hjælp af en ækvivalentangivelse, men for at kunne oversætte en samlet tekst har oversætteren ligeledes brug for i hvert fald et minimum af faglig viden (Bergenholtz & Tarp, 1994, s. 146).

(23)

Alle egentlige termer, som er kendetegnet ved at have deres plads i en fagsystematik (der på den ene eller anden måde definerer fagområdets grænser), bør forklares. Dette kan enten ske i selve ordbogsartiklen, hvor termen er lemma, eller – under brug af henvisninger fra og til de respektive termer – i andre artikler eller såkaldte overbliksartikler. Overbliksartikler er kendetegnede ved at give en samlet forklaring til relaterede termer. Dette kan være relevant for eksempel i forbindelse med synonymi og antonymi, underbegreber og overbegreber samt ved ordklasseskift (Bergenholtz & Tarp, 1994, s. 147).

Der er tilfælde, hvor den faglige forklaring leder brugeren hen på det rigtige lemma eller den rigtige ækvivalent. Dette er tilfældet ved homonymi og polysemi, hvor en faglig forklaring kan være af altafgørende betydning med hensyn til at vælge den rigtige term (Bergenholtz & Tarp, 1994, s. 148).

Der stilles forskellige krav til den faglige forklaring, alt efter om ordbogen henvender sig til lægfolk eller fagfolk. En fagmand vil stille krav til en præcis, videnskabelig definition og vil synes, at det meste i en forklaring udarbejdet til lægfolk vil være overflødigt og banalt (Bergenholtz & Tarp, 1994, s. 148).

Ligeledes er der forskel på, om der er tale om kulturbundne eller ikke-kulturbundne fag, da det især ved kulturbundne fag kan være relevant at give komparative oplysninger, da der sjældent findes fuldækvivalens i disse fag (Bergenholtz & Tarp, 1994, s. 151).

Hvad angår stilen, skal man ikke være bange for at variere fra artikel til artikel. Der er artikler, der kan klare sig med en kortfattet definition, nogle gange bestående af en ufuldstændig sætning uden subjekt og finit verbum, og der er andre, der kræver længere forklaringer, hvor ufuldstændige sætninger bliver for besværlige at arbejde med. En varieret stil højner både læseværdigheden samt det æstetiske indtryk og er dermed at foretrække (Bergenholtz & Tarp, 1994, s. 153).

Det diskuteres kun kort og vagt hvilket sprog, man skal bruge til forklaringssproget; dog nævnes det, at det som tommelfingerregel bør være brugerens modersmål (Bergenholtz & Tarp, 1994, s. 154).

Efter det grammatiske felt og den faglige forklaring til ækvivalenten er det praktisk at placere ordforbindelserne, der i øvrigt bør struktureres på en sådan måde, at den ækvivalente ordforbindelse følger umiddelbart efter ordforbindelsen på udgangssproget. Der skelnes mellem tre typer ordforbindelser:

normal ordforbindelse, som også kaldes kollokation; fast ordforbindelse, som også kaldes idiom; samt stivnet ordforbindelse, som også kaldes ordsprog eller sentens. De enkelte ord i en stivnet ordforbindelse kan ikke udskiftes og udgør herved en egen helhed med en bestemt betydning. De faste ordforbindelser kan der varieres begrænset i og kun i det omfang, der er konvention omkring det. Faste ordforbindelser er kendetegnet ved, at betydningen af ordforbindelsen ikke kan forklares ved hjælp af summen af de enkelte ord. Normale ordforbindelser, derimod, kan netop forklares ved hjælp af summen af de enkelte ord (Bergenholtz & Tarp, 1994, s. 118).

I fagsprog er der som regel mange flerordstermer, og man bliver da nødt til at overveje, hvorvidt disse flerordstermer samt kollokationer skal lemmatiseres. Der findes fem metoder, hvad angår anførelse af ordforbindelser i fagordbøger:

1) Lemmatisering af flerordstermer, mens ikke-terminoloigske ordforbindelser (kollokationer) angives i ordbogsartiklerne.

(24)

2) Lemmatisering af både flerordstermer og kollokationer, men ingen angivelse om ordforbindelser i ordbogsartiklerne

3) Ingen lemmatisering af ordforbindelser, idet alle oplysninger om både flerordstermer og kollokationer gives i ordbogsartiklerne

4) Flerordstermer og kollokationer både som lemmata og som angivelser i ordbogsartiklerne

5) Implicitte informationer om ordforbindelser i ordbogsartiklernes faglige forklaring eller i anførte sætningseksempler

Model 1) er den mest fordelagtige for brugeren men ikke for leksikografen, da den kræver mere arbejde end både 2) og 3) (Bergenholtz & Tarp, 1994, s. 119-121).

Der hersker stor uenighed om definitionen på en kollokation, men det kan siges, at situationen i fagsprog er lidt anderledes end i det almene sprog. Både i almensprog og i fagsprog er det ikke bare enhver række ord, der betragtes som kollokationer. I fagsprog kan man endvidere tage udgangspunkt i et fagligt relevanskriterium, hvilket vil sige, at det nødvendigvis ikke er alle kollokationer i en fagtekst, der er fagligt relevante. For det første er fællessproglige kollokationer ikke relevante i en fagordbog, og for det andet kan der også være fagsproglige kollokationer i en fagtekst, som ikke er relevante inden for lige netop det respektive fagområde (Bergenholtz & Tarp, 1994, s. 118+121-122).

Rent metodisk ved søgning efter kollokationer til en bilingval tovejsfagordbog, har man i praksis tre muligheder ved anvendelse af korpora:

1) Man kan til L1-L2-ordbogen foretage en selektion af kollokationer i L1-tekster og oversætte disse til L2, hvorefter man på lignende vis til L2-L1-ordbogen selekterer kollokationer i L2-tekster og oversætter disse til L1.

2) Man kan nøjes med kun at selektere kollokationerne fra L1-tekster, oversætte disse til L2 og indarbejde dem i L1-L2-ordbogen. Til L2-L1-ordbogen vendes kollokationerne, hvilket vil sige, at de selekterede og oversatte L1-L2-kollokationer optages direkte i L2-L1-ordbogen.

3) Til sidst kan man gøre som i 2), blot starter man med at selektere kollokationer fra L2-tekster.

(Bergenholtz & Tarp, 1994, s. 122) Model 2) og 3) har den fordel, at de er mindre arbejdskrævende end 1), da der kun skal selekteres kollokationer én gang. Det kan synes ligegyldigt, om man selekterer på det ene eller på det andet sprog, men nogle fags fagsprog er mere udviklet på nogle sprog end på andre, hvorfor det vil være en fordel at selektere på disse – inden for faget – mere udviklede sprog. En anden fordel ved 2) og 3) er, at kollokationsangivelserne bliver helt identiske i de to ordbøger, hvilket i praksis aldrig vil kunne lade sig gøre ved brug af mulighed 1). Dog kan man risikere, at man ikke vil få hyppigt benyttede kollokationer på L1 med, hvis man udelukkende søger i L2-tekster, selvom L1-kollokationerne sagtens kan oversættes til L2 (Bergenholtz & Tarp, 1994, s. 122-123).

(25)

Det står klart, at mængden af nødvendige kollokationer hænger sammen med brugerens faglighed og fremmedsproglige indsigt samt ordbogens intenderede funktioner, jævnfør kapitel 5 Brugergrupper og 6 Ordbogsfunktioner. Den funktion, der fordrer flest kollokationer, er oversættelse og dernæst produktion af tekster på fremmedsproget (Bergenholtz & Tarp, 1994, s. 123).

Der er oprettet fire brugertyper med forskellige fremmedsproglige og faglige kompetencer (Bergenholtz

& Tarp, 1994, s. 124):

 Brugertype 1 har både lille faglig samt lille fremmedsproglig viden

 Brugertype 2 har lille faglig men stor fremmedsproglig viden

 Brugertype 3 har stor faglig, men lille fremmedsproglig viden

 Brugertype 4 har både stor faglig og stor fremmedsproglig viden

Det er uhensigtsmæssigt at sætte især brugertype 1, men også brugertype 2 til oversættelse L1-L2, men i så fald det hænder, har begge brugertyper brug for mange kollokationer. Brugertype 3 har ligeledes brug for mange kollokationer. De har godt nok den faglige indsigt men mangler den fremmedsproglige viden, hvilket til tider kan give et temmelig ubehjælpeligt sprog. Hvis brugertype 4 har kendskab til fagsproget på fremmedsproget, har de selvsagt brug for mange færre kollokationer end de andre brugere. Hvis ikke dette er tilfældet, har også denne gruppe brug for mange kollokationer. Ovenstående gælder ligeledes for produktion på L2 (Bergenholtz & Tarp, 1994, s. 124-126).

Hvordan ordforbindelserne indbyrdes skal organiseres, er der mange bud på, og det nævnes, at man kan lave en alfabetisk rækkefølge "enten efter kollokationernes første substantiv, adjektiv, verbum, ikke- funktionsord (artikel), eller kollokationernes mest betydende ord" (Bergenholtz & Tarp, 1994, s. 218). Det nævnes, at man kan lave en frekvensrelateret organisering af kollokationerne, men samtidig siges det, at det i oversættelses- og produktionsordbøger (hvilket er funktionerne for COWIterm) er mest normalt med en alfabetisk organisering (Bergenholtz & Tarp, 1994, s. 118+218). Dog vil det nok være mest praktisk også at organisere ordforbindelserne således, at de tre typer ligeledes er delt op. Om man så vil have de stivnede eller de normale ordforbindelser først, må man tage op til overvejelse – men det ville nok være mest praktisk med de stivnede først, da der højst sandsynligt er færrest af dem (og flest normale ordforbindelser), og de derfor er nemmere at overskue og skimme igennem for at komme videre til den næste kategori.

Hvad angår eksempler, foreslår Bergenholtz & Tarp (1994), at de placeres efter kollokationerne. Hvis eksemplerne er på begge sprog, bør oversættelsen komme lige efter eksemplet på udgangssproget, så det følger den naturlige rækkefølge lemma-ækvivalent (Bergenholtz & Tarp, 1994, s. 221).

Ofte indeholder faglige forklaringer også eksempler, men disse giver typisk ikke "eksempler på brugen af det søgte ord, eller … i en anden betydning end den, den faglige forklaring giver" (Bergenholtz & Tarp, 1994, s. 138).

Der skelnes mellem tre forskellige slags eksempler: Belæg, belægseksempler, og kompetenceeksempler.

Belæg er helt uændrede sætninger taget direkte fra en autentisk kilde. De kan være med eller uden kildeangivelse alt efter ordbogens funktion. Der er den fordel ved belæg, at brugeren kan være helt sikker på, at det er sådan, den fagsproglige virkelighed ser ud. Da det er autentisk tekst, kan der til

(26)

gengæld være indsneget sig en fejl, eller belægget kan give udtryk for en anden sprogbrug end den gængse (Bergenholtz & Tarp, 1994, s. 140).

Et belægseksempel er dannet ud fra belæg, dog har leksikografen udeladt fagligt og sprogligt irrelevante dele. Fordelen ved et belægseksempel er, at brugeren ikke skal bruge tid på at gennemlæse de unødvendige dele og derved udelukkende får relevante informationer. Ulempen er, at det kræver mere arbejde af leksikografen (Bergenholtz & Tarp, 1994, s. 141).

Til sidst kan leksikografen selv danne eksemplerne. Fordelen ved disse kompetenceeksempler er, at de er meget tidsbesparende for leksikografen, til gengæld hænder det også, at de let bliver stereotype og

"virker desuden sprogligt uægte, de er ikke ukorrekte, men mangler mange af de implicitte oplysninger, som kun den autentiske sprogbrug kan give" (Bergenholtz & Tarp, 1994, s. 141). Dette gør sig særligt gældende i forhold til ordforbindelser, grammatiske forhold samt faglige sammenhænge (Bergenholtz &

Tarp, 1994, s. 141).

I ordbøger tiltænkt som hjælp ved oversættelse bør der som minimum gives L2-eksempler ved L1- lemmata og omvendt, og gerne både L1- og L2-eksempler, da dette vil hjælpe brugeren. (Bergenholtz &

Tarp, 1994, s. 142).

I bilingvale ordbøger med oversættelse til og tekstproduktion på ækvivalentsproget kan det ikke anbefales at oversætte L1-eksempler direkte til L2-eksempler. Uanset om der er tale om kulturbundet eller ikke-kulturbundet fagsprog, vil det være noget nær umuligt for selv den bedste leksikograf at ramme den rigtige stil ved oversættelse af små deltekster, og en sådan oversættelse vil også tage uforholdsmæssig lang tid. "I en tovejs-ordbog taler meget derfor for at anbringe Lb-eksempler i la-Lb- delen og La-eksempler i Lb-La-delen og ikke at oversætte eksempler i nogen af delene" (Bergenholtz &

Tarp, 1994, s. 143).

Synonymer og antonymer bør angives som noget af det sidste i artiklen med synonymiangivelse før antonymiangivelse. Samme overvejelser angående den feltinterne strukturering gør sig gældende her som for ækvivalenter (Bergenholtz & Tarp, 1994, s. 219).

I almensproget findes der ikke to ord, der kan siges at være hinandens fulde synonym. "Der vil for to eller flere synonymer dels være mindre stilistiske forskelle, dels grammatiske forskelle, dels forskellige kollokative indskrænkninger" (Bergenholtz & Tarp, 1994, s. 128). Der skelnes ligeledes mellem forskellige former for antonymi, som blandt andet kan deles op i konversion, som vi for eksempel finder i køb – salg, komplementaritet, som i mandlig – kvindelig, samt relativ modsætning som i stor – lille. I fagsprog vil det oftest være den relative modsætning, der forekommer, "idet forekomsten af et fænomen udelukker et eller flere andre fænomener" (Bergenholtz & Tarp, 1994, s. 128). I fagsprog er der ikke samme krav til variation, som der er i det almene sprog, faktisk tværtimod: Leksikalsk afveksling bør undgås i rene fagtekster, "da tekstrecipienten ellers måtte tro, at det drejer sig om forskellige fænomener" (Bergenholtz & Tarp, 1994, s. 128).

Synonymi- og antonymioplysninger i fagordbøger findes 1) eksplicit som en del af den faglige forklaring 2) implicit i den faglige forklaring

(27)

3) gennem en henvisning til et andet lemma 4) gennem angivelse af et dobbeltlemma 5) som angivelse efter et synonymisymbol

6) gennem to eller flere ækvivalenter uden adskillende markeringer

Den bedste metode for angivelse af synonymer og antonymer får man ved en kombination af 3) og 5) (Bergenholtz & Tarp, 1994, s. 129-130).

Synonymi- og – især – antonymiangivelser i en fagordbog bidrager til den generelle indsigt i faget. Dog er det kun en hjælp ved tekstproduktion, såfremt producenten har et højt fagligt kendskab. Det er først og fremmest relevant at anføre synonymer og antonymer til lemmaet, hvorimod det kun i få situationer kan være fordelagtigt at anføre dem til ækvivalenten. Én situation, hvor dette kan være relevant, er, når lemma og ækvivalent i kraft af fagsproget på de respektive sprog er næsten identiske internationalismer, hvoraf man ikke kan læse nogen yderligere betydning, hvis ikke man er bekendt med fagsproget.

Leksikografen kan få afløb for sine frustrationer over at sidde inde med en række forskellige ækvivalenter ved at angive en enkelt ækvivalent og så resten, eller i hvert fald et par stykker, som synonymer. Når der på denne måde ikke gives yderligere forklaringer af synonymerne, bør det fremgå af brugervejledningen, at det er ækvivalenten, der skal anvendes, medmindre brugeren har så stor faglig kundskab, at vedkommende kan identificere en mere præcis term i synonymrækken (Bergenholtz &

Tarp, 1994, s. 130-131).

Placeringen af feltet til henvisninger bør stå sidst i artiklen. "Henvisninger har til formål at føre brugeren fra et sted i ordbogen til et andet eller henvise ham til en kilde uden for ordbogen (teknisk norm, citatkilde osv.)" (Bergenholtz & Tarp, 1994, s. 227). I ordbøger findes der ofte krydshenvisningsartikler, hvor henvisningen i så fald udgør størstedelen af artiklen. En sådan artikel består som oftest af et lemma, en grammatisk angivelse og selve henvisningen. I andre artikler med henvisninger fungerer henvisningen som et supplement til de øvrige oplysninger; hovedsageligt den faglige forklaring. Henvisningsfeltet bør altid indeholde enten et sprogligt eller et grafisk symbol (se, se også, ->). Ved flere forskellige typer henvisninger bør det altid være de ordlisteinterne henvisninger, der står først efterfulgt af de ordlisteeksterne henvisninger.

Hvad angår rækkefølgen inden for den enkelte type henvisning, placeres de ordlisteinterne henvisninger i alfabetisk rækkefølge, evt. den vigtigste først og så de andre efterfølgende i alfabetisk orden. Hvad angår de ordlisteeksterne henvisninger, placeres de som regel i numerisk rækkefølge, eftersom de som oftest refererer til paragraffer i for eksempel brugervejledningen, ordbogsgrammatikken eller en nummereret kilde i bibliografien (Bergenholtz & Tarp, 1994, s. 227-228). Her kunne det så være relevant at lave en yderligere opdeling, hvor man skelnede mellem oplysninger til stede direkte i ordbogen – men uden for ordlisten (brugervejledning, ordbogsgrammatik) – og oplysninger, hvor man blev nødt til at skulle indhente andet materiale (kilder i bibliografien).

Til sidst kan man til både lemma og ækvivalent, ordforbindelser samt synonymer og antonymer angive sproglige markeringer, jævnfør Bergenholtz & Tarp (1994, s. 133). De mest relevante for fagordbøger er de

Referencer

RELATEREDE DOKUMENTER

ROLF MORTENSEN, OSLO EX LIBRIS... til

De enkelte gestus, kropslige eller sproglige, bliver ikke stillet i et lige så uklart forhold, hvad angår den mulige (men dog uholdbare) gensidige relation i rummet, som det er

Og det er genstan- den for de følgende sider, hvor jeg vil give et eksempel på, hvorledes man har “skabt sig” middelalderskikkelser, der ikke alene har fundet

september havde Ferskvandsfiskeriforeningen for Danmark også sendt rådgivere ud til Egtved Put&Take og til Himmerlands Fiskepark, og som i Kærshovedgård benyttede mange sig

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of

I figur 5 er vist Ramanspektre af ren benzen (rød kurve) samt ren cyklohexan (blå kurve).. De viste spektre er optaget på det moderni- serede

Dermed bliver BA’s rolle ikke alene at skabe sin egen identitet, men gennem bearbejdelsen af sin identitet at deltage i en politisk forhandling af forventninger til

 Modtager-orienterede sprog såsom engelsk, dansk, svensk og norsk, der taler om virkeligheden gennem modtagers oplevelse af situationen – Dette sker ved at