• Ingen resultater fundet

De sproglige ressourcer i OrdRet

N/A
N/A
Info
Hent
Protected

Academic year: 2022

Del "De sproglige ressourcer i OrdRet"

Copied!
11
0
0

Indlæser.... (se fuldtekst nu)

Hele teksten

(1)

De sproglige ressourcer i OrdRet

Eckhard Bick

GrammarSoft

(2)

De sproglige ressourcer i OrdRet

Eckhard Bick

GrammarSoft

(3)

Grammatiske Søsterprojekter

VISL (internetbaseret grammatikundervisning)

DanGram (CG-tagger og -parser for dansk)

Korpus90/2000 (grammatisk opmærkede tekster)

URKAS (Almen Sprogforståelse)

(4)

Hvorfor sproglige resurser, når man kunne nøjes med en liste?

Ikke alle ord er lige hyppige lage - læge - lagde frekvensbaserede korpusundersøgelser Dansk tillader et uendeligt antal af sammensætninger

- listen er altid for kort

efterlønstilhænger, kostkonsulent, ...

morfologisk og kompositumsanalyse

Hvilke ord er mest lige?

straden - staden, straden - starten, straden - estraden, straden - stranden stdn / áè

grafisk vs. fonetisk lighed

bogstavudskiftninger vs. bogstavlighed stavelsesantal

konsonatskelet og vokalskelet Også ord, der ligner meget, kan være meningsløse i

konteksten - hun har købt en lille hæsd [hæst/hest]

forkast rettelsesforslag med (i konteksten )

”umulige” ordklasser Også ellers korrektstavede ord kan være grammatisk

forkerte (-e/-er, -ene/-ende)

tilføj kontekstuelle rettelsesforslag også for velstavede ord

Listekontrollen accepterer ord i 2 dele ('banegårds centret')

samkrivnining foreslås ud fra bøjning og kontekst Listekontrollen kan ikke rette noget der ikke er der

(sætningspunktum, manglende ord)

en syntaktisk analyse kan hjælpe med at afgrænse sproglige enheder/sætninger

Brugeren har brug for en prioritering af rettelsesforslagene

Brugeren har brug for at få rettet også ellers korrektstavede ord

(5)

CG & stavekontrol

• Swedish: Grammatifix/Svefix/SWECG (http://www.lingsoft.fi/svefix/)

Arppe, A. 2000. Developing a grammar checker for Swedish. In Nordgård, T. (ed.) Nodalida '99 Proceedings from the 12th Nordiske datalingvistikkdager, Department of Linguistics, University of Trondheim, p. 13-27.

Birn, J. 2000. Detecting grammar errors with Lingsoft's Swedish grammar checker. In Nordgård, T. (ed.) Nodalida '99 Proceedings from the 12th Nordiske datalingvistikkdager, Department of Linguistics, University of Trondheim, p. 28-40.

• Norwegian:

Hagen, K., Johannesen, J.B. & Lane, P.: “Some problems related to the development of a grammar checker” ( http://www.hf.uio.no/tekstlab/prosjekter/NoDaLiDa_gram.html), foredrag på NoDaLiDa 2001

Hagen, K., Lane, P. & Trosterud, T.: “En grammatikkontrol for bokmål”, i Kjell Ivar Vannebo og Helge Sandøy (eds.): Språkknyt 3-2001

• Orthografix (http://www.lingsoft.fi/orthografix/) exists for the above plus Danish,

Finnish and Suahili, but is a spell checker without grammar/CG

(6)

OrdRets grammatiske ressourcer i tal

• Sprogteknologisk leksikon (140.000 leksemer) bøjningsklasser, valens, semantik ...

• Morfologisk analysemaskine ekspliciterer flertydighed

• Morfologisk Constraint Grammar (2.550 regler)

• Fejltype CG m.m. (800 regler)

• Korpusbaseret frekvensliste (1.050.000 ord)

• Fonetisk leksikon og transskriptionsmaskine

• Fejldatabaser (13.300 + 5.100 former)

(7)

DanGram i OrdRet 1

(fejl)ord

fejlliste safe

fejlliste data

komparator vægter

grafiske match

fonetiske match

(fejl)ord

f90 listeforslag 47 listeforslag w92 matchord match_ord s88 matchord ...

n sg n gen adj neu adv v pr v inf

“vejr”

“være”

“værd”

tagger

fuldformsleksikon fonetisk leksikon bøjningsleksikon valens/semantik

<unit>

<hum>

<atemp>

<vt>

<v-ud>

<vk>

(fejl)tekst samskriver/splitter

(8)

kontekst

DanGram i OrdRet 2

Ret-1 Analyse 1a Analyse 1b Ret-2 Analyse 2 Ret-3 Analyse 3a Analyse 3b Ret-4 Analyse 4 Ret-5 Analyse 5a Analyse 5b Analyse 5c

fejlmapper unsafe

disambiguator DanGram CG

gene- rator

1. forslag 2. forslag 3. forslag 4. forslag ...

Ret-5b bøjet

fejlmapper safe

CG mapping-regler CG remove/select bøjningsleksikon

@vfin

@inf

@pl

@neu

@majuskel

@comp

@headstop

@:forslag

Analyse 1ab Analyse 2 Analyse 3ab Analyse 5ac Analyse 5b Analyse 4

komparator-vægtede restforslag

(9)

Eksempler

• Hun har en opfattelse af at kvinde (@pl) er bedre til det merster (R:meste).

(ingen indefinitte entals-substantiver uden prænominaler, - undtagen <mass>)

• Han kan ikke hører (@inf) dig.

(hjælpeverbumskontekst)

• Han ønsker ikke og (@:at) forstyrre.

(verbum med infinitivvalens til venstre, infinitiv til højre)

• Min søster er syge plejerske (@comp).

• Hun besøgte barndoms (@comp-) veninden.

(ubestemt substantiv i genitiv ental før et substantiv i bestemt form)

• Glasset var fuld (@sc-neu).

(konkordanskrav mellem subjekt og subjektsprædikativ)

• Jeg er træt (@headstop) Det har vært (R:været) en lang dag.

(Majuskel og/eller syntaktiske tegn på ny sætning)

('været' vinder over 'vært' efter hjælpeverbum)

(10)
(11)

Referencer

RELATEREDE DOKUMENTER

“Where Kinesthetic Empathy meets Kinetic Design.” In Proceedings of the 5 th International Conference on Movement and Computing, p.. The Realistic

Supplemental insulin was pre- scribed to the majority of patients at the medical de- partment and to 30% at the surgery department with a median p-glucose threshold of 12 and 14

1 Department of Cardiology, Aarhus University Hospital, and Department of Clinical Medicine, Aarhus University, Denmark, 2 Division of Cardiovascular and Diabetes

Proceedings, Symposium January 19, 2008 (Copenhagen: Department of Arts and Cultural Studies, Section of Musicology, University of Copenhagen, 2008).. Online publication:

Department of Physiotherapy - University College of Northern Denmark Department of Health Science and Technology – Aalborg University Thorvaldur Skuli Palsson, Associate

Department of Clinical Epidemiology, Aarhus University Hospital, Denmark; The Swedish Hip Arthroplasty Register and Department of Orthopaedics, Institute of

1 Department of Cardiology, Aarhus University Hospital, and Department of Clinical Medicine, Aarhus University, Denmark, 2 Division of Cardiovascular and Diabetes

Department of Management Engineering Technical University of Denmark..