CD-ORD kan gætte dine tanker

I læse- og skriveprogrammet CD-ORD kan du købe mere end en vokal. Har du tastet bare ét ord på din skærm, kan CD-ORD forudsige det næste sandsynlige ord i din sætning. Det ligner trylleri, men faktisk er det statistik.

 

Af Bente Egelund Jensen
bente@mv-nordic.com

CD-ORD kender dig ikke, men det skulle gerne føles sådan. CD-ORD ved nemlig ikke, hvad din tekst egentlig handler om. Hvad CD-ORD til gengæld ved en masse om, er hvordan sprog bruges i kontekst, og hvor hyppigt et ord optræder i sproget. Med mere end 20 år på bagen og en database, der bygger på ca. 40 millioner ord som indgår i sætninger – og dét bare på dansk – har CD-ORD både kode og data nok til at hjælpe enhver tekst på vej.

Statistikken bag skrivehjælpen

Når en elev klikker CD-ORDs ordforslag frem, er det for at få hjælp til at skrive. Baseret på elevens input og sin forudgående viden om kontekst og hyppighed præsenterer CD-ORD eleven for en enkel liste med ord, der meningsfuldt kan indgå i den påbegyndte sætning. Det kan være forslag til at afslutte et ord, stavehjælp til et ord der skrives forkert, eller ordforslag, der forudsiger det næste ord i sætningen – en hjælp, hvis eleven fx har problemer med korrekt ordrækkefølge.

For at et ord overhovedet kan dukke op som et forslag i ordlisten, skal det naturligvis findes i CD-ORDs database. Så der er ord, der aldrig vil blive foreslået – eksempelvis spritnye ord. Programmet opdateres derfor jævnligt, men ikke kun med ord. I CD-ORDs statistik nytter det ikke noget at sætte et enkelt ord som fx ‘iPhone’ ind. For i hvilken sammenhæng optræder ordet iPhone? Det skal CD-ORD vide, for at kunne give det som et meningsfuldt forslag i en tekst. Når databasen opdateres, er det derfor med tekstsamlinger (‘korpusser’), hvor ordene indgår i sætninger.

At finde nålen i høstakken

Ordlistens forslag til elevens tekst kan sammenlignes med at lede efter en nål i en høstak. Men i CD-ORD kan du gøre høstakken mindre, for du kan fortælle programmet præcis hvilke typer af fejl, det skal kompensere for. CD-ORD har et lag af ‘hvad kunne tænkes at være et problem’ – de fejltyper, der ligger omme bagved og sikrer, at man bliver kompenseret, hvor man har brug for det. Skriver man fx ‘I en travl…’, så regner CD-ORD på sandsynligheden for, hvad det næste ord kan være, fx ‘hverdag’. Begynder man så at skrive ordet, og starter med ‘vær’, vil ordlisten foreslå ord, der starter med ‘vær’, fx være. Men da udeladelse af et stumt h og forveksling af bogstaverne æ og e er kendte fejltyper, så kan hverdag faktisk stadig stå højt i ordlisten, hvis det statistisk er det mest hyppige ord i sammenhængen.
Som standard kompenserer CD-ORD og lignende programmer for typiske fejltyper som konsonantforvekslinger, dobbeltkonsonanter og fejl med diftonger. Men hvis du har kendskab til, hvilke fejltyper din elev ikke har problemer med, så kan du slette dem fra listen over de fejl, CD-ORD skal tage med i sine beregninger. Hvis eleven ikke forveksler æ og e eller ikke glemmer stumme h’er, så kan CD-ORD jo udelukke ‘hverdag’ som forslag i eksemplet fra før. Og jo færre fejl, programmet skal tage højde for, jo mere præcise forslag får eleven.

CD-ORD i fremtiden

CD-ORD har allerede en del muligheder for at blive mere personlig end gængse læse- og skriveværktøjer. Men i fremtiden kan CD-ORD måske blive mere adaptiv, så programmet over tid lærer brugerens sprogbrug og fejltyper at kende og automatisk indstiller sig efter det. Allerede nu har du mulighed for at lade de ord, du bruger hyppigt, få forrang i din ordliste. Og vil du skrive om et specifikt emne, kan du tilføje både fagord og egenproducerede ordlister med specielle ord fra fx Harry Potter-universet. De vises i en separat ordliste og påvirker derfor ikke den almene ordprædiktion – heller ikke selv om programmet bliver adaptivt.

CD-ORD ikon
CD-ORD giver mere præcise ordforslag end andre LST-værktøjer

Læs hvorfor i artiklen her eller:
læs mere om CD-ORD

CD-ORD stavehjælp

Kontekst og stavehjælp

CD-ORD kan tage højde for dine skrivefejl, fx vokalforvekslinger og stumme bogstaver. Ordlistens forslag er prioriterede, så det mest sandsynlige ord præsenteres øverst.

Andre artikler