Den svenska ordlista som används här skapades av Tom Westerberg. Den innehåller ett stort antal ord på grundform. Arbete pågår för att utöka ordlistan med mer detaljerad information, såsom exempelvis ordklass och böjning. Detta arbete utförs kollektivt av ordlistans användare. Närhelst något stycke information saknas i ordlistan, påtalas detta av sökprogrammet (se nedan), och användaren erbjuds en möjlighet att fylla i den saknade informationen. All ny information som läggs in blir omedelbart tillgänglig för alla användare. På detta sätt kommer ordlistan undan för undan att förbättras och bli mer komplett. Ordlistan är öppen för alla att hämta information från, och alla är också varmt välkomna att lägga in saknad information och rätta eventuella fel i den.
Ordlistan är till för att användas för datoriserat skrivstöd, exempelvis rättstavning, grammatikkontroll och avstavning. Den används exempelvis av ordbehandlingsprogrammet OpenOffice.org.
Programmet som används för att lagra ordlistan kallas för "eXtensible Dictionary" (XD). Det är konstruerat för att möjliggöra samtidiga uppdateringar från olika källor med automatisk detektering av konflikter. Huvudfinessen med programmet är att ordlistan kan utökas med en liten detalj i taget. Ordlistan kan successivt utökas med mer information om orden - ordklass, böjning, definitioner, avstavning, klassificeringar, översättning till diverse språk etcetera - utan att man behöver lägga in all information på en gång. När det fattas information i ordlistan "vet" programmet detta och frågar efter kompletteringar. För att ge några exempel, om man söker efter ett visst ord som inte finns i databasen, så frågar programmet ifall man är säker på att det är ett korrekt stavat ord och ber användaren att i så fall klicka på en knapp för att infoga ordet i databasen. Om man sökt ett ord vars ordklass är okänd, visas en meny för användaren där ordklassen kan anges. Om ordklassen är känd men inte böjningsformerna, så ges en meny där böjningsformerna kan matas in.
Programmet är skrivet i Perl och kan hämtas här.
Programmet XD är inte knutet till något visst språk, utan
kan hantera även andra språk än svenska. För att
stödja ett nytt språk måste man skapa en "grammatik"
för detta språk. Det lämpliga är att börja med att
lista vilka ordklasser man vill ha med, och för varje
ordklass ange vilka böjningsklasser som tillåts.
"Ordklasserna" får, om man så vill, bilda en hierarki
(ett "träd").
T.ex. kan ordklassträdet se ut så här för svenska:
lexikonord
-->substantiv
-->verb
-->adjektiv
-->pronomen
-->interjektion
-->preposition
-->adverb
-->räkneord
-->konjunktion
-->subjunktion
-->particip
-->-->presens particip
-->-->perfekt particip
-->infinitivmärke
egennamn
Klasserna "lexikonord" och "particip" är
abstrakta och saknar böjningsklasser.
Böjningsklasserna för substantiv är:
obestämd form singularis
obestämd form singularis, genitiv
bestämd form singularis
bestämd form singularis, genitiv
obestämd form pluralis
obestämd form pluralis, genitiv
bestämd form pluralis
bestämd form pluralis, genitiv
Böjningsklasserna för verb är:
infinitiv
preteritum
supinum
presens
imperativ
infinitiv, passiv form
preteritum, passiv form
supinum, passiv form
presens, passiv form
Böjningsklasserna för adjektiv är:
positiv utrum
positiv neutrum
bestämd form
pluralis
komparativ
superlativ
superlativ, bestämd form
maskulin
Böjningsklasserna för perfekt particip är utrum, neutrum och plural.
Övriga klasser har exakt en böjningsklass var (dvs
de representerar de oböjliga ordklasserna).
Göran Andersson <goran@init.se>