Rättstavningsordlistor
-
Svensk ordlista till LibreOffice och OpenOffice.org (v. 1.51, 2012-01-22)
Från och med version 1.48 rekommenderas det att man aktiverar tillvalet Kontrollera ord med siffror. Självfallet ska tillvalet Kontrollera stor och liten bokstav också vara aktiverat (trots att en del egennamn då rödmarkeras). Däremot bör man absolut inte låta programmet autokorrigera vad det tror är stavfel mot något snarlikt ord ur ordlistan eftersom detta alltför ofta blir fel.
Rättstavningsordlistan är fenomenalt användbar under förutsättning att man förstår följande:
- Rödmarkeringarna ska enbart ses som en uppmaning att korrekturläsa ordet, det behöver inte nödvändigtvis vara felstavat. I synnerhet gäller detta många mindre vanliga sammansättningar och egennamn.
- Listan med snarlika ord som visas när man högerklickar på ett rödmarkerat ord genereras helt mekaniskt utan någon som helst artificiell intelligens. Skribenten måste använda sitt eget omdöme för att avgöra om det rödmarkerade ordet faktiskt var felstavat, och i så fall om något av "rättstavningsförslagen" är korrekt.
Listan av förslag ska ses som ledtrådar till vad som kan vara den korrekta stavningen ifall det ursprungliga ordet faktiskt är felstavat. Det vore befängt att lita blint på ett rättstavningsverktyg och tro att verktyget "vill byta" vad man skrivit mot något av orden i listan.
Ofta inleds listan av "rättstavningsförslag" dessutom med upp till två automatgenererade sammansatta ord som är syntaktiskt korrekta men ibland semantiskt orimliga. Jag har lagt in denna funktion eftersom den överraskande ofta ger exakt rätt förslag vid felstavning av långa, komplicerade ord (exempelvis felstavningen "hästkapplöppningsbana", dvs precis vid de tillfällen då det är svårt även för skickliga skribenter att hitta felet). Alla skribenter med IQ över 80 kan lätt bortse från dessa "rättstavningsförslag" när de är felaktiga, men ett ordbehandlingsprogram vars autokorrigeringsfunktion har en IQ som obetydligt överstiger 0 bör inte tillåtas välja något "rättstavningsförslag".
Installation: Hämta hem filen och öppna den som ett dokument i LibreOffice eller OpenOffice.
-
Svensk ordlista till Firefox, Seamonkey och Thunderbird (v. 1.51, 2012-01-22).
Installation: Det enklaste sättet är att klicka på länken till xpi-filen inifrån Firefox.
Alternativt kan man hämta hem xpi-filen och öppna den som ett dokument i Firefox. I Thunderbird kan man välja
"Verktyg -> Tillägg -> (verktygsikon bredvid sökrutan) -> Installera tillägg från fil" och sedan öppna filen.
OBS! Var snäll och distribuera inte denna ordlista tillsammans med Firefox. Alltför många Firefox-användare har talat om för
mig att jag "borde skämmas" och att ordlistan är "dum", "dålig", "helt jävla efterbliven" osv.
(Häpnadsväckande nog tycks ingen klaga på rättstavningsfunktionen i Chrome, Safari, Opera eller Internet Explorer. Beror
det på att Google, Apple, Opera Software och Microsoft har råd att lägga ner mer resurser på en sådan funktion än DSSO
och att DSSO:s rättstavningsordlista därför är ojämförligt mycket sämre?
Eller på att just Firefoxanvändarna har orealistiska krav och förväntningar?)
Jag är ganska tålig, men gränsen är nådd för hur mycket skit jag är beredd att ta för ett arbete som är helt ideellt och
fruktansvärt tidsödande.
Förmodligen har Språkrådet eller
Svenska Akademien någon bättre ordlista att erbjuda Firefoxanvändarna,
så att de slipper använda en "gratisordlista" som gjort att "flera konstiga ord har
tillåtits, medan andra etablerade ord inte gått att använda sig av" (detta enligt Telenor,
DSSO:s mobil- och internetoperatör,
som av någon anledning anser sig kompetenta att recensera ordlistor).
De få Firefox- och Thunderbirdanvändare som faktiskt vill använda DSSO:s rättstavningsordlista kan tills vidare hämta den via
länken ovan. Meddela undertecknad var man kan få tag på en "riktig" svensk rättstavningsordlista till Firefox, så
länkar jag till den i stället.
-
Finlandssvensk ordlista till Firefox, Seamonkey och Thunderbird (v. 1.50, 2011-12-30).
Installeras enligt ovan. Därefter aktiveras den genom att man högerklickar i ett textinmatningsfält och väljer "Språk -> Svenska/Finland".
-
Svensk rättstavningsordlista till Google Chrome (v. 1.51, 2012-01-22).
Installation: se här.
-
Svensk rättstavningsordlista till Mac OS X.
-
Svensk rättstavningsordlista till webbläsaren Opera.
Installation: placera filen sv.zip i den katalog där Opera lagrar rättstavningsordlistor
(t.ex. är det ~/.opera/dictionaries på Linux; på Windows 7 kan det vara något i stil med
C:\Users\MyUser\AppData\Roaming\Opera\Opera\dictionaries) och starta om Opera.
Förhoppningsvis uppdaterar Opera sin svenska ordlista snart så att man slipper göra
detta för att få en vettig stavningskontroll.
- Om AbiWord kompileras på rätt sätt, så kan den använda hunspell-ordlistor - dvs samma som OpenOffice.org och Firefox 3. De AbiWord-binärer som enbart har stöd för aspell-ordlistor kan inte hantera svenska språket tillräckligt bra. Kontakta din leverantör av AbiWord om du inte har fått den byggd med stöd för hunspell.
- MySpell stöder inte hantering av sammansatta ord, så jag kan inte med gott samvete bygga en ordlista för program
som bygger på MySpell (t.ex. Firefox 2). Jag kan inte hindra någon annan från att göra det, men skyll i så
fall inte på undertecknad ifall kvaliteten blir usel.
-
Nästan lika illa som för MySpell är situationen vad beträffar GNU Aspell.
Gamla Ispell har tillräckligt bra stöd för svenska, men finns det fortfarande någon som använder det?
Hur rättstavningsordlistan fungerar.
Den stora svenska ordlistan
Observera att denna ordlista är under uppbyggnad. Den är optimerad för att användas som
grundmaterial till rättstavningsordlistor och är inte ännu mogen för särskilt
många andra tillämpningar. (Återigen, jag kan inte hindra någon annan från att använda ordlistan
i en applikation den inte är lämpad för, men skyll i så fall inte på mig utan på den som
ansvarar för applikationen.)
Många sällan använda ord (i synnerhet korta sådana) finns ännu inte inlagda i DSSO eftersom de gör mer skada än nytta i
en rättstavningsordlista.
De ordförklaringar som finns inlagda i DSSO är få och av dålig kvalitet.
Arbetet med definitioner är helt enkelt inte prioriterat för tillfället.
Förr eller senare kommer DSSO att börja hämta definitioner från andra CC-licensierade källor,
bl.a. Wiktionary, Wikipedia och SALDO. Om någon är seriöst intresserad av att hjälpa till med detta arbete, så kontakta undertecknad.
Urvalet av sammansättningar i DSSO kan verka befängt eftersom många vanligt förekommande sammansättningar saknas och många märkliga
ad hoc-sammansättningar finns inlagda. Skälet till detta är att rättstavningsordlistan hanterar sammansättningar med hjälp av regler,
så att de inte behöver vara explicit inlagda i ordlistan förutom i form av intressanta stickprov.
Den som bedömer DSSO utifrån vad den den inte är (dvs en traditionell ordbok) tar därför lätt till omdömen som "den kassa ordlistan" (Svenska
Dagbladet) eller "ordlistan är helt koko" (Peter Englund, Svenska Akademien).
Fråga gärna undertecknad om råd angående hur materialet bäst kan bearbetas
för att användas i en viss applikation. Felaktig bearbetning av materialet leder troligtvis till ett fiasko -
som exempelvis att sammansättningsreglerna slutar fungera i ett rättstavningsprogram
eller att egennamn, förkortningar, obskyra facktermer och böjningsformer betraktas som giltiga ord av ett ordspel.
Copyright © 2011 Göran Andersson.
Denna ordlista är tillgänglig under licensen
Creative
Commons Attribution-Share Alike. Vid distribution av ordlistan, vare sig i förändrat eller oförändrat skick, ska det tydligt framgå att denna licens gäller hela det verk som distribueras.
dsso-1.51.txt (2012-01-22)
Denna fil uppdateras några gånger per år. Filformatet beskrivs här.
Koden för att bygga stavningsordlistan utifrån textfilen dsso-1.51.txt finns här.
(OBS! Detta är bara intressant för utvecklare; andra bör välja en färdigbyggd ordlista.)
Rå ordlista
Varning! Denna fil är en biprodukt av DSSO-databasen vars främsta syfte är att
utgöra ett råmaterial för rättstavningsordlistan. Inga garantier ges för att
filens innehåll är korrekt, fullständigt eller konsekvent.
I synnerhet kan urvalet av sammansättningar förefalla märkligt. Det beror dock
inte på att filens upphovsman är "koko", utan på vad som är användbart i rättstavningsordlistan.
dsso_words-0.8.txt
Programmet
Programmet för lagring och versionshantering av språkdata heter "eXtensible Dictionary" och finns här.
Programmet får spridas under licensen GNU GPL.
Snabbkurs i juridik
Eftersom de flesta som vill använda materialet är programmerare och (i likhet med alla journalister som förvrängt licensens innebörd i media) saknar juridisk kompetens, blir jag tvungen att själv försöka mig på en pedagogisk insats. Vad jag skriver här nedan är dock inte juridiskt bindande, utan det är CC-licensen ovan som gäller - varken mer eller mindre. Man behöver inte fråga mig om lov för att använda materialet, det räcker att respektera licensen. Jag får upp till ett tiotal förfrågningar om dagen om licensens juridiska innebörd, och vill ägna min tid åt annat än att besvara sådana frågor. Så var snäll och läs nedan i stället för att fråga mig om sådant som förklaras här. (Se även FAQ.)
Privat användning av ordlistan
Lagen har inga restriktioner för hur man förfogar över upphovsrättsskyddat material i en privat krets, och det har inte jag heller. (Tvärtom anser jag att den senaste lagändringen har en alltför snäv definition av vad som är en privat krets.) CC-Licensen ovan är endast tillämpbar då materialet på ett eller annat sätt görs tillgängligt för en större grupp. Licensen handlar om distribution (eller, som copyrightlobbyn kallar det, tillgängliggörande) av materialet, inte privat användning av det. Men eftersom jag insett att bara 10% av befolkningen i stort (och 0.01% av alla programmerare och journalister) kan förstå sådana subtiliteter, finner jag det för gott att hålla mig till den tvetydiga termen "användning" nedan.
Användning av ordlistan i fri programvara
Detta är det enda som intresserar mig personligen, och det är för detta jag skapat materialet.
Kontakta gärna mig om du vill använda ordlistan som en del av något fritt/open source-program. Jag kan hjälpa till att automatisera bearbetningen av mitt råmaterial till ett format som passar programmet samt att släppa det bearbetade materialet under en licens som passar programmet. Som exempel, se rättstavningsordlistorna till Firefox och OpenOffice. Fri programvara uppfyller automatiskt villkoret "ShareAlike". Villkoret "Attribution" ska uppfyllas också av fri programvara. Självfallet kommer jag aldrig att utkräva sanktioner ifall ett open source-projekt missat denna detalj förutsatt att det rättas till då det upptäcks.
Kommersiell användning av ordlistan
Jag har inget emot kommersiell användning av ordlistan under förutsättning att licensen ovan respekteras.
Lägg för övrigt märke till följande: licensen gör inte någon skillnad mellan kommersiell eller icke-kommersiell distribution.
Licenstexten nämner inte ens ordet "kommersiell". Personligen tycker jag dock att man kan ställa högre krav på kommersiella projekt vad gäller
ansträngningen att respektera licensen.
För att uttrycka det lite förenklat, så krävs bara att
- Du berättar för kunderna att materialet bygger på DSSO. Vid distribution i mobilappar ska detta framgå redan i beskrivningen av appen, innan köpet genomförs.
- Din version av ordlistan distribueras under CC-licensen, antingen som en lättillgänglig del av
själva applikationen eller via separat nedladdning.
Detta är den enda "betalning" jag begär. Tanken är att detta ska leda till ömsesidig nytta: vissa av användarna kanske bidrar till att förbättra DSSO, och förbättringar av DSSO kommer applikationen till del.
(Det är inte den första, utan den andra av punkterna ovan som är viktig. Det spelar ingen roll om du tycker att du endast gjort triviala förändringar, för det är förmodligen inte trivialt för kunderna att återskapa dessa ändringar om inte just din version är tillgänglig.
Om din version av ordlistan är tecken för tecken identisk med filen dsso-1.**.txt så är dock punkt 2 automatiskt uppfylld.)
Förutsatt att det tydligt framgår för användarna av den kommersiella applikationen att själva ordlistan, i den form den används av applikationen, är fri under CC-licensen ovan, kan jag i vissa fall hjälpa till med bearbetningen av materialet till ett format som passar applikationen ifråga. För att detta ska fungera behöver jag få veta hur applikationen ska fungera och framför allt behöver jag en detaljerad beskrivning av vilket urval av ordlistan applikationen kräver, samt vilket format. Jag har varken tid eller lust att be om mer information vid slarvigt ställda förfrågningar, utan de lämnas vanligtvis obesvarade.
Vid kommersiell distribution som inte respekterar Attribution ShareAlike-licensen, t.ex. så att användarna inte får veta att de köper fritt material eller att de inte får möjlighet att komma åt materialet för att studera det, lära sig av det och förbättra det, tvekar jag inte att vidta juridiska åtgärder.
Observera att enligt sektion 7a av licensen förlorar man automatiskt rätten att använda mitt material om man en enda gång bryter mot licensen. Självfallet förnyar jag den rätten, och förlåter överträdelsen, ifall man övertygar mig om följande:
- Överträdelsen var oavsiktlig.
- Vi har nu förstått licensen och kommer inte att bryta mot den igen.
- Vi är beredda att gottgöra våra kunder och konkurrenter för de eventuella negativa konsekvenser överträdelsen ledde till.
Av alla de projekt som använder materialet tror jag att ungefär hälften lyckas följa licensen fullt ut. Jag hinner inte ge gratis juridisk utbildning åt alla dem som bryter mot den, men för att inte respekten för licensen ska urholkas helt måste jag någon gång då och då insistera på att dess villkor efterlevs.
Vid kommersiell distribution som sker utan min vetskap vill jag särskilt påminna om följande del av CC-licensen: det ska framgå att det är en bearbetad version av ordlistan, och det får inte framstå som om användningen av den specifika versionen av ordlistan i det specifika sammanhanget är rekommenderat eller sanktionerat av mig, för då är risken stor att jag drunknar i mejl med klagomål och krav på support från uppretade användare.
Måste hela vår applikation släppas under CC-licensen?
DSSO får inte distribueras kommersiellt annat än under CC-licensen som anges ovan. Den som vill distribuera DSSO kommersiellt och inte förstår licensen bör ta hjälp av en jurist. Undertecknad har inte möjlighet att erbjuda gratis juridisk rådgivning. Frågor om hur man enklast distribuerar mitt material kommersiellt utan att dela med sig av de egna ändringarna lämnar jag obesvarade.
En vanlig missuppfattning kan jag dock reda ut: om DSSO distribueras på ett sätt som inte är tecken för tecken identiskt med filen ovan, så gäller ShareAlike-regeln - "If you alter, transform, or build upon this work, you may distribute the resulting work only under the same or similar license to this one."
För den som inte vill att denna licens ska "smitta" hela applikationen, finns ett enkelt kryphål: distribuera själv den modifierade ordlistan som ett separat verk under CC-licensen, och låt sedan applikationen inkludera exakt denna version samt referera till den i någon "fotnot" eller "about"-sida.
Göran Andersson <goran@init.se>