Sanakirjan kuvaus ja aineisto

ConLexis sisältää suomen kielen yleisintä sanastoa, joten sanakirja auttaa kielen keskeisten ja usein tarvittavien sanojen käytössä. Mukana on myös kielen harvinaisempaa sanastoa, mikä johtuu sanakirjan luonteesta: sanojen yhteydessä esitetään samaa merkitseviä sanoja eli synonyymejä ja merkitykseltään vastakkaisia sanoja eli antonyymejä, jotka voivat erota toisistaan suurestikin esiintymismääränsä suhteen. Sanojen valinnan lähtökohtana ovat kuitenkin olleet kielen taajimmin käytössä olevat sanat, jotka on poimittu taajuussanalistoista.

Keskeistä sanakirjassa on sanojen merkityssuhteiden ja käytön kuvaus. ConLexis kertoo, mitä ilmaistaan missäkin kontekstissa ja miten. Sanakirja ei ole kuitenkaan normatiivinen: Se ei kerro, miten sanoja pitää käyttää, vaan keskittyy esittämään, miten niitä yleensä käytetään kirjoitetussa suomen kielessä.

Koska sanoista on esitetty tavallisimmat käyttöyhteydet ja -tavat, pois ovat jääneet lukuisat harvinaisemmat, mutta silti aivan mahdolliset ja kieleen kuuluvat käyttötavat. Sanakirja ei siis kuvaa kaikkia mahdollisia käyttötapoja eikä halua osoittaa, että tästä sanakirjasta pois jääneitä harvinaisempia ilmauksia olisi syytä välttää.

Käyttöyhteyksien lisäksi sanakirjassa esitellään sanojen merkitykset ja kielenoppijaa auttavat taivutusrakenteet. Merkitysten selittämisessä on käytetty hyväksi aiempia sanakirjoja, erityisesti Kotimaisten kielten tutkimuskeskuksen ja Kielikone Oy:n tekemää Kielitoimiston sanakirjaa. Selvästi erilaisia merkityksiä saavien sanojen yhteydessä on kuvattu eri merkityksille ominaiset käyttöympäristöt.

Keskeisiä käsitteitä sanakirjassa ovat vierussanat eli sanastolliset myötäesiintymät ja klusterit eli sanaryppäät. Sanojen systemaattista käyttöä kuvataan sanakirjassa vierussanojen avulla. ConLexis-sanakirjasta paljastuu esimerkiksi, että toteutettavissa olevasta asiasta tai tilanteesta käytettävät substantiivit mahdollisuus ja tilaisuus käyttäytyvät hyvinkin eri tavalla. Kun halutaan kertoa, että on sopiva hetki tehdä jotain, kerrotaan usein, että on hyvä mahdollisuus (Tehtävä ei ole helppo, mutta meillä on sen saavuttamiseksi hyvät mahdollisuudet), mutta oiva tai oivallinen tilaisuus (Messut ovat oivallinen tilaisuus yrittäjille omien tuotteittensa myyntiin).

Myös synonyymiset suuri ja laaja eroavat selvästi sen suhteen, millaisten sanojen kanssa ne esiintyvät: suuri esiintyy sanojen kuten joukko, merkitys ja määrä yhteydessä, mutta laaja sanojen alue, kannatus ja keskustelu yhteydessä. Usein sanat esiintyvät myös laajemmissa kokonaisuuksissa kuin kahden sanan yhteisesiintymissä. Esimerkiksi aiheuttaa suuria ongelmia ja kasvaa liian suureksi ovat usein toistuvia sanaryppäitä eli klustereita, joissa suuri-adjektiivi tavataan.

Sanoilla on myös tiiviitä suhteita kontekstin kieliopillisiin kategorioihin. Tällaisetkin suhteet on otettu ConLexis-sanakirjassa huomioon. Esimerkiksi jatkuvasti-sanasta kerrotaan, että se esiintyy usein joutua-verbin yhteydessä ja että joutua-verbin vaatiman sijavalinnan eli rektion vuoksi jatkuvasti-sanan ympäristössä on tämän verbin kanssa esiintyessä usein myös maan/mään-loppuinen verbi (eli MA-infinitiivi): Puoli miljoonaa ihmistä joutuu jatkuvasti elämään pelkillä pavuilla ja riisillä.

ConLexis-verkkosanakirjan 1. versio on valmistunut Oulun yliopiston suomi toisena ja vieraana kielenä -oppiaineen ja Oulun Aikuiskoulutuskeskuksen suomen kielen opetuksen yksikön yhteistyönä. Sanakirjahanketta ovat rahoittaneet vuosina 2008–2010 Opetushallitus, Oulun Aikuiskoulutuskeskus ja Oulun yliopisto.

Aineisto

Sanat esitetään sana-artikkeleissa niiden todellista käyttöä kuvaamalla: Sanojen käytön kuvaus perustuu tutkimustietoon eli jokaisen sanan käyttötapa on tutkittu ennen kuin siitä on kirjoitettu sana-artikkeli. Sanojen käytön selvittämisessä on käytetty apuna Suomen kielen tekstipankkia, joka on Kotimaisten kielten tutkimuskeskuksen ja Tieteen tietotekniikan keskuksen hallinnoima sähköinen tekstikorpus.

Käytetty tekstiaineisto koostuu pääasiassa sanomalehtiteksteistä. Tarvittaessa aineistoesimerkkejä on täydennetty poiminnoilla muista lähteistä, kuten internetistä. Valittu materiaali näkyy myös sanojen käyttöesimerkeissä: mukana on paljon kansainvälisestä ja kotimaisesta politiikasta, jokapäiväisestä elämästä ja urheilustakin kertovia esimerkkejä.

Termit

Antonyymi

Antonyymi on sanan vastakohta.

Klusteri

Klusteri eli sanarypäs tarkoittaa vähintään 3 sanasta muodostuvaa toistuvaa sanajonoa.

Kollokaatti

Vierussanasta käytetään myös termiä kollokaatti. Kollokaattina pidetään yleensä frekventtiä kahden lähekkäin olevan sanan (tilastollisesti merkitsevää) yhteisesiintymää.

Konkordanssi

Konkordanssi on tietokoneohjelmalla tehty listaus ilmauksen käyttöesimerkeistä.

Korpus

Korpus tarkoittaa sähköistä kielentutkimukseen käytettävää tekstiaineistoa.

Synonyymi

Synonyymi on samaa tarkoittava sana.