Tämä artikkeli käsittelee kielen perusyksikköä. Sanan muista merkityksistä katso sana (täsmennyssivu).
Kielitieteessä sana on kielen kirjoitettu tai puhuttu yksikkö, joka sisältää merkityksen. Usein on hyödyllistä tunnistaa kolme eri käsitettä, joita vapaassa kielenkäytössä kutsutaan sanaksi:
- Lekseemi on käsite, joka sisältää yhteen kuuluvat sananmuodot; esimerkiksi koira, koiraa ja koiralla kuuluvat samaan lekseemiin. Lekseemiä edustaa lemma, eli hakusana, sananmuoto joka koetaan lekseemin perus- tai oletusmuodoksi. Hakusanoja, kuten koira, koiras, koiravaljakko luetellaan esimerkiksi sanakirjoissa.
- Sananmuoto, on jonkin lekseemin perusmuoto tai taivutusmuoto, esimerkiksi koira, koiran, koiravaljakoissakaan. Esimerkiksi suomen substantiiveilla on kullakin noin 2 000 eri taivutusmuotoa, kun mukaan lasketaan kaikki sellaisetkin muodot, jossa sen johonkin sijamuotoon on lisätty possessiivisuffiksi tai yksi tai sitä useampi liitepartikkeli.
- Sane eli tekstin juokseva sana, on tietyn sananmuodon esiintymä tekstissä. Vaikka sama sananmuoto esiintyisi tekstissä moneen kertaan, ne ovat eri saneita. Esimerkiksi virkkeessä "kesä kuivaa, kesä kastelee" esiintyy yksi sananmuoto "kesä" kahteen kertaan, siis kahtena eri saneena. Virkkeessä on siis kolme sananmuotoa ja neljä sanetta. Voidaan sanoa esimerkiksi että tietty kirja on 70 000 saneen mittainen tai että siinä on 70 000 juoksevaa sanaa.
Sanat jakautuvat morfeemeihin, jotka edelleen jakautuvat foneemeihin. Lauseet sisältävät yhden tai useamman sanan. Sana, jota ei voi edelleen segmentoida on ns. perussana.