ELŐSZÓ

A magyar nyelvtudomány hagyományosan foglalkozik költőink, íróink szókincsének vizsgálatával. Nyilvánvaló, hogy a sokat olvasott szerzők nyelve hatott, és napjainkban is hat nyelvünk fejlődésére. Számos részlettanulmány készült a különböző írók szókincséből, és egyre inkább megérett az a gondolat, hogy egy író nyelvi gazdagsága és hatása az irodalmi nyelv alakulására csak olyan összeállításból derülhet ki, amely kiterjed az író minden művének minden adatára. A különböző országokban korábban egyszerű indexeket készítettek, amelyekben felsorolták az adott szerzőtől használt összes szót, majd konkordanciákat állítottak össze, amelyek szövegösszefüggésben közölték az írók szavait. Végül kialakult az írói szótár, amely az értelmező szótárakhoz hasonlóan megadja a szavak jelentéseit, grammatikai, stilisztikai stb. sajátosságait is. Az utóbbiakból kiderül, hogy az író mit, hogyan, miért használ fel a nyelvből, mivel és hogyan gyarapítja.

A magyar szótárirodalom nem bővelkedik írói szótárakban. Csupán egy olyan szótárunk van, amely egyetlen szerzőnek minden művére kiterjed, ez a Petőfiszótár. Alcíme is jelzi, hogy Petőfi Sándor életművének szókészletét tartalmazza. A szótárt a Magyar Tudományos Akadémia Nyelvtudományi Intézetében egy népes munkacsoport készítette Gáldi László irányításával. Az anyaggyűjtés, szerkesztés és megjelentetés több mint három évtizedig tartott, és nem csekély összegbe került. Első kötete 1973-ban, a negyedik és egyben utolsó 1987-ben jelent meg az Akadémiai Kiadónál. 1972-ben talált kiadóra, így időben megelőzte a Petőfiszótárt a Benkő Lászlótól szerkesztett "Juhász Gyula költői nyelvének szótára" című mű. Ez nem terjed ki a költő minden alkotásának szókincsére, csupán verseinek szavait foglalja össze. Pásztor Emil Arany János Toldi című elbeszélő költeményének szókincsét dolgozta fel szótárszerűen (Toldiszótár. Tankönyvkiadó, 1986). Ez tehát egyetlen jelentős alkotás szókincsét tartalmazza. Ehhez hasonlóan jár el Beke József, amikor Katona József Bánk bán c. drámájának szókészletét dolgozza fel a Bánk bánszótárban (Kecskemét, 1991). (A korábbi hasonló kezdeményezésekről l. Benkő László: Az írói szótár. Akadémiai Kiadó, 1979. 23.)

Csokonai Vitéz Mihály szókincsének különféle vonatkozásaival már sokan foglalkoztak. A magyar felvilágosodás legnagyobb alakjának nyelvi gazdagságáról, az irodalmi nyelv alakulásában betöltött szerepéről csak teljes szókincsének ismeretében beszélhetünk. Az író szókincsét tartalmazó munka hű képet adhat nyelvünk korabeli állapotáról, és természetesen a nyelvújítás megítélésének is egyik fontos támpontja lehet. Hisz a nyelvújítást értékelni akkor tudjuk, ha pontosan ismerjük, mi volt előtte, mit kellett megújítani. Egy ilyen összeállítás ezeken kívül még a debreceni regionális köznyelv alakulásának is fontos dokumentuma.

Éppen ezért a Csokonaiéletmű kritikai kiadásának megjelenésével párhuzamosan hozzákezdtünk a Csokonaiszókincstár előmunkálataihoz. Munkánk alapja tehát a szerző műveinek kritikai kiadása. Ebből eddig megjelent Szilágyi Ferenc gondozásában a költő verseinek IIII. kötete (Akadémiai Kiadó, 1975, 1988, 1992), Pukánszkyné Kádár Jolán pedig Csokonai színműveit tette közzé 1978ban két kötetben (Akadémiai Kiadó). Először a KLTE Számoló Központjában számítógéppel elkészítettük az öt kötetben kiadott művek szókincsének konkordanciáját, külön a verses kötetekét és külön a színművekét. Ezek ábécérendben közlik az előforduló szavakat szövegösszefüggésben, és megjelölik az adatok előfordulási helyét.

A kritikai kiadás befejezésére még legalább egy évtizedet kell várni, ezért elhatároztuk, hogy a szerző színműveinek szókincsét feldolgozzuk és közzétesszük. Ezek a művek ugyanis már megjelentek, egy egységet alkotnak. A bennük lévő anyagot hozzáférhetővé tesszük a kutatók számára, hogy minél hamarabb, például a kritikai kiadás további köteteinek a kiadása során is hasznosíthassák. Majd további egységként elkészítjük a versek szókincsének a tárát, és ugyancsak külön egységként kezeljük Csokonai egyéb prózai írásainak a szóanyagát. Ez kétségtelenül kényszerű szétválasztás, viszont így lehetőség nyílik arra, hogy az író szókincsét műfajok szerinti megoszlásban és összehasonlításban vizsgálhassák az érdeklődők.

Ez a kötet tehát Csokonai színműveinek szókincsét foglalja magában. Tudjuk, hogy a színművek nyelve általában közel áll a beszélt nyelvhez, így az itt található szóanyag a XVIII. század vége magyar beszédnyelvének az emléke, és kétségkívül magán viseli a korabeli debreceni beszéd vonásait is.

Megemlítjük, hogy a teljes anyagot megőriztük számítógépen a "Számítógépes nyelvtörténeti adattár"ban. Így később is - kívánatra - különböző feldolgozásokat lehet készíteni belőle. Példának felhozzuk, hogy könnyen szétválasztható Csokonai eredeti műveinek és fordításainak szókincse, vagy összeállítható egyetlen drámának a szóanyaga, kiíratható egyegy szófajra vagy akár egy végződésre vonatkozó összes adat stb.

Végül köszönetet mondunk Hoffmann Istvánnénak és Kis Tamásnak, akik a szócikkek összeállításában segítségünkre voltak. Kis Tamást külön köszönet illeti a kötet technikai szerkesztéséért is.

A szókincstár munkálatait és e kötet megjelentetését az Országos Kutatási Alap támogatta. A támogatásért ezúton is köszönetet mondunk.

Jakab László - Bölcskei András

A feldolgozás jellege

Munkánk nem írói szótár, hanem az egyszerű adattár és a konkordancia (szövegszótár) kombinációja. Ezért címében nem is szótárnak, hanem szókincstárnak nevezzük. Mit tartalmaz ez a szókincstár? Tartalmazza Csokonai színműveinek minden egyes szavát szócikkekben feldolgozva. A szócikkekben megadjuk a címszó szófaját, esetleg szófajait, ha idegen szó, akkor megjelöljük, hogy latin, német stb. szó, továbbá közöljük, hogy hányszor és hol fordul elő a darabokban. A címszavak jelentésének vagy jelentéseinek illusztrálására pédamondatokat közlünk. Ha a szó kettős, hármas stb. szófajú akkor római számmal elkülönítve különkülön idézzük a példamondatokat és adatokat. Természetesen a terjedelem miatt nem közölhetjük a címszavak összes előfordulásait szövegösszefüggésben, csupán néhány példát hozunk, amelyekből a címszó jelentései, használati körülményei többékevésbé kiderülnek. A jelentéstartalom teljes bemutatására nem törekedhettünk, hisz akkor már valóságos szótárt készítettünk volna. Legtöbbször azonban az általunk közölt példákból megfelelő képet nyerhet a kutató a szavak jelentéseiről. Például Csokonai 16 színművében 9812 szó fordul elő 85 543 adatban. A 9812 szóból 5259et csak egyszer használ az író, 1454et pedig kétszer. Így tehát a szavak több mint 60 százalékának minden előfordulása szövegösszefüggésben található meg a kötetben.

A szócikkek következő része néhány kivételtől eltekintve azokat az adatokat tartalmazza, amelyeket nem mutattunk be szövegösszefüggésben. Mindkét részben megadjuk az adatok előfordulási helyét, hogy bárki visszakereshesse őket a kritikai kiadásban.

Az adattári részben helykímélés végett kénytelenek voltunk egyes szavak adatainak felsorolásától eltekinteni. Nyilvánvalóan nem szükséges a 8347szer előforduló névelők minden egyes előfordulási helyét megadni, hasonlóképpen felesleges a szintén nagyon gyakori kötőszavak, határozószavak, névmások stb. előfordulási helyeit felsorolni. Színművekről lévén szó a szereplők neve is ott áll mindig az általuk mondott szöveg előtt, ezek lelőhelyét sem tüntettük fel. Ezeken kívül néhány gyakori melléknév (jó, kedves, nagy, szép) és a 831szer szereplő úr főnév előfordulási helyeit nem adtuk meg. Természetesen e szavaknak a jelentéseit is bemutatjuk példamondatok segítségével. Ha valaki éppen ezeket kutatja, akkor annak rendelkezésére áll a teljes anyagot tartalmazó konkordancia a Kossuth Lajos Tudományegyetem Magyar Nyelvtudományi Tanszékén.

A szókincstárból meggyőződésünk szerint jó és helyes képet kapunk Csokonai színműveinek szókincséről. Nagyon fontos, hogy segítségével a kutató, de az egyszerű olvasó is könnyen visszakereshet és ellenőrizhet minden adatot. Bárki könnyen megtalálhat minden idézetet, ha legalább egy szóra emlékszik belőle. Az irodalomtörténészek tárgymutatóként is használhatják, a nyelvészek részére a szókincs bemutatásán kívül az alaktani kutatásokhoz teljes adattárat nyújt, a mondattani és jelentéstani vizsgálatokhoz pedig jó példatárat, amelyet tetszés szerint bővíthet mindenki a megadott előfordulási helyek alapján.

A szócikkek felépítése

A szókincstárban külön címszóként szerepel minden egyszerű, összetett és képzett szó, tehát a ható ige, szenvedő ige, segédige, igenév stb. is. A címszavakat mai helyesírással közöljük, megtartjuk azonban az írótól használt hangalakot. Csokonai például az ad ige alapalakját következetesen ád formában írja színműveiben, mert nyilván így is ejtette, ezért a címszó a szótári gyakorlattól eltérően nem ad, hanem ád. Ha a szó alapalakja váltakozva fordul elő, akkor a címszót mai formában írjuk, esetleg több változatban is megadjuk.

Az igenevek közül a főnévi igenévvel kivételt tettünk, ugyanis a megfelelő igével egy szócikkben mutatjuk be, minthogy az összetett igealakokban egy részük amúgy is odakerül. A szócikkfejben azonban utalunk arra hogy hány igenév fordul elő, és a gyakorisági szótárban külön szónak tekintettük. Például az ád szócikkben a 150+16 azt jelenti, hogy 150 igei alak és 16 igenév szerepel benne. Az adni fog összetett jövő időt természetesen igealaknak vettük.

A fentieken kívül külön címszót alkotnak a személyraggal vagy egyéb raggal állandósult főnevek, névmások, határozószók (gazduram, engem, bennünket, sokadmagával, őbenne stb.), a mutatónévmások határozóragos alakjai (abban, ebbe stb.), a tulajdonnevek (Firkász, Kardos, Tipptopp stb.), és különkülön címszavak a család és keresztnevek. Az egyes szavak alakváltozatai egy szócikkbe kerülnek, de utalószavakkal felhívjuk rájuk a figyelmet. Ugyancsak utalunk az összetételek utótagjaira is.

A szövegszótári részben a példamondatokat a kritikai kiadás helyesírása szerint betűhíven közöljük, de a címszóra vonatkozó adatot kurzívval kiemeljük. Csokonai kedvelte a hosszú, többszörösen összetett mondatokat, ezért olykor a mondatból csak annyit idézünk, amennyiből a címszó jelentése kiderül. Néha azonban két mondatot is közölnünk kell, mert csak így tudjuk a szó jelentését bemutatni. Minden egyes példamondat után zárójelben megadjuk az adat előfordulási helyét. Az első számjegy a színmű számát jelöli, a második azt, hogy a darabnak hányadik sorában található a kurzívval kiemelt szó.

A példamondatok után következnek a címszóra vonatkozó további adatok, névszók esetében az alábbi sorrendben: egyes és többes nominativus, birtokos személyragos formák (estrag nélkül), accusativus, genitivus, belső és külső helyhatározóragos alakok (hol?, hová?, honnan?), majd az ért, a dativusi nak/nek, ig, val/vel, vá/vé, képpen, ként, szor/szer/ször, kor ragos adatok. A közép és felsőfokú melléknévi formák ezek után következnek. Ha a címszó ige, akkor először az alanyi ragozás kijelentő mód jelen idő egyes szám 3. személyű adatai jönnek a példamondatok után. Ezt követik az alanyi ragozás kijelentő mód jelen, múlt és jövő idejű alakjai, majd a tárgyas ragozás kijelentő módú példái ugyanebben a sorrendben. Ezek után adjuk a feltételes, majd a felszólító módú adatokat értelemszerűen ugyanolyan elrendezésben, mint azt a kijelentő mód példáiban tettük. Végül a főnévi igenevek következnek. Itt, az adattári részben is minden adat után közöljük a lelőhelyet, illetőleg a lelőhelyeket. A sorszámot jelző szám fölött levő index arra utal, hogy ugyanabban a sorban többször is előfordul ugyanaz az adat. Természetesen ebben a részben is megtartottuk a kritikai kiadás helyesírását. - A szócikket a címszó Csokonai színműveiben előforduló összetett, illetőleg igekötős változatainak a felsorolása zárja.

A források feldolgozása és megjelölése

Amint említettük szókincstárunk tartalmazza a kritikai kiadás alapján Csokonai színműveinek a szókincsét. Egyes darabokból azonban csak azokat a részeket dolgoztuk fel, amelyek valóban az írótól származnak. Így A' boszorkánysíp című műből csak annak a résznek a szavait vettük át, amelyet Csokonai fordított (134-9. l.). A' Varázssíp az előző mű I. felvonása 13. jelenetének másolata, bár Csokonai javított ezen a szövegen, valójában mégsem az ő munkája, ezért ezt is kihagytuk. A' Varázssíp zeneszámai viszont már a költő saját fordításai, ezért ezek szavait felvettük a szókincstárba. Megjegyezzük azt is, hogy a kritikai kiadás jegyzeteiben közölt szövegváltozatokat az egyöntetűség kedvéért nem vettük figyelembe, ezek jó része ugyanis nem autográf kéziratból származik.

Azok az idegen szavak szerepelnek anyagunkban, amelyeket az író beépített magyar mondatba, szövegbe. A fordítatlanul hagyott, vagy összefüggő, hosszú idegen nyelvű szövegrészek szavait nem vontuk be a feldolgozásba.

Minthogy a kritikai kiadás nem látta el sorszámokkal a színműveket, ezt nekünk kellett pótolnunk. Erre a hivatkozás megkönnyítése végett volt szükség. Az egyes darabok sorrendjüknek megfelelően az alábbi számokat kapták:

1. A' méla Tempefői

2. A' voszorkánysíp

3. A' Varázssíp

4. A' Varázssíp zeneszámai

5. Galatéa

6. Ákhilles Stzirusban

7. Amintás

8. A' Szeretet Győzedelme a' Tanúltakon

9. Gerson

10. Az elhagyott Dídó

12. A' Pásztor Király

13. Angélika

14. Doctorandus

15. Cultura

16. Az Özvegy Karnyóné 's a két Szeleburdiak

Ha tehát egy adat után ez áll: (1/74, 1622), akkor ez azt jelenti, hogy a kérdéses adat az első dráma, azaz A' méla Tempefői 74. és 162. sorában található, az utóbbiban kétszer is. Az 1-7. számú darabok a Színművek 1., a 8-16. jelzésűek a 2. kötetében vannak.

A színművek szókincsének gyakorisági megoszlása

A szókincstár anyagából számítógéppel gyakorisági szótárt csináltunk. A feldolgozott szövegben, amint már említettük, 9812 szó fordul elő 85 543 adatban. A szótárból függelékképpen mellékeljük az első 1042 szót. Ezek tíznél többször szerepelnek a szövegben. Azért nem 1000et sorolunk fel, mert 68 11szer előforduló szó van, és egy részüket nem akartuk elhagyni. A szókincsről különböző táblázatokban kimutatást készítettünk, és ugyancsak táblázatokban mutatjuk be a szókincs szófaji megoszlását. Az összehasonlíthatóság megkönnyítése végett átvettük Csirikné Czachesz Erzsébet és Csirik János Újságnyelvi gyakorisági szótárának eljárását (Szeged, l986. XLI-XLVIII).

Az I. táblázatban az egyes gyakorisági intervallumokra vonatkozó számszerű és százalékos értékeket ismertetjük. A leggyakoribb szó (a névelő) 5015ször fordul elő, ez az összes előfordulás 5,86%a. Az első tíz szó, a, az (névelő), és, nem (határozószó), én, az (névmás), hogy (kötőszó), van, is,úr, 17 286szor szerepel, és ez az összes előfordulás 20,20%a stb.

I. TÁBLÁZAT

A különböző gyakorisági intervallumok összehasonlítása


Intervallum     Az összes  Előfordulások 
száma       előfordulás   százalékban 

1-            5015     5,86 % 

1-10          17286     20,20 % 

1-50          31522     36,84 % 

1-100          38942     45,52 % 

1-500          58550     68,44 % 

501-1000         8112     9,48 % 

1001-1500        4259     4,97 % 

1501-2000        2729     3,19 % 

2001-2500        1929     2,25 % 

2501-3000        1500     1,75 % 

3001-3500        1099     1,28 % 

3501-4000        1000     1,16 % 

4001-4500        1000     1,16 % 

4501-5000         553     0,64 % 

5001-5500         500     0,58 % 

5501-6000         500     0,58 % 

6001-6500         500     0,58 % 

6501-7000         500     0,58 % 

7001-7500         500     0,58 % 

7501-8000         500     0,58 % 

8001-8500         500     0,58 % 

8501-9000         500     0,58 % 

9001-9500         500     0,58 % 

9501-9812         312     0,36 % A II. táblázat a szavak gyakoriságának eloszlását mutatja be. Az első oszlopban a gyakoriság sorszáma található, a másodikban számszerű értéke, a harmadikban pedig a halmozott értékeket tüntettük fel. A legmagasabb abszolút gyakoriság 5015, a második 2753, a kettő halmozott értéke 7768 stb. Ha az első oszlopban több szám szerepel egymás mellett, ez azt jelenti hogy több szó is azonos számban fordul elő. A táblázat második oszlopának segítségével könnyen megállapíthatjuk a gyakorisági szótárból kihagyott szavak helyét. Megnézzük például a szókincstárban, hogy a tapasztal ige kilencszer fordul elő a szövegben. Utána a táblázatból kiolvashatjuk, hogy a kilencszer előforduló szavak az 1130-1235. helyen állnak.

A III./a, III/.b és a III./c táblázatok a szókincs szófajok szerinti megoszlását mutatják be számszerűen és százalékos arányukat az összes szóhoz viszonyítva, ezenkívül láthatjuk belőlük a szófajok előfordulásának számát és százalékos arányát az összes előforduláshoz viszonyítva. A III./a táblázat az egyszófajú szavakat tartalmazza, a III./bben a kettős szófajúak, a III./cben pedig a hármas és négyes szófajúak vannak. Főnév például 3405 szerepel a szövegekben, ez a 9812 szó 34,70%a; ezek a főnevek 22 306szor fordulnak elő, ez pedig az összes előfordulás 26,07%a.

A IV. táblázat az idegen szavak arányát tartalmazza a III./a-c táblázatok beosztása szerint. Kiderül belőle például, hogy a színművekben 613 idegen szó van, ez az összes szavak 6,24%a. Ezek az idegen szavak 1048szor szerepelnek, ami az összes előfordulásnak csak 1,22%a.

A gyakorisági szótár és a gyakoriság megoszlását bemutató táblázatok segítségével a színművek adatait össze lehet hasonlítani Csokonai verseinek és egyéb prózai műveinek hasonló adataival. Amennyiben e színművek nyelve a XVIII. századvégi beszédnyelv emléke, akkor ez a gyakorisági szótár a XVIII. századvég beszédnyelvi gyakorisági szótára. Természetesen más korok, így például a mai magyar nyelvből készült hasonló feldolgozásokkal is össze lehet hasonlítani. Az ilyen összehasonlításokból mindenképpen hasznos nyelvi, nyelvtörténeti, stilisztikai stb. következtetéseket vonhatunk le.

II. TÁBLÁZAT

A szavak gyakoriságának eloszlása

Sorszám         Abszolút Halmozott gyakoriság 
           gyakoriság            

1.             5015         5015 

2.             2753         7768 

3.             1648         9416 

4.             1438         10854 

5.             1365         12219 

6.             1207         13426 

7.             1090         14516 

8.             1061         15577 

9.              878         16455 

10.             831         17286 

11.             756         18042 

12.             741         18783 

13.             688         19471 

14.             587         20058 

15.             579         20637 

16.             564         21201 

17.             517         21718 

18.             514         22232 

19.             505         22737 

20.             457         23194 

21.             418         23612 

22.             374         23986 

23.             371         24357 

24.             353         24710 

25.             350         25060 

26.             326         25386 

27.             310         25696 

28.             307         26003 

29.             298         26301 

30.             296         26597 

31-2.            278         27153 

33-4.            271         27695 

35.             265         27960 

36.             263         28223 

37.             261         28484 

38.             251         28735 

39.             250         28985 

40.             248         29233 

41.             246         29479 

42-3.            242         29963 

44.             240         30203 

45.             236         30439 

46.             232         30671 

47.             221         30892 

48.             215         31107 

49.             211         31318 

50.             204         31522 

51-2.            199         31920 

53.             198         32118 

54.             196         32314 

55.             195         32509 

56.             193         32702 

57-8.            175         33052 

59.             174         33226 

60.             172         33398 

61.             170         33568 

62.             169         33737 

63.             165         33902 

64.             163         34065 

65.             162         34227 

66.             157         34384 

67.             155         34539 

68.             154         34693 

69.             153         34846 

70-2.            150         35296 

73.             149         35445 

74-5.            148         35741 

76.             147         35888 

77.             139         36027 

78.             137         36164 

79-80.            135         36434 

81-2.            133         36700 

83.             132         36832 

84-5.            130         37092 

86-7.            129         37350 

88-91.            128         37862 

92.             124         37986 

93.             123         38109 

94-5.            121         38351 

96.             120         38471 

97.             119         38590 

98.             118         38708 

99-101.           117         39059 

102-3.            115         39289 

104.             114         39403 

105.             109         39512 

106-7.            106         39724 

108-9.            105         39934 

110-1.            104         40142 

112-3.            103         40348 

114-5.            102         40552 

116.             100         40652 

117-9.            95         40937 

120-1.            94         41125 

122.             93         41218 

123-6.            92         41586 

127-8.            91         41768 

129-30.            90         41948 

131-2.            89         42126 

133-7.            88         42566 

138-9.            87         42740 

140-4.            86         43170 

145.             85         43255 

146-8.            84         43507 

149-50.            83         43673 

151-3.            82         43919 

154-6.            81         44162 

157-8.            80         44322 

159-61.            78         44556 

162.             77         44633 

163.             76         44709 

164-7.            75         45009 

168-9.            74         45157 

170-1.            73         45303 

172-3.            72         45447 

174-6.            71         45660 

177.             70         45730 

178-80.            69         45937 

181.             68         46005 

182-5.            67         46273 

186-90.            66         46603 

191.             65         46668 

192-4.            64         46860 

195-9.            63         47175 

200-1.            62         47299 

202-5.            61         47543 

206-9.            60         47783 

210-7.            59         48255 

218-24.            58         48661 

225-7.            57         48832 

228-9.            56         48944 

230-2.            55         49109 

233-6.            54         49325 

237-40.            53         49537 

241-5.            52         49797 

246-7.            50         49897 

248-54.            49         50240 

255-8.            48         50432 

259-64.            47         50714 

265-9.            46         50944 

270-4.            45         51169 

275-80.            44         51433 

281-8.            43         51777 

289-91.            42         51903 

292-8.            41         52190 

299-306.           40         52510 

307-18.            39         52978 

319-24.            38         53206 

325-31.            37         53465 

332-8.            36         53717 

339-52.            35         54207 

353-61.            34         54513 

362-75.            33         54975 

376-95.            32         55615 

396-406.           31         55956 

407-25.            30         56526 

426-40.            29         56961 

441-58.            28         57465 

459-68.            27         57735 

469-83.            26         58125 

484-504.           25         58650 

505-26.            24         59178 

527-44.            23         59592 

545-65.            22         60054 

566-96.            21         60705 

597-622.           20         61225 

623-42.            19         61605 

643-65.            18         62019 

666-708.           17         62750 

709-43.            16         63310 

744-84.            15         63925 

785-842.           14         64737 

843-98.            13         65465 

899-973.           12         66365 

974-1042.           11         67124 

1043-129.           10         67994 

1130-235.           9         68948 

1236-353.           8         69892 

1354-512.           7         71005 

1513-717.           6         72235 

1718-2002.           5         73660 

2003-427.           4         75360 

2428-3099.           3         77376 

3100-4553.           2         80284 

4554-9812.           1         85543 


III./a TÁBLÁZAT

Szófajok szerinti megoszlás


         Szavak  Százalékos Előfordulásuk  Százalékos 
         száma   arány az     száma   arány az 
                összes            összes 
                szóhoz        előfordulásho 
             viszonyítva              z 
                            viszonyítva 

főnév       3405    34,70 %     22306    26,07 % 

ige        2333    23,78 %     12637    14,77 % 

igenév       1223    12,46 %      2082    2,43 % 

melléknév     1018    10,38 %      3297    3,85 % 

határozószó     525    5,35 %      7183    8,39 % 

névmás       132    1,35 %      8710    10,18 % 

számnév       98    1,00 %      987    1,15 % 

kötőszó       54    0,55 %      5139    6,01 % 

mondatszó      45    0,46 %      384    0,45 % 

indulatszó      44    0,45 %      709    0,83 % 

névutó        35    0,36 %      603    0,70 % 

segédige       4    0,04 %      422    0,49 % 

névelő        3    0,03 %      8347    9,76 % 

igekötő        1    0,01 %       1    0,01 % 
(magában                              
álló)                               

Összesen:     8920    90,92 %     72807    85,09 % III./b TÁBLÁZAT

Kettős szófajú szavak


         Szavak   Százalékos Előfordulásu   Százalékos 
         száma    arány az   k száma    arány az 
             összes szóhoz           összes 
              viszonyítva       előforduláshoz 
                            viszonyítva 

fn/mn,mn/fn     165     1,68 %     3257     3,81 % 

ksz/hsz,hsz/k    18     0,18 %     2628     3,07 % 
sz                                 

nm/hsz        12     0,12 %     843     0,98 % 

hsz/nu,nu/hsz    12     0,12 %     207     0,24 % 

fn/hsz,hsz/fn    10     0,10 %     1534     1,79 % 

mn/hsz,hsz/mn     9     0,09 %     147     0,17 % 

in/fn         7     0,07 %     146     0,17 % 

hsz/msz,msz/h     7     0,07 %     343     0,40 % 
sz                                 

i/msz,msz/i      3     0,04 %      55     0,06 % 

isz/fn        3     0,04 %      96     0,11 % 

in/mn         3     0,04 %      18     0,02 % 

nm/fn         2     0,02 %     143     0,17 % 

szn/mn        2     0,02 %      12     0,01 % 

nm/ksz        2     0,02 %     193     0,22 % 

hsz/ik        2     0,02 %      12     0,01 % 

i/si         1     0,01 %      92     0,11 % 

szn/fn        1     0,01 %      25     0,03 % 

fn/msz        1     0,01 %      3     0,01 % 

nm/ne         1     0,01 %     514     0,60 % 

szn/nm        1     0,01 %     198     0,23 % 

szn/hsz        1     0,01 %      45     0,05 % 

ksz/fn        1     0,01 %     133     0,15 % 

Összesen:      264     2,70 %    10644    12,41 % III./c TÁBLÁZAT

Hármas és négyes szófajú szavak


        Szavak   Százalékos Előfordulás   Százalékos 
         száma    arány az  uk száma    arány az 
            összes szóhoz           összes 
             viszonyítva       előforduláshoz 
                           viszonyítva 

hsz/ksz/msz,ks    3     0,03 %     420     0,49 % 
z/hsz/msz                            

mn/hsz/fn,mn/f    3     0,03 %     380     0,44 % 
n/hsz                              

nm/hsz/ksz      2     0,02 %     84     0,10 % 

i/msz/fn       1     0,01 %      4     0,01 % 

mn/fn/isz      1     0,01 %      9     0,02 % 

in/mn/fn       1     0,01 %     59     0,07 % 

szn/mn/hsz      1     0,01 %      3     0,01 % 

hsz/ik/msz      1     0,01 %      7     0,01 % 

hsz/ksz/ik      1     0,01 %     47     0,06 % 

fn/mn/hsz/szn    1     0,01 %     31     0,04 % 

Összesen:      15     0,15 %    1044     1,25 % IV. TÁBLÁZAT

Idegen szavak előfordulása


        Szavak   Százalékos Előfordulásuk   Százalékos 
         száma    arány az     száma    arány az 
            összes szóhoz            összes 
             viszonyítva        előforduláshoz 
                            viszonyítva 

latin       405     4,13 %      734     0,86 % 

német        82     0,83 %      147     0,17 % 

francia       40     0,40 %       62     0,07 % 

olasz        38     0,39 %       49     0,06 % 

cigány       23     0,23 %       26     0,03 % 

jiddis,       6     0,06 %       10     0,01 % 
?jiddis                               

görög        3     0,03 %       3     0,01 % 

görög-latin     1     0,01 %       1     0,01 % 

szerb        1     0,01 %       2     0,01 % 

török        1     0,01 %       1     0,01 % 

kétes        13     0,13 %       13     0,01 % 

Összesen:     613     6,23 %      1048     1,25 %