| .hla hu |
| .TH hunspell 1 "2008. április 11." |
| .LO 1 |
| .SH NÉV |
| hunspell \- unicode-os helyesírás\-ellenőrző, szótövező és morfológiai elemző program |
| .SH ÁTTEKINTÉS |
| hunspell [\-1aDGHhLlmnstvw] [\-\-check\-url] [\-d szótár[,...]] [\-p sajátszótár] [állomány(ok)] |
| .SH LEÍRÁS |
| A |
| .B hunspell |
| felismeri és javítja az elütéseket és típushibákat |
| egyszerű szöveges, (La)TeX, HTML és groff (kézikönyv oldal) állományokban. |
| .PP |
| Ha nem adunk meg állománynév-paramétert, a Hunspell az Ispell |
| csőfelületéhez hasonlóan működik: a bemenet sorait szavakra bontja, |
| és *, +, vagy - jellel kezdődő kimeneti sorral jelzi, ha egy szó jó, |
| és # vagy & jellel, ha rossz. A csőfelület parancsait viszont az |
| Ispellhez hasonlóan csak a |
| .I \-a |
| kapcsoló megadásával értelmezi. |
| .PP |
| Állománynév paraméter esetén elindul egy az Ispelléhez hasonló interaktív felület. |
| .SH KAPCSOLÓK |
| .TP |
| .B \-1 |
| Speciális formátum: a bemeneti állomány tabulátorjelet tartalmazó soraiból csak az |
| első tabulátorjel előtti karaktersorozatot vizsgálja meg. |
| .TP |
| .B \-a |
| Ispellhez csőfelület. A |
| .I !, |
| .I +, |
| .I \-, |
| .I \@, |
| .I #, |
| vagy |
| .I ^ |
| jellel kezdődő sorok a csőfelület parancsai, jelentésüket |
| az Ispell kézikönyvoldal részletezi. A \-a kapcsoló |
| hatására a kimenetben a jó szavakat csak csillaggal jelzi |
| a Hunspell. Ez nagyobb kompatibilitást biztosít az Ispellt használó programok |
| némelyikével (például a LyX-szel). Ekkor nem kell |
| megadnunk a \-a kapcsolót, mivel az Ispellt |
| használó programok automatikusan ezzel a kapcsolóval indítják |
| el az Ispell nevében futó Hunspellt is. |
| .TP |
| .B \-d " szótár[,szótár2,...]" |
| Beállítja a helyesírási szótárakat a |
| kiterjesztés nélküli szótárnevek, útvonalak |
| megadásával. |
| |
| Például a |
| .PP |
| hunspell \-d hu_HU,hu_geo,hu_med,de_DE,de_med |
| .PP |
| a magyar alapszótárat és kiegészítő szótárait, |
| valamint német alapszótárat és annak egy kiegészítő |
| szótárát tölti be. Az alapszótárak egy aff és egy dic |
| kiterjesztésű állományból állnak, a kiegészítő szótárak |
| csak dic állományból. A kiegészítő szótárak |
| nevére vonatkozóan nincs szabály (csak a dic kiterjesztés), |
| a szótárnevek sorrendje határozza meg, hogy melyik alapszótárhoz |
| töltődnek be a kiegészítő szótárak (ami pedig meghatározza |
| a javaslattevést). Az első szótár mindig alapszótár. |
| .PP |
| Az alapértelmezett szótár a környezet nyelvi beállításától függ |
| az Unix rendszereken. Locale hiányában a |
| .BR /usr/share/hunspell/default |
| az alapértelmezett szótár. |
| .PP |
| A megadott útvonal lehet abszolút és relatív is. Relatív |
| útvonal esetén először az aktuális, majd a |
| .BR /usr/share/hunspell |
| és még több más könyvtárban keresi a szótárt a program. L. \-D és a |
| .BR PÉLDÁK. |
| .TP |
| .B \-D |
| A keresési útvonalak, az elérhető és betöltött szótárak útvonalának |
| kijelzése. |
| .TP |
| .B \-G |
| A \-l, \-w, és \-L kapcsolókat kiegészítő kapcsoló. A standard bemenetről |
| érkező hibás szavak, illetve |
| sorok megjelenítése helyett a jó szavak és a hibátlan sorok megjelenítését |
| kérhetjük vele. Ha mást nem adunk meg, a \-l kapcsoló hatásának megfelelően |
| működik, csak a rossz helyett a jó szavakat írja a standard kimenetre. |
| .TP |
| .B \-h, \-\-help |
| A beépített leírás megjelenítése. |
| .TP |
| .B \-H |
| HTML bemeneti állományformátum beállítása. Ha az állomány |
| nevének .html, .htm, vagy .xml a kiterjesztése, ez automatikusan bekövetkezik. |
| .TP |
| .B \-l |
| Kiírja a hibás szavakat a standard bemenetről érkező állományból. |
| Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló |
| megfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra. |
| .TP |
| .B \-L |
| Csak a hibás szavakat tartalmazó sorokat írja ki a standard bemenetről érkező állományból. |
| Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló |
| megfordítja a működését: csak azok a sorok kerülnek kiírásra, amelyek egy |
| hibás szót sem tartalmaznak. |
| .TP |
| .B \-m |
| Elemző üzemmód: a bemeneti szövegszavak morfológia elemzése, illetve a szótári |
| morfológiai leírás hiányában a toldalékolt szavak kapcsolóinak |
| kijelzése (szótárfejlesztőknek). |
| .TP |
| .B \-n |
| Nroff/troff bemeneti állományformátum beállítása, elsősorban a |
| kézikönyvlapok ellenőrzésére. |
| .TP |
| .B \-p " saját_szótár" |
| A felhasználó saját szótárának beállítására szolgál. |
| |
| Az alapértelmezett saját szótár a |
| .BR $HOME/.hunspell_default |
| állomány. Ha szótárat is megadunk a |
| .I \-d |
| kapcsolóval, vagy a |
| .I DICTIONARY |
| környezeti változóval, a saját szótár a |
| .BR $HOME/.hunspell_szótárnév |
| lesz. Ha a saját szótár nem létezik, létrehozza. |
| |
| Ha az aktuális könyvtárban is van egy ugyanilyen nevű |
| állomány, akkor annak tartalma is beolvasásra kerül, |
| mint saját szótár, és az újonnan felvett szavak is |
| ide kerülnek. |
| |
| A |
| .I \-p , |
| vagy a |
| .I WORDLIST |
| környezeti változó megadásával új saját szótárat |
| jelölünk ki. A saját szótárat az aktuális könyvtárban, |
| és a saját könyvtár gyökerében ($HOME) keresi a |
| Hunspell. Ha nem található, akkor az újonnan felvett |
| szavak mentésénél létrehozza a saját könyvtár gyökerében. |
| .TP |
| .B \-s |
| Tövező üzemmód: a bemenő szövegszavak tövezése (a szótártól függő |
| pontossággal). |
| .TP |
| .B \-t |
| LaTeX bemeneti állományformátum beállítása. Ha az állomány nevének .tex |
| a kiterjesztése, ez automatikusan bekövetkezik. |
| .TP |
| .B \-u |
| Tipikus hibák kijelzése az állományból, cserejavaslattal. |
| .TP |
| .B \-u2 |
| Tipikus hibák és javításuk kijelzése módosítható, és a |
| sed programmal végrehajtatható formában. |
| Irányítsuk a Hunspell kimenetét egy állományba. |
| Törüljük azokat a sorokat az elmentett állományból, |
| amelyek sed paranccsal megadott javítását nem szeretnénk. |
| Mentsük el az állományt, és |
| a \fIsed -f javítás eredeti_állomány >javított_állomány\fR |
| paranccsal javíthatjuk az állományt gyorsan |
| és egyszerűen. (A sok hibát tartalmazó állományok |
| javítását gyorsítja meg ez a lehetőség.) |
| .TP |
| .B \-U |
| Ha az -u kapcsolóval kapott javaslatokat mind el szeretnénk fogadni, |
| akkor az \-U kapcsolóval a Hunspell automatikusan |
| végrehajtja a cseréket, és a módosított állományt |
| a szabványos kimenetre küldi. Példa a javításra: |
| \fIhunspell -U eredeti_állomány >javított_állomány\fR. |
| A hibakimeneten megjelennek a javítások is még egyszer, a |
| -\u kapcsolóhoz hasonló módon. |
| .TP |
| .B \-v |
| Verziószám. |
| .TP |
| .B \-vv |
| Verziószám (Ispell kompatibilitás miatt). |
| .TP |
| .B \-w |
| Csak a hibás szavakat írja ki a standard bemenetről érkező, soronként |
| egy szót tartalmazó állományból. A sorok nincsenek szavakra |
| bontva. A sorok szavakra bontása, és csak a hibás szavak kiírása a \-w kapcsolóval |
| érhető el. A \-G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnek |
| kiírásra. |
| .SH INTERAKTÍV FELÜLET |
| A felület legfelső sorában a hibás szóalakot, és az éppen vizsgált |
| állomány nevét látjuk. Amennyiben egy szóalak szótári tiltás |
| miatt nem kerül elfogadásra, a bal felső sarokban a TILTOTT! |
| (FORBIDDEN!) üzenet is megjelenik. Ez az üzenet arra utal, hogy nem |
| hiányos szókincs, hanem szándékos tiltás miatt nem került a szó |
| elfogadásra. Az első sor alatt az állomány hibás szót tartalmazó sorát, és |
| szövegkörnyezetét láthatjuk, majd ezt követik a javaslatok, ha vannak. |
| .PP |
| A használható billentyűkombinációk: |
| .TP |
| .B Szóköz |
| Továbblépés javítás nélkül a következő hibás szóra. |
| .TP |
| .B Számok |
| A megfelelő javaslat kiválasztása. |
| .TP |
| .B c |
| Csere. A hibás szó cseréje a megadott szóra, vagy szavakra. |
| Az Escape billentyű kétszeri lenyomásával megszakíthatjuk a |
| a cserét. |
| .TP |
| .B j |
| A szó elfogadása a program futásának befejeződéséig. |
| .TP |
| .B f |
| A szó felvétele a saját szótárba. |
| .TP |
| .B k |
| A szó kisbetűsként való felvétele a saját szótárba. |
| .TP |
| .B t |
| Ragozott tőszó felvétele. A ragozás a másodikként |
| megadott, mintául szolgáló szó alapján történik. |
| Ha ez a szó nincs felvéve a szótárba, a tőszófelvételt |
| elölről kell kezdeni. |
| |
| Példa: gyakran hiányoznak az idegen és a |
| mozaikszavak. Vegyük fel a hiányzó OTP szót |
| a tv köznévi mozaikszó toldalékaival! |
| Lenyomjuk a t billentyűt, beírjuk, hogy OTP, |
| leütjük az új sor billentyűt, beírjuk, hogy tv, és ismét új sor. A tv szó |
| ugyanis már szerepel a szótárban, és ragozása |
| mondja meg a programnak, hogy az OTP szót |
| milyen toldalékokkal szeretnénk látni, pl. |
| OTP\-hez, OTP\-met stb. a tv\-hez, tv\-met mintájára. |
| A \-val/\-vel, \-vá/\-vé toldalékokat |
| a kötőjellel kapcsolt toldalékú szavak |
| esetében külön kell felvenni, de még így is sokkal |
| kényelmesebb a speciális tőfelvétel, mint minden |
| (akár több száz) toldalékos alakot külön\-külön |
| felvenni. |
| |
| Egy kis segítség a minta kiválasztásához: |
| első menetben a hangrend számít. Pl. mozaikszavaknál a |
| mély hangrendű új szavak felvételénél használhatjuk |
| a \fIMÁV\fR szót példaként, ajakréses magas hangrendnél |
| pedig az említett \fItv\fR\-t. Ajakkerekítéses magas hangrend |
| esetében a \fIHÖK\fR szót használhatjuk (amíg át nem |
| lesz javítva a helyes hök\-re). Ha a hiányzó |
| szó nem mozaikszó, hanem például tulajdonnév, |
| a \fIPál\fR, \fIPéter\fR, \fIÖrs\fR szavakat adhatjuk |
| meg példának a hangrendtől függően. Ha meg |
| egyszerű köznévről van szó, akkor használjuk az |
| \fIok\fR, \fIék\fR, \fIük\fR szavakat. |
| Igéknél \fIáll\fR, \fIvél\fR, \fIül\fR, |
| ikes igéknél \fIázik\fR, \fIvérzik\fR, \fInőzik\fR |
| lehet a példa (remélhetőleg a következő |
| változatokban egyszerűsödik ez a tőfelvétel). |
| |
| Az Escape billentyű kétszeri lenyomásával megszakíthatjuk ezt |
| a műveletet. |
| |
| Az itt felvett szavak automatikusan a saját |
| szótárba kerülnek. Ha ezt innen törölni |
| szeretnénk, a programból kilépve |
| a saját szótár kézi átszerkesztésével tehetjük meg. |
| |
| .TP |
| .B m |
| Kilépés a változtatások mentése nélkül. A program |
| változtatás megléte esetén megerősítést kér. |
| .TP |
| .B v |
| Az állomány ellenőrzésének megszakítása a változtatások |
| mentésével. Ha van következő állomány, akkor |
| a program annak ellenőrzését kezdi el. |
| .TP |
| .B ? |
| Segítség. Hasonló rövid leírás megjelenítése a |
| billentyűparancsokról. |
| .SH CSŐFELÜLET |
| A \fIHunspell \fR soronként dolgozza fel az |
| állományokat, a helyes szavakat \fI*\fR (tőszó), \fI\-\fR |
| (összetett szó), vagy |
| .I + |
| (ragozott szó) karakterrel jelöli, a helyteleneket |
| .I # |
| (nincs javaslat) , vagy |
| .I & |
| (van javaslat) karakterrel. A + jelet a kimenetben követi még a szótő. |
| A # jel után a hibás szó, és kezdőpozíciója van feltüntetve. |
| A & jelet követi a hibás szó; a javaslatok száma; a hibás szó |
| kezdőpozíciója; majd kettőspont után a javaslatok, vesszővel elválasztva: |
| .PP |
| .RS |
| .nf |
| macska |
| * |
| macskabajusz |
| - |
| macskák |
| + macska |
| mcsk |
| # mcsk 0 |
| macka |
| & macka 7 0: macska, maca, racka, packa, vacka, marka, mackó |
| .fi |
| .RS |
| .SH PÉLDÁK |
| .TP |
| .B hunspell \-d en_US english.html |
| Az amerikai angol helyesírási szótár kiválasztása (aktuális, vagy a |
| .BR /usr/share/hunspell |
| könyvtárból. |
| .TP |
| .B hunspell \-d /opt/OpenOffice.org1.0.1/share/dict/ooo/de_DE |
| A német helyesírási szótár kiválasztása a megadott abszolút |
| útvonalról, a standard bemenet feldolgozásával. |
| .TP |
| .B hunspell *.html |
| Az aktuális könyvtárban található összes HTML állomány |
| interaktív ellenőrzése. |
| .TP |
| .B hunspell -l szöveg.html |
| A megadott állomány hibás szavainak kiírása. |
| .SH KÖRNYEZET |
| .TP |
| .B DICTIONARY |
| A szótár helyének megadására szolgál. Szerepe megegyezik a |
| .I \-d |
| kapcsolóval. |
| .TP |
| .B DICPATH |
| A szótárkeresési útvonalat tartalmazó változó. |
| .TP |
| .B WORDLIST |
| A saját szótár helyének megadására szolgál. Szerepe megegyezik a |
| .I \-p |
| kapcsolóval. |
| .SH ÁLLOMÁNYOK |
| .BI /usr/share/default.aff |
| Az alapértelmezett ragozási táblázat. Lásd hunspell(4). |
| .PP |
| .BI /usr/share/default.dic |
| Az alapértelmezett szótár az előző ragozási táblázathoz. |
| Lásd hunspell(4). |
| .BI $HOME/.hunspell_default |
| Az alapértelmezett saját szótár. Az állományt létrehozza |
| a Hunspell, ha nem létezik. Lásd ispell(1). |
| .SH LÁSD MÉG |
| .B hunspell (4), |
| .B hunstem (1), |
| .B makedb (1), |
| .B lookdb (1), |
| .B ispell (1), |
| .B ispell (4), |
| Magyar Ispell dokumentáció. |
| .SH ELŐNYÖK |
| A program a következő előnyöket nyújtja a hasonló célokat szolgáló \fIIspell\fR\-lel szemben: |
| .IP \- |
| Képzők átfogó ismerete. (Több tízezer helyes szóalak elfogadását tette |
| lehetővé a tesztelésre használt 4 millió szavas gyakorisági szótárban.) |
| .IP \- |
| Homonimák kezelése (nincsenek például olyan alakok elfogadva, mint megvárban). |
| .IP \- |
| Helyes javaslatok a több karakter változásával járó tipikus hibákra |
| (j/ly, íj/ijj, nyj/nny és még több tucatnyi tévesztés megvizsgálásával). |
| Az \fIIspell\fR csak két karakter felcserélése; vagy egy karakter hiánya, |
| cseréje, illetve felesleges jelenléte esetén ad helyes javaslatot. |
| .IP \- |
| Az összes helyes összetett szónak látszó, de tipikus hibával előálló alak tiltása (karvaj, színtű, súlytó stb.) |
| .IP \- |
| Javaslatok valószínűségi sorrendben jelennek meg (tipikus hibák, i/í, o/ó, u/ú tévesztések stb.). |
| .IP \- |
| Összetett szavak esetén 6–3\-as szabály alkalmazása (helyesírás\-ellenőrző, gépkocsi\-összeszerelés). |
| .IP \- |
| Mozgószabály alkalmazása (kiviteli engedély, kiviteliengedély\-kérés). |
| .IP \- |
| A magyar nyelv egyéb összetételi szabályainak alkalmazása (például hatlövetű, tizenkét lövetű, kéthavi, két hónapos, másodmagával). |
| .IP \- |
| Leg-, legesleg- és -bb confixum helyes kezelése (nincs pl. legédes, csak legédesebb). |
| .IP \- |
| Ragozható tőszófelvétel. Megkönnyíti egy új szó ragozott változatainak ellenőrzését, feleslegessé téve ezek külön\-külön történő felvételét a saját szótárba. |
| .IP \- |
| Javaslatok mássalhangzó\-triplázások (sakkkör, baletttáncos, dzsesszszak) esetén. |
| (Ispell helyesnek fogadja el ezeket.) |
| .IP \- |
| Javaslatok szótagduplázások (oktatatás, igenenevet) esetén. |
| .IP \- |
| Javaslatok ékezet nélküli szövegre (tukorfurogep\->tükörfúrógép). |
| .IP \- |
| Kötőjeles szavak kezelése (unos\-untalan). |
| .IP \- |
| Toldalékolt számok (1\-jén, 11\-én, 5.\-et) kezelése. |
| .IP \- |
| °, %, és § jelek (%\-kal) toldalékolt alakjainak kezelése. |
| .IP \- |
| Mozaikszavak (MÁV\-osokat) kezelése. |
| .IP \- |
| Y-ra végződő szavak (boyjal, pennyvel) kezelése. |
| .IP \- |
| Idegen ejtésű szótagra végződő szavak (Anonymusszal, Voltaire\-nek) kezelése. |
| .IP \- |
| Két szóból álló földrajzi nevek (San Franciscó\-i) kezelése. |
| .IP \- |
| Hibás alakok tiltása (Babitssal, tanit, alkotóművész stb.) |
| .IP \- |
| Tiltások jelzése a felhasználói felületen. |
| .IP \- |
| Egyéb (például az Ispell ragozott utószó esetében bármilyen szóösszetételt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg). |
| .IP \- |
| Magyar nyelvű (illetve |
| .B locale (7) |
| függő) felület. |
| .IP \- |
| Hordozható szöveges szótárállományok, szemben az Ispell platform, és bináris Ispell fordítástól függően (nem) kezelhető adatállományaival. |
| |
| .SH SZERZŐ |
| A Hunspell az OpenOffice.org MySpell függvénykönyvtárán továbbfejlesztése. |
| A MySpell affixumtömörítésének mintája az International Ispell program volt. |
| .PP |
| A mintaként szolgáló International Ispell szerzője Geoff Kuenning, |
| sok más elődje munkájára támaszkodva (l. ispell(1)). |
| .PP |
| A Myspellt Kevin Hendricks készítette a legjelentősebb |
| nyílt forráskódú irodai csomaghoz, az OpenOffice.org-hoz 2001\-2002\-ben |
| (l. http://hu.openoffice.org). |
| .PP |
| A Hunspell programkönyvtárat és parancssori programot |
| Németh László <nemeth@openoffice PONT org> készítette 2002\-2008\-ban. |