windows - Særlige tegn i indtastningen af ​​hunspell behandles som mellemrum

Indlæg af Hanne Mølgaard Plasc

Problem



Dette spørgsmål blev stillet til superbrugeren, men fik kun 8 visninger om 7 dage. Hunspell kyndige mennesker går til stackoverflow, og derfor reagerer jeg spørgsmålet her.





Jeg tester hunspell i kommandolinjen med en svensk ordbog.
Indgangen i den interaktive tilstand erstatter alle specialtegn (for eksempel å ä ø) med blanke før stavekontrol.


Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*

sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*


Som du ser, fungerer promptens kodning, og viser å og både i input og output.


Rørledning giver det samme resultat:


echo sjögräs | hunspell -d sv\_SE


Jeg har forsøgt at give forskellige muligheder for hunspell, herunder -i UTF-8, -i UTF-16 og ved at holde aff filen 's SET ISO8859-1. Intet fungerede.


Det samme sker med fransk:


C:Usersgauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat


med desuden problemer med output.


Jeg sammensatte hunspell i MinGW og flyttede de resulterende nødvendige filer til et sted i min vej, men jeg tror ikke, at disse oplysninger er meget relevante.


Hvordan laver jeg hunspell genkende specialtegn på dens input?

Bedste reference


Ved at echo variablerne $LC\_ALL eller $LANG kan du se, hvilken sprog og lokalekonfiguration du har på din terminal.


Derefter kan du prøve at ændre den til charsetet hunspell ved at omdefinere disse variabler. For eksempel kan du indstille


LC\_ALL=en\_US.ISO8859-15


eller


LANG=ca\_ES.cp1252


Som jeg husker, er standard tegn sæt latin1, men jeg er ikke sikker (jeg er ikke med Linux lige nu).


Prøv denne fremgangsmåde i stedet for at ændre hunspell-softwaren.