I Windows, hvordan indtaster du et tegn uden for Unicode Basic Multilingual Plane?

Indlæg af Hanne Mølgaard Plasc

Problem



Jeg ved, at Windows har understøttet supplerende fly siden Windows XP.


Jeg har skrifttyper, som jeg ved, har tegn udenfor det grundlæggende flersprogede fly (BMP).


For disse tegn består Unicode-kodepunktet af fem hexadecimale cifre.


Jeg ved ikke, hvordan man indtaster disse tegn i applikationer.


Windows synes kun at understøtte tastaturindtastning af tegn i BMP. Du kan enten indtaste et decimaltal, eller nogle programmer giver dig mulighed for at indtaste et firecifret hexadecimalt tal.


Kan nogen bekræfte, hvordan indgangen styres? Jeg er ligeglad med, om den er direkte fra tastaturet eller applikationsassisteret. (Standard Windows 'Character Map' -programmet understøtter kun tegn i BMP, så jeg har brug for forslag - helst til et program der understøtter mindst Unicode Version 5, hvis ikke 6.)


I Java styres disse tegn ved hjælp af 'surrogatpar' i UTF-16. Jeg er bekymret for, at Windows også kan have nogle af de gamle 'Unicode 16 bit' arv, hvilket forårsager et lignende problem. Selv at få bekræftelse på, at jeg skal slå i surrogatparnumre, ville være et svar.


Tak!

Bedste reference


Ok, jeg ved klart ikke, hvad du taler om.


I øvrigt henvises til:



  Standard Windows 'Character Map' -programmet understøtter kun tegn i BMP, så jeg har brug for forslag - helst til en applikation der understøtter mindst Unicode Version 5, hvis ikke 6.



Jeg har fundet et link til et program, der kan hjælpe.


http://www.babelstone.co.uk/software/babelpad.html[1]


Download den, og vælg menuen Værktøjer -> derefter Tegnekort.


Håber det kunne hjælpe.


Hvis du ikke er ked af misforståelsen, vil du bare hjælpe.

Andre referencer 1


Jeg har nu lavet et lille værktøj, som kan bruges på en webbrowser på en applikationslignende måde: Fuld Unicode Input-værktøj. Det ligner tegneliste i Windows, men giver dig adgang til alle Unicode-fly og får de valgte tegn samlet i et område, hvorfra de kan kopieres som en enhed. Noget hurtig og beskidt, men funktionel. [2]

Andre referencer 2


I hvert fald i MS Word 2007 fungerer Alt + X-metoden også for ikke-BMP-tegn: Indtast U + efterfulgt af Unicode-nummeret i hexadecimal, derefter Alt + X. Tegnene U + kan udelades, hvis det foregående tegn ikke er et tal eller et bogstav A-F eller X. Du kan muligvis eksplicit vælge tekstens skrifttype (dvs. ikke nødvendigvis ændrer Word til en skrifttype, der indeholder tegnet, som det normalt gør med BMP tegn).


I Word kan du alternativt bruge kommandoen Indsæt → Symbol og derefter i indsætningsvinduet vælge en skrifttype, der indeholder det tegn, du har brug for.


Ved hjælp af UnicodeInput-programmet kan du indtaste et tegn ved at trykke på Alt ++ og derefter indtaste Unicode-nummeret. Den understøtter også ikke-BMP, men med en ulige begrænsning på grund af et programfejl: det virker ikke for ikke-BMP-tegn, hvis det fjerde ciffer fra højre er et bogstav (f.eks. U + 1B000). [3]]]


BabelPad, nævnt i Martins svar, er et godt alternativ, og lader dig vælge tegn både efter nummer og ved Unicode-navn.


Der er sandsynligvis også andre Unicode-redaktører, som gør det muligt at arbejde med BMP; tjek Alan Woods liste over Unicode og Multilingual Programs and Utilities. [4]

Andre referencer 3


Jeg vil shamelessly stik et lille værktøj jeg skrev til at indtaste symboler i Windows, da jeg finder en løsning, der normalt præsenteres for besværlig til daglig hyppig brug. Min personlige brugssag er at skrive den svenske å for eksempel på et internationalt amerikansk tastatur uden at skulle skifte layout.


Det tillader indlæsning af unicode-tegn gennem et popup-vindue, der ikke adskiller sig fra, hvordan det virker i Apple OS X.


Se https://github.com/mjvh80/SymWin for detaljer, det er gratis og open source, men skal (i øjeblikket) kompileres. Hvis der er tilstrækkelig interesse, kan jeg tilføje en forudbygget version. [5]


Værktøjet kan konfigureres pr. Nøgle, f.eks. ved at kopiere/indsætte symboler en gang fra et websted som http://copypastecharacter.com. [6]