Teknologio

teknologio, komputiko, scienco kaj aliaj studemulaj temoj

0 notes

Unikodo kaj komparado inter ĉapelitaj kaj neĉapelitaj literoj

Freŝdate mi atentas multe kiel plej bone kompari vicojn de literoj, efektive de unikodaj signoj, senzorge pri la ĉapeloj.  Krom ĉapeloj mi ankaŭ volas kompari signojn kiuj estas proksimume similaj.  Unu ekzemplo de ĉi lasta estas: Se en unu signovico oni uzas la unuopa unikoda signo por kopirajto, la c en malgranda cirklo, sed iu alia uzas tri sinsekvaj signoj, (c).  Iusence, gravasence fakte, tiu trilitera sinsekvo estas uzata por signfi ĝuste la sama kiel la speciala unikoda kopirajtsigno.

Do, mi volas verki metodon de signovica objekto, en mia programara projekto, kiu ebligas al la programisto kompari signovicojn senzorgante pri aŭ la literaj ĉapeloj aŭ la maniero uzita esprimi oftajn simbolojn.  La komparo redonus jese aŭ nee pri la ekvivalenteco de la du vicoj.   Ekzemploj donindas: (donotaj en Javaskripto, kaj parte angle)

var vicoA = “Copyright © 2011, Gregorio Naçu”;

var vicoB = “Copyright (c) 2011, Gregorio Nacu”;

Mia familia nomo (kiu estas rumanidevena, sed francigita kiam la avo enmigris montrealon) havas kromsignon sub la c.  Ankaŭ la kopirajtsigno estas esprimita malsame.  Mi volas ke rezulto, malsupra-ekzemple, redonu jese:

var rezulto = vicoA.komparuSenzorganteCxapeloj(vicoB);

Por fari tiun mi estas studanta kiel unikodo funkcias, kaj serĉas tabelojn kiuj listas ekvivalentajn sinsekvojn de signoj.  Multaj solvoj abundas en la reto sed plej ofte tiuj estas nekompletaj kaj nur kovras latindevenaj signoj.  Mi volas havi tabelon multe pli ampleksa kiu povas kovri la grekan, rusan, hebrean kaj aliajn alfabetojn, kaj kiu ankaŭ listas uzindajn ekvivalentojn inter unusignaj simboloj kaj multlsignaj tamen pli oftaj signaj simbolsinsekvoj.

© == (c)

÷ == /

½ == 1/2

Kaj tiel plu.  Se vi, kara leganto, havas iajn helpajn sugestojn, b.v. sendi mesaĝon al mi.

Filed under programado