Estas multaj manieroj por kodigi karaktrojn. Interne, Simredo uzas Unikodon. La Konvert-Tabelo-funkcio ebligas al uzantoj konverti inter diversaj signokodoj kaj Unikodo.
Ekzemple, leksikografoj uzas transskrib-sistemon nomatan Buckwalter por reprezenti Araban skribadon per Latinaj literoj. La Araba frazo ".اسمي كليف" je Buckwalter estas "Asmy klyf." Simredo enhavas konvert-tabelon nomatan Arabic-BW, kiu konvertas inter Buckwalter kaj Unikodo.
Plie, la Konvert-Tabelo-funkcio ebligas al la uzanto difini proprajn konvert-tabelojn, kiel estas priskribite sube.
Elektu 'Konvertado-n' de la menuo 'Aliaj'. Dialog-fenestro simila al la suba aperos.
Estas tri falmenuoj. Tiu ĉe la supra dekstra angulo estas por elekti konvert-tabelon. En la supra ekranfoto, la tabelo Arabic-BW estas elektita. La dua menuo estas la de-tabelo (Buckwalter), kaj la tria estas la al-tabelo (Unicode).
Supozu ke teksto enhavus la frazon "Asmy klyf."
Surklako sur la butono 'Konvertu' konvertus la frazon al Unikodo, kiel sube:
Tre Grava: La konvert-funkcio konvertas nur 'elektitan' tekston. En Simredo, elektita teksto havas purpuran fonokoloron.
La Vjetnama konvert-tabelo estas difinita en dosiero nomata Vietnamese.kon. Ĉi tiu dosiero enhavas linion por VIRQ, kaj alian por Unikodo. (La linioj en la dosiero estas tre longaj. Tial, nur kelkaj signoj estas montritaj ĉi tie.)
VIRQ,A^',a^',A^`,a^`,A^?,a^?,A^~,a^~,A^.,a^.,A(',a(',A(`,a(`, Unicode,Ấ,ấ,Ầ,ầ,Ẩ,ẩ,Ẫ,ẫ,Ậ,ậ,Ắ,ắ,Ằ,ằ,
Kiam la konvert-funkcio ekkuras, ĝi konvertas ĉiun grupon de signoj en la VIRQ-listo al ĝia responda signo en la Unikoda listo (escepte de la unua, kiu reprezentas la nomon de la listo).
La dosieroj de Konvert-Tabeloj devas estis enkodigitaj je pezkomenca UTF‑16. Same kiel en klavmapaj dosieroj, malplenaj linioj, kaj linioj kiuj komenciĝas per spaco estas malatentataj. (Komentoj komenciĝas per spaco.) Signo-ĉenoj estas apartigita per komoj. Se necesas konverti la komo-karaktron mem, reprezentu ĝin per ĝia Unikoda eskap-kodo, ĉi tiel: \u002c . Fakte, oni povas uzi eskap-kodon por reprezenti iun ajn signon.
Konvert-tabelaj dosieroj devas havi sufikson de 'kon', ekzemple, Armenian.kon, Vietnamese.kon, ktp., kaj devas esti en dosierujo kiu nomiĝas 'simredo', kiun la instal-programo kreas.
La funkcio 'Montru Signaron' estas utila por krei konvert-tabelojn. Vi povas kopii signojn de tiu dialogo kaj interglui ilin en novan konverttabelon.
Programistoj kaj HTML-desegnistoj eble trovos la tabelon 'EscCodes' tre utila. Ĉi tiu konverttabelo ebligas konvertadon inter la sekvaj signokodoj:
Unikodo, kodoj super 127, ekz., Ĝ
Dekliva-u, ekz., \u011c
Dekuma HTML, ekz., Ĝ
Deksesuma HTML, ekz., Ĝ
Ne eblis difini la suprajn konvertojn per simplaj komo-apartigitaj listoj. Ili estas fikse programitaj en la programo mem. La dosiero EscCodes.kon enhavas nur la nomojn de ĉiu speco de eskap-kodo.
La konvert-logiko por supersignitaj Esperantaj literoj estas iom inteligenta. Same kiel eskap-kodaj konvertoj, ne eblis difini ilin per simplaj listoj. Ili ankaŭ estas interne programitaj.
Kiam oni konvertas de la h-metodo, Simredo kontrolas la literuman vortaron por testi ĉu literparoj kun 'h' devas esti konvertitaj aŭ ne. Tiel, frazo kiel 'Shi iris al la flughaveno' estas ĝuste konvertita al: 'Ŝi iris al la flughaveno.'
La listoj en Esperanto.kon estas provizitaj nur por referenco. Simredo fakte ne legas ilin. Se vi volas krei novan konverttabelojn por Esperanto, mi proponas ke vi kopiu Esperanto.kon al Esperanto2.kon, kaj faru ŝanĝojn en la nova dosiero.