[sword-svn] r240 - trunk/source/data/translit/crosswire

chrislit at crosswire.org chrislit at crosswire.org
Sat Nov 9 16:17:36 MST 2013


Author: chrislit
Date: 2013-11-09 16:17:36 -0700 (Sat, 09 Nov 2013)
New Revision: 240

Modified:
   trunk/source/data/translit/crosswire/Any_Latin1.txt
   trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt
   trunk/source/data/translit/crosswire/Inuktitut_Latin.txt
   trunk/source/data/translit/crosswire/Phoenician_Latin.txt
   trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt
   trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt
Log:
reverted some files that lost information

Modified: trunk/source/data/translit/crosswire/Any_Latin1.txt
===================================================================
--- trunk/source/data/translit/crosswire/Any_Latin1.txt	2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Any_Latin1.txt	2013-11-09 23:17:36 UTC (rev 240)
@@ -1,4 +1,11 @@
-:: NFKC ();
-:: [^ -ÿ] NFD ();
+# Any-Latin-1
+
+# NFKD then NFC; then NFD all non-Latin-1 codepoints
+:: NFKC ();
+:: [^\u0000-\u00FF] NFD ();
+
+# remove non-spacing marks
 [:Mn:]>;
-[^ -ÿ]>'?';
+
+# change characters outside of Latin-1 range to query
+[^\u0000-\u00FF]>'?';

Modified: trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt
===================================================================
--- trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt	2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/CanadianAboriginal_Latin.txt	2013-11-09 23:17:36 UTC (rev 240)
@@ -1,182 +1,191 @@
-šwê <> ᔗ ;
-šwî <> ᔛ ;
-šwi <> ᔙ ;
-šwô <> ᔟ ;
-šwo <> ᔝ ;
-šwâ <> ᔣ ;
-šwa <> ᔡ ;
-pwê <> ᐺ ;
-pwî <> ᐾ ;
+# ***************************************************************************
+# *
+# *  Copyright (C) 2004-2006, International Business Machines
+# *  Corporation; Unicode, Inc.; and others.  All Rights Reserved.
+# *
+# ***************************************************************************
+# File: CanadianAboriginal_Latin.txt
+# Generated from CLDR: Thu Jul 20 14:57:44 PDT 2006
+#
+šwê <> ᔗ ;
+šwî <> ᔛ ;
+šwi <> ᔙ ;
+šwô <> ᔟ ;
+šwo <> ᔝ ;
+šwâ <> ᔣ ;
+šwa <> ᔡ ;
+pwê <> ᐺ ;
+pwî <> ᐾ ;
 pwi <> ᐼ ;
-pwô <> ᑂ ;
+pwô <> ᑂ ;
 pwo <> ᑀ ;
-pwâ <> ᑆ ;
+pwâ <> ᑆ ;
 pwa <> ᑄ ;
-twê <> ᑗ ;
-twî <> ᑛ ;
+twê <> ᑗ ;
+twî <> ᑛ ;
 twi <> ᑙ ;
-twô <> ᑟ ;
+twô <> ᑟ ;
 two <> ᑝ ;
-twâ <> ᑣ ;
+twâ <> ᑣ ;
 twa <> ᑡ ;
-kwê <> ᑴ ;
-kwî <> ᑸ ;
+kwê <> ᑴ ;
+kwî <> ᑸ ;
 kwi <> ᑶ ;
-kwô <> ᑼ ;
+kwô <> ᑼ ;
 kwo <> ᑺ ;
-kwâ <> ᒀ ;
+kwâ <> ᒀ ;
 kwa <> ᑾ ;
-cwê <> ᒒ ;
-cwî <> ᒖ ;
+cwê <> ᒒ ;
+cwî <> ᒖ ;
 cwi <> ᒔ ;
-cwô <> ᒚ ;
+cwô <> ᒚ ;
 cwo <> ᒘ ;
-cwâ <> ᒞ ;
+cwâ <> ᒞ ;
 cwa <> ᒜ ;
-mwê <> ᒬ ;
-mwî <> ᒰ ;
+mwê <> ᒬ ;
+mwî <> ᒰ ;
 mwi <> ᒮ ;
-mwô <> ᒴ ;
+mwô <> ᒴ ;
 mwo <> ᒲ ;
-mwâ <> ᒸ ;
+mwâ <> ᒸ ;
 mwa <> ᒶ ;
-nwê <> ᓉ ;
-nwâ <> ᓍ ;
+nwê <> ᓉ ;
+nwâ <> ᓍ ;
 nwa <> ᓋ ;
-lwê <> ᓜ ;
-lwî <> ᓠ ;
+lwê <> ᓜ ;
+lwî <> ᓠ ;
 lwi <> ᓞ ;
-lwô <> ᓤ ;
+lwô <> ᓤ ;
 lwo <> ᓢ ;
-lwâ <> ᓨ ;
+lwâ <> ᓨ ;
 lwa <> ᓦ ;
-swê <> ᓶ ;
-swî <> ᓺ ;
+swê <> ᓶ ;
+swî <> ᓺ ;
 swi <> ᓸ ;
-swô <> ᓾ ;
+swô <> ᓾ ;
 swo <> ᓼ ;
-swâ <> ᔂ ;
+swâ <> ᔂ ;
 swa <> ᔀ ;
-ywê <> ᔯ ;
-ywî <> ᔳ ;
+ywê <> ᔯ ;
+ywî <> ᔳ ;
 ywi <> ᔱ ;
-ywô <> ᔷ ;
+ywô <> ᔷ ;
 ywo <> ᔵ ;
-ywâ <> ᔻ ;
+ywâ <> ᔻ ;
 ywa <> ᔹ ;
-rwâ <> ᕎ ;
+rwâ <> ᕎ ;
 hk <> ᕽ ;
-thê <> ᖧ ;
-thî <> ᖩ ;
+thê <> ᖧ ;
+thî <> ᖩ ;
 thi <> ᖨ ;
-thô <> ᖫ ;
+thô <> ᖫ ;
 tho <> ᖪ ;
-thâ <> ᖭ ;
+thâ <> ᖭ ;
 tha <> ᖬ ;
 th <> ᖮ ;
-šê <> ᔐ ;
-šî <> ᔑ ;
-ši <> ᔒ ;
-šô <> ᔓ ;
-šo <> ᔔ ;
-šâ <> ᔕ ;
-ša <> ᔖ ;
-š <> ᔥ ;
-wê <> ᐌ ;
-wî <> ᐐ ;
+šê <> ᔐ ;
+šî <> ᔑ ;
+ši <> ᔒ ;
+šô <> ᔓ ;
+šo <> ᔔ ;
+šâ <> ᔕ ;
+ša <> ᔖ ;
+š <> ᔥ ;
+wê <> ᐌ ;
+wî <> ᐐ ;
 wi <> ᐎ ;
-wô <> ᐔ ;
+wô <> ᐔ ;
 wo <> ᐒ ;
-wâ <> ᐙ ;
+wâ <> ᐙ ;
 wa <> ᐗ ;
 w <> ᐤ ;
-pê <> ᐯ ;
-pî <> ᐲ ;
+pê <> ᐯ ;
+pî <> ᐲ ;
 pi <> ᐱ ;
-pô <> ᐴ ;
+pô <> ᐴ ;
 po <> ᐳ ;
-pâ <> ᐹ ;
+pâ <> ᐹ ;
 pa <> ᐸ ;
 p <> ᑉ ;
-tê <> ᑌ ;
-tî <> ᑏ ;
+tê <> ᑌ ;
+tî <> ᑏ ;
 ti <> ᑎ ;
-tô <> ᑑ ;
+tô <> ᑑ ;
 to <> ᑐ ;
-tâ <> ᑖ ;
+tâ <> ᑖ ;
 ta <> ᑕ ;
 t <> ᑦ ;
-kê <> ᑫ ;
-kî <> ᑮ ;
+kê <> ᑫ ;
+kî <> ᑮ ;
 ki <> ᑭ ;
-kô <> ᑰ ;
+kô <> ᑰ ;
 ko <> ᑯ ;
-kâ <> ᑳ ;
+kâ <> ᑳ ;
 ka <> ᑲ ;
 kw <> ᒄ ;
 k <> ᒃ ;
-cê <> ᒉ ;
-cî <> ᒌ ;
+cê <> ᒉ ;
+cî <> ᒌ ;
 ci <> ᒋ ;
-cô <> ᒎ ;
+cô <> ᒎ ;
 co <> ᒍ ;
-câ <> ᒑ ;
+câ <> ᒑ ;
 ca <> ᒐ ;
 c <> ᒡ ;
-mê <> ᒣ ;
-mî <> ᒦ ;
+mê <> ᒣ ;
+mî <> ᒦ ;
 mi <> ᒥ ;
-mô <> ᒨ ;
+mô <> ᒨ ;
 mo <> ᒧ ;
-mâ <> ᒫ ;
+mâ <> ᒫ ;
 ma <> ᒪ ;
 m <> ᒻ ;
-nê <> ᓀ ;
-nî <> ᓃ ;
+nê <> ᓀ ;
+nî <> ᓃ ;
 ni <> ᓂ ;
-nô <> ᓅ ;
+nô <> ᓅ ;
 no <> ᓄ ;
-nâ <> ᓈ ;
+nâ <> ᓈ ;
 na <> ᓇ ;
 n <> ᓐ ;
-lê <> ᓓ ;
-lî <> ᓖ ;
+lê <> ᓓ ;
+lî <> ᓖ ;
 li <> ᓕ ;
-lô <> ᓘ ;
+lô <> ᓘ ;
 lo <> ᓗ ;
-lâ <> ᓛ ;
+lâ <> ᓛ ;
 la <> ᓚ ;
 l <> ᓪ ;
-sê <> ᓭ ;
-sî <> ᓰ ;
+sê <> ᓭ ;
+sî <> ᓰ ;
 si <> ᓯ ;
-sô <> ᓲ ;
+sô <> ᓲ ;
 so <> ᓱ ;
-sâ <> ᓵ ;
+sâ <> ᓵ ;
 sa <> ᓴ ;
 s <> ᔅ ;
-yê <> ᔦ ;
-yî <> ᔩ ;
+yê <> ᔦ ;
+yî <> ᔩ ;
 yi <> ᔨ ;
-yô <> ᔫ ;
+yô <> ᔫ ;
 yo <> ᔪ ;
-yâ <> ᔮ ;
+yâ <> ᔮ ;
 ya <> ᔭ ;
 y <> ᔾ ;
-rê <> ᕂ ;
-rî <> ᕇ ;
+rê <> ᕂ ;
+rî <> ᕇ ;
 ri <> ᕆ ;
-rô <> ᕉ ;
+rô <> ᕉ ;
 ro <> ᕈ ;
-râ <> ᕌ ;
+râ <> ᕌ ;
 ra <> ᕋ ;
 r <> ᕐ ;
-hê <> ᐁ ;
-hî <> ᐄ ;
+hê <> ᐁ ;
+hî <> ᐄ ;
 hi <> ᐃ ;
-hô <> ᐆ ;
+hô <> ᐆ ;
 ho <> ᐅ ;
-hâ <> ᐋ ;
+hâ <> ᐋ ;
 ha <> ᐊ ;
 h <> ᐦ ;
 '.' <> ᙮ ;

Modified: trunk/source/data/translit/crosswire/Inuktitut_Latin.txt
===================================================================
--- trunk/source/data/translit/crosswire/Inuktitut_Latin.txt	2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Inuktitut_Latin.txt	2013-11-09 23:17:36 UTC (rev 240)
@@ -1,4 +1,8 @@
 #--------------------------------------------------------------------
+# Copyright 2012, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved.  Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#--------------------------------------------------------------------
 # Based on the standardized Inuit Cultural Institute mapping of
 # qaniujaaqpait to qaliujaaqpait via Daniels & Bright p.607,
 # supplemented with mappings from (but not to) Unicode characters
@@ -6,6 +10,7 @@
 #--------------------------------------------------------------------
 # Latin-Inuktitut/ICI
 :: [A-Z] Lower();
+
 # completeness mappings
 b > |p ;
 d > |t ;
@@ -17,6 +22,7 @@
 x > |ks ;
 y > |j ;
 z > |s ;
+
 # nng- series
 nngii < ᙲ ;
 nngi < ᙱ ;
@@ -25,6 +31,7 @@
 nngaa < ᙶ ;
 nnga < ᙵ ;
 nng < ᖖ ;
+
 # ng- series
 ngaai < ᖎ ;
 ngai < ᙰ ;
@@ -35,6 +42,7 @@
 ngaa <> ᖔ ;
 nga <> ᖓ ;
 ng <> ᖕ ;
+
 # p- series
 paai < ᐰ ;
 pai < ᐯ ;
@@ -45,6 +53,7 @@
 paa <> ᐹ ;
 pa <> ᐸ ;
 p <> ᑉ ;
+
 # t- series
 taai < ᑍ ;
 tai < ᑌ ;
@@ -55,6 +64,7 @@
 taa <> ᑖ ;
 ta <> ᑕ ;
 t <> ᑦ ;
+
 # k- series
 kaai < ᑬ ;
 kai < ᑫ ;
@@ -65,6 +75,7 @@
 kaa <> ᑳ ;
 ka <> ᑲ ;
 k <> ᒃ ;
+
 # g- series
 gaai < ᒊ ;
 gai < ᒉ ;
@@ -75,6 +86,7 @@
 gaa <> ᒑ ;
 ga <> ᒐ ;
 g <> ᒡ ;
+
 # m- series
 maai < ᒤ ;
 mai < ᒣ ;
@@ -85,6 +97,7 @@
 maa <> ᒫ ;
 ma <> ᒪ ;
 m <> ᒻ ;
+
 # n- series
 naai < ᓁ ;
 nai < ᓀ ;
@@ -95,6 +108,7 @@
 naa <> ᓈ ;
 na <> ᓇ ;
 n <> ᓐ ;
+
 # s- series
 saai < ᓮ ;
 sai < ᓭ ;
@@ -105,6 +119,7 @@
 saa <> ᓵ ;
 sa <> ᓴ ;
 s <> ᔅ ;
+
 # l- series
 laai < ᓔ ;
 lai < ᓓ ;
@@ -115,6 +130,7 @@
 laa <> ᓛ ;
 la <> ᓚ ;
 l <> ᓪ ;
+
 # j- series
 jaai < ᔧ ;
 jai < ᔦ ;
@@ -125,6 +141,7 @@
 jaa <> ᔮ ;
 ja <> ᔭ ;
 j <> ᔾ ;
+
 # v- series
 vaai < ᕔ ;
 vai < ᕓ ;
@@ -135,6 +152,7 @@
 vaa <> ᕚ ;
 va <> ᕙ ;
 v <> ᕝ ;
+
 # r- series
 raai < ᕅ ;
 rai < ᕂ ;
@@ -145,6 +163,7 @@
 raa <> ᕌ ;
 ra <> ᕋ ;
 r <> ᕐ ;
+
 # q- series
 qaai < ᕾ ;
 qai < ᙯ ;
@@ -155,6 +174,7 @@
 qaa <> ᖄ ;
 qa <> ᖃ ;
 q <> ᖅ ;
+
 # ł- series
 łii <> ᖡ ;
 łi <> ᖠ ;
@@ -163,6 +183,7 @@
 łaa <> ᖥ ;
 ła <> ᖤ ;
 ł <> ᖦ ;
+
 # &- (alternate ł-) series
 '&ii' > ᖡ ;
 '&i' > ᖠ ;
@@ -171,6 +192,7 @@
 '&aa' > ᖥ ;
 '&a' > ᖤ ;
 '&' > ᖦ ;
+
 # Nunavik h- series
 hai < ᕴ ;
 hii < ᕶ ;
@@ -180,11 +202,14 @@
 haa < ᕺ ;
 ha < ᕹ ;
 h < ᕻ ;
+
 # Nunavut h
 h < ᕼ ;
 h < H;
+
 # Aivilik b
 b < ᖯ;
+
 # vocalic series
 aai < ᐂ ;
 ai < ᐁ ;
@@ -196,6 +221,7 @@
 a <> ᐊ ;
 h <> ᐦ ;
 \' <> ᐟ ;
-# punctuation
+
+# punctuation 
 '-' < ᐀ ;
 '.' < ᙮ ;

Modified: trunk/source/data/translit/crosswire/Phoenician_Latin.txt
===================================================================
--- trunk/source/data/translit/crosswire/Phoenician_Latin.txt	2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Phoenician_Latin.txt	2013-11-09 23:17:36 UTC (rev 240)
@@ -1,11 +1,18 @@
 #---------------------------------------------------------------------
+# Copyright 2009, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved.  Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#---------------------------------------------------------------------
 # Phoenician-Latin
 :: NFD (NFC);
 $letter=[[:L:][\)\+\(\`\:\&\$\#]];
+
 𐤇<>ḥ;
 𐤈<>ṭ;
+
 𐤑<>ṣ;
 𐤔<š;
+
 𐤀<>ʾ;
 𐤁<>b;
 𐤂<>g;

Modified: trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt
===================================================================
--- trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt	2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Phoenician_Latin_Beta.txt	2013-11-09 23:17:36 UTC (rev 240)
@@ -1,4 +1,8 @@
 #---------------------------------------------------------------------
+# Copyright 2009, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved.  Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#---------------------------------------------------------------------
 # Based on Beta code for CCAT/Michigan-Claremont:
 # http://ccat.sas.upenn.edu/gopher/text/religion/biblical/0-betacode.txt
 #---------------------------------------------------------------------
@@ -35,14 +39,14 @@
 𐤗<>10;
 𐤖<>1;
 𐤟<>' ';
->':';
->I;
->'\"';
->E;
->A;
->F;
->O;
->U;
->[0-9];
+<':';
+<I;
+<'\"';
+<E;
+<A;
+<F;
+<O;
+<U;
+<[0-9];
 :: ([$letter] upper);
 :: NFC (NFD);

Modified: trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt
===================================================================
--- trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt	2013-11-09 06:09:54 UTC (rev 239)
+++ trunk/source/data/translit/crosswire/Thaana_Latin_ALALC.txt	2013-11-09 23:17:36 UTC (rev 240)
@@ -1,11 +1,16 @@
 #--------------------------------------------------------------------
+# Copyright 2001-2009, CrossWire Bible Society (www.crosswire.org)
+# All rights reserved.  Usage permitted according to the MIT/X11
+# License: http://www.opensource.org/licenses/mit-license.php
+#--------------------------------------------------------------------
 # Based ALA-LC Romanization from
 # http://lcweb.loc.gov/catdir/cpso/romanization/divehi.pdf
 #--------------------------------------------------------------------
 # This transform definitely needs more attention
 # Thaana-Latin/ALALC
 :: NFD (NFC);
-$consonants = [ހ-ޥ];
+$consonants = [\u0780-\u07A5];
+
 ށް}[:^L:]>ḫ;
 ށް}[$consonants]>ḫ;
 ތްތ<>t̤t;




More information about the sword-cvs mailing list