<div dir="ltr">Hi DM/Chris<div><br></div><div>The standard is defined in BCP47 which only supports a &#39;-&#39;. (<a href="http://tools.ietf.org/html/bcp47">http://tools.ietf.org/html/bcp47</a>)</div><div><br></div><div style>
as documented by JAVA here: <a href="http://docs.oracle.com/javase/7/docs/api/java/util/Locale.html#def_variant">http://docs.oracle.com/javase/7/docs/api/java/util/Locale.html#def_variant</a>. Java seems to support both a dash and an underscore.</div>
<div style><br></div><div style>DM, we should ideally be using the Java functionality which supports both, rather than implementing our own decoding scheme. Not sure what we do/don&#39;t do here.</div><div style>Chris</div>
<div style><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 10 February 2013 20:09, DM Smith <span dir="ltr">&lt;<a href="mailto:dmsmith@crosswire.org" target="_blank">dmsmith@crosswire.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Chris,<br>
We&#39;ve got this in JSword (not sure it works) for  a while now for the next release. We used the codes as you&#39;ve given here. But in the conf file you have ur_Deva. We&#39;re not expecting an _ but a -. We can change the code. Please advise.<br>

<br>
In Him,<br>
        DM<br>
<div class="HOEnZb"><div class="h5"><br>
On Feb 10, 2013, at 5:56 AM, Chris Little &lt;<a href="mailto:chrislit@crosswire.org">chrislit@crosswire.org</a>&gt; wrote:<br>
<br>
&gt; Just a quick heads up:<br>
&gt;<br>
&gt; In general, locale codes (the Lang= field of .confs) can have subtags that indicate region, script, etc. Ideally these should be dealt with in some fashion by front ends since they identify important distinctions (in the eyes of the module maker or publisher at least).<br>

&gt;<br>
&gt; When unknown subtags are encountered, it&#39;s probably best to recursively fall back to the tag minus its right-most subtag. For example, if &#39;en-Latn-US&#39; is unknown, fall back to &#39;en-Latn&#39;. If that is unknown, fall back to &#39;en&#39;. (Hopefully nearly all language subtags are known.)<br>

&gt;<br>
&gt; We should handle this in the library, but currently don&#39;t. :(<br>
&gt;<br>
&gt;<br>
&gt; As a specific case in point:<br>
&gt; We now have two Urdu translations. They&#39;re the same translation and differ in their script (one is Arabic, the other Devanagari). Their language codes (as of the 1.2.1 release just made, which corrected the code for the Devanagari version) are: ur (Urdu in Arabic script--the usual script for Urdu) and ur-Deva (Urdu in Devanagari script).<br>

&gt;<br>
&gt; Possible behaviors are to categorize the ur-Deva module as belonging to an unknown language (bad), to fall back and categorize it as simply Urdu (better, but certainly confusing if the language name is written in Arabic and the module is itself written in Devanagari), or to categorize it separately as Urdu written in Devanagari (best).<br>

&gt;<br>
&gt; For implementers who localize the language name, Urdu written in Arabic is written &quot;اردو&quot;. Urdu written in Devanagari is written &quot;उर्दू&quot;.<br>
&gt;<br>
&gt; --Chris<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org">sword-devel@crosswire.org</a><br>
&gt; <a href="http://www.crosswire.org/mailman/listinfo/sword-devel" target="_blank">http://www.crosswire.org/mailman/listinfo/sword-devel</a><br>
&gt; Instructions to unsubscribe/change your settings at above page<br>
<br>
<br>
_______________________________________________<br>
sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org">sword-devel@crosswire.org</a><br>
<a href="http://www.crosswire.org/mailman/listinfo/sword-devel" target="_blank">http://www.crosswire.org/mailman/listinfo/sword-devel</a><br>
Instructions to unsubscribe/change your settings at above page</div></div></blockquote></div><br></div>