Sorting is most likely done by Unicode order.&nbsp; (The Unicode character database, UnicodeData.txt,&nbsp;is available from <A href="http://www.unicode.org/Public/UNIDATA/">http://www.unicode.org/Public/UNIDATA/</A>)&nbsp; To even alphabetize polytonic Greek, I had to reduce each character to its lower case, unaccented form, sort on those first, then on the actual word.<br>
<br>
Peace,<br>
<br>
David<br>

<BLOCKQUOTE style="PADDING-LEFT: 3px; BORDER-LEFT: blue 2px solid"><PRE><TT>
I was a bit surprised by the collation of some of the words. Any word 
with an accent is collated "out of order". For example Ā is sorted after 
Y (there are no words beginning with Z) in the Anglo-Saxon Dictionary.</PRE></TT></BLOCKQUOTE><br>
<br>
<br>
-----Original Message-----<br>
From: DM Smith &lt;dmsmith555@yahoo.com&gt;<br>
To: SWORD Developers' Collaboration Forum &lt;sword-devel@crosswire.org&gt;<br>
Sent: Tue, 18 Sep 2007 11:48 am<br>
Subject: Re: [sword-devel] demo TEI modules<br>
<br>


<div id=AOLMsgPart_0_a6ff9cec-719e-48a1-87bf-b779a23ca4a5 style="FONT-SIZE: 12px; MARGIN: 0px; COLOR: #000; FONT-FAMILY: Tahoma, Verdana, Arial, Sans-Serif; BACKGROUND-COLOR: #fff"><PRE style="FONT-SIZE: 9pt"><TT>Chris,
Not that I would find any personal use in the dictionaries, I think they 
are great. Hopefully, these will set the stage for osis to model this 
into it's schema.

I've got some work to do on JSword to get them to display properly in 
BibleDesktop. Currently it is using a "plain text" filter. And the 
performance is terrible, because of how JSword slurps the entire module 
to display the entire list of words. I didn't see any TEI to HTML 
filters in Sword, so I guess there is some work to do there too.

I was a bit surprised by the collation of some of the words. Any word 
with an accent is collated "out of order". For example Ā is sorted after 
Y (there are no words beginning with Z) in the Anglo-Saxon Dictionary.

It appears that it is comparing the bytes and not the characters (let 
alone the code points of the characters).

Also, TEI entry and entryFree and superEntry tags define the attribute 
"key" to be used to control the collation of the words. Can this be 
leveraged?

Related, when doing a lookup should we allow lookup without the diacritics?

In Him,
DM

Chris Little wrote:
&gt; I posted a set of demo lexicons using TEI markup internally for people 
&gt; to play with and test TEI-filters on:
&gt;
&gt; BosworthToller:    An Anglo-Saxon Dictionary       (Old English-English)
&gt; CleasbyVigfusson:An Icelandic-English Dictionary (Old Icelandic-English)
&gt; LewisShort:    A Latin Dictionary              (Latin-English)
&gt;
&gt; The last might be of use to folks trying to read the vulgate, but the 
&gt; first two don't have much use in Bible software. But I use them 
&gt; personally and thought I might as well package them up to share as demos.
&gt;
&gt; They are buggy. I know that.
&gt;
&gt; I'll see about posting a Middle Liddell soon, but it's been a bit more 
&gt; of a challenge because of character encoding.
&gt;
&gt; --Chris
&gt;
&gt; _______________________________________________
&gt; sword-devel mailing list: <A href="mailto:sword-devel@crosswire.org">sword-devel@crosswire.org</A>
&gt; <A href="http://www.crosswire.org/mailman/listinfo/sword-devel" target=_blank>http://www.crosswire.org/mailman/listinfo/sword-devel</A>
&gt; Instructions to unsubscribe/change your settings at above page
&gt;
&gt;   


_______________________________________________
sword-devel mailing list: <A href="mailto:sword-devel@crosswire.org">sword-devel@crosswire.org</A>
<A href="http://www.crosswire.org/mailman/listinfo/sword-devel" target=_blank>http://www.crosswire.org/mailman/listinfo/sword-devel</A>
Instructions to unsubscribe/change your settings at above page
</TT></PRE></div>
<!-- end of AOLMsgPart_0_a6ff9cec-719e-48a1-87bf-b779a23ca4a5 --><div class="AOLPromoFooter">
<hr style="margin-top:10px;" />
Email and AIM finally together. You've gotta check out free <a href="http://o.aolcdn.com/cdn.webmail.aol.com/mailtour/aol/en-us/index.htm?ncid=AOLAOF00020000000970" target="_blank">AOL Mail</a>!<br/>
</div>