<html>
  <head>
    <meta content="text/html; charset=utf-8" http-equiv="Content-Type">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <div class="moz-cite-prefix">On 08/23/2015 08:27 AM, MatÄ›j Cepl
      wrote:<br>
    </div>
    <blockquote cite="mid:slrnmtk43q.qfk.mcepl@mitmanek.ceplovi.cz"
      type="cite">
      <pre wrap="">On 2015-08-23, 09:29 GMT, Peter von Kaehne wrote:
</pre>
      <blockquote type="cite">
        <pre wrap="">Interesting and quite probably useful would be to know if any 
'colonial' translations would benefit from any of these three 
v11ns. I do think Malagassy was difficult to fit, also 
Kahunapule might have translations from French Polynesian 
background. </pre>
      </blockquote>
    </blockquote>
    <br>
    Yes, I have a variety of difficult-to-fit translations. Mostly this
    has convinced me that <b>hard-coded versification is bad</b>. This
    is especially true when you consider intentionally omitted verses
    for textual criticism reasons, which set tends to vary based on who
    is analyzing the text and making the translational decisions.<br>
    <pre wrap="">
</pre>
    <blockquote cite="mid:slrnmtk43q.qfk.mcepl@mitmanek.ceplovi.cz"
      type="cite">
      <pre wrap="">
There were some talks about script which would take a given OSIS 
XML (or something else) and tries to match the text against all 
available versifications looking for the best match. Does such 
animal exist at all? Is it possible?</pre>
    </blockquote>
    <br>
    Yes, this algorithm exists as part of <a href="http://haiola.org">Haiola</a>
    (next release). It picks the least bad versification of those
    available (i.e. hard coded into the version of the Sword Library
    that I'm using). Badness is minimized as follows:<br>
    1. Select the versification(s) with the minimum number of verses in
    books not in the versification. (This narrows things down when
    deuterocanon/apocrypha books are present.)<br>
    2. Of those selected in step 1, select the versification(s) with the
    minimum number of verses in chapters not in the versification. (Some
    versifications lack Malachi 4, for example.)<br>
    3. Of those selected in step 2, select the versification(s) with the
    minimum number of verses that extend beyond the expected number of
    verses in their chapter.<br>
    4. Of those selected in step 3, select a versification with the
    minimum number of verses defined in the versification but not
    present in the current text.<br>
    <br>
    The actual implementation is more efficient than the above would
    seem to indicate, as it does it with one pass through the Bible,
    counting the misfits in each category, then one pass at the end
    finding the least bad fit.<br>
    <br>
    The real issue, here, is how well Sword handles each category of
    badness. It turns out that badness levels 1 and 2 are pretty bad.
    Badness level 3 just results in some verses being combined with the
    previous verse-- maybe several verses combined. Badness level 4
    isn't really that bad, and is, in fact, pretty much unavoidable
    unless you go with per-module versification, because we have lots of
    partial translations, like sometimes just one or two books of the
    Bible. The only reason I retain that test is to select KJV instead
    of KJVA, SynodalP instead of Synodal, and NRSV instead of NRSVA for
    Bibles with just the regular canon of 66 books or a subset of that.<br>
    <br>
    I'm also aware of some other scripts that try to find the best fit,
    but they aren't as general or reliable as the above algorithm.<br>
    <div class="moz-signature">-- <br>
      <meta http-equiv="CONTENT-TYPE" content="text/html; charset=utf-8">
      <title>signature</title>
      <table border="0" cellpadding="7" cellspacing="3">
        <tbody>
          <tr>
          </tr>
          <tr>
            <td><img src="cid:part2.01030805.04090705@eBible.org"></td>
            <td><font size="4" color="#000000">Your partner in
                electronic Bible publishing,<br>
                <img src="cid:part3.01080705.01000106@eBible.org"><br>
              </font></td>
          </tr>
        </tbody>
      </table>
      <table border="0" cellpadding="7" cellspacing="3">
        <tbody>
          <tr>
            <td style="background: rgb(255, 255, 0)"><font
                color="#000000"><b>MICHAEL JOHNSON<br>
                  PO BOX 881143<br>
                  PUKALANI HI 96788-1143</b><br>
                USA</font></td>
            <td style="background: rgb(0, 255, 255)"><font
                color="#000000">
                <a href="http://eBible.org">eBible.org</a><br>
                <a href="http://MLJohnson.org">MLJohnson.org</a><br>
                Mobile: +1 <b>808-333-6921</b><br>
                Skype: kahunapule</font></td>
          </tr>
        </tbody>
      </table>
    </div>
  </body>
</html>