<div>Eliminating orphaned verse tags can be done by tweaking the OSIS input file.&nbsp;</div><div><br></div><div>The workaround involves moving some verse eID milestones such that there are no other OSIS elements before the next verse sID milestone.&nbsp;</div><div><br></div><div>Except, of course, at a chapter boundary.&nbsp;</div><div><br></div><div>The fact that I enquired about XML whitespace in a separate email should not deflect anyone from thinking that this issue is anything to do with whitespace.&nbsp;</div><div><br></div><div>Whether this is partly due to anything in our software or wholly due to the conversion from USFM to OSIS is now the main focus, or should be.&nbsp;</div><div><br></div><div>I added an issue in adyeths/u2o just as he requested.</div><div><br></div><div>Best regards,</div><div><br></div><div>David</div><div><br></div><div id="protonmail_mobile_signature_block">Sent from ProtonMail Mobile</div> <div><br></div><div><br></div>On Sun, Feb 10, 2019 at 03:43, DM Smith &lt;<a href="mailto:dmsmith@crosswire.org" class="">dmsmith@crosswire.org</a>&gt; wrote:<blockquote class="protonmail_quote" type="cite">   osis2mod does not understand the CDATA construct&nbsp;&lt;![CDATA[some stuff]]&gt; nor does the SWORD parser. The OSIS schema (xsd) defines text as xs:string, not xs:normalizeString. So spaces, tabs and newlines are not to be collapsed or replaced. I think CDATA and #PCDATA is an SGML construct, not an XML one.<div class=""><br class=""></div><div class="">However, osis2mod does convert newlines to spaces and collapses consecutive strings of spaces to a single space. The only newline in the module is at the end of the each stored entry in the module’s data file.</div><div class=""><br class=""></div><div class="">DM<br class=""><div><br class=""><blockquote type="cite" class=""><div class="">On Feb 9, 2019, at 5:45 PM, Greg Hellings &lt;<a href="mailto:greg.hellings@gmail.com" class="">greg.hellings@gmail.com</a>&gt; wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class=""><div class="">Are we sure that this is a problem with the OSIS and not just an issue with the render filters? All consecutive strings of whitespace characters in XML cdata segments is supposed to be collapsed to a single space character upon processing. If we've got newlines showing up in places that a newline isn't indicated from markup, then it sounds like the issue is in the render filter, not the OSIS. But I'd have to know what OSIS construct you're referring to.</div><div class=""><br class=""></div><div class="">--Greg<br class=""></div></div><br class=""><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Feb 9, 2019 at 6:21 AM David Haslam &lt;<a href="mailto:dfhdfh@protonmail.com" class="">dfhdfh@protonmail.com</a>&gt; wrote:<br class=""></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class=""><b class="">Issue added</b>:<br class=""></div><div class=""><br class=""></div><div class=""><a href="https://github.com/adyeths/u2o/issues/82" target="_blank" class="">https://github.com/adyeths/u2o/issues/82</a><br class=""></div><div class=""><br class=""></div><div class="gmail-m_3969833031978012161protonmail_signature_block"><div class="gmail-m_3969833031978012161protonmail_signature_block-user"><div class="">Best regards,<br class=""></div><div class=""><br class=""></div><div class="">David<br class=""></div></div><div class=""><br class=""></div><div class="gmail-m_3969833031978012161protonmail_signature_block-proton">Sent with <a href="https://protonmail.com/" target="_blank" class="">ProtonMail</a> Secure Email.<br class=""></div></div><div class=""><br class=""></div><div class="">‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐<br class=""></div><div class=""> On Saturday, 9 February 2019 11:17, David Haslam &lt;<a href="mailto:dfhdfh@protonmail.com" target="_blank" class="">dfhdfh@protonmail.com</a>&gt; wrote:<br class=""></div><div class=""> <br class=""></div><blockquote type="cite" class="gmail-m_3969833031978012161protonmail_quote"><div class="">Thanks Ryan,<br class=""></div><div class=""><br class=""></div><div class="">I will add an issue.&nbsp;<br class=""></div><div class=""><br class=""></div><div class="">Aside: Are we all certain that this isn’t due to a bug in the SWORD API ?<br class=""></div><div class=""><br class=""></div><div class="">David<br class=""></div><div class=""><br class=""></div><div id="gmail-m_3969833031978012161protonmail_mobile_signature_block" class="">Sent from ProtonMail Mobile<br class=""></div><div class=""><br class=""></div><div class=""><br class=""></div><div class="">On Fri, Feb 8, 2019 at 22:36, Ryan V &lt;<a href="mailto:adyeths@gmail.com" target="_blank" class="">adyeths@gmail.com</a>&gt; wrote:<br class=""></div><blockquote class="gmail-m_3969833031978012161protonmail_quote" type="cite"><div dir="auto" class=""><div class="">A special utility isn't needed. This is a bug in the usfm to osis converter being used.<br class=""></div><div dir="auto" class=""><br class=""></div><div dir="auto" class="">If this happens with the output of u2o.py please submit a bug report so i can fix my converter.<br class=""></div></div><div class=""><br class=""></div><div class="gmail_quote"><div dir="ltr" class="">On Fri, Feb 8, 2019, 4:48 PM David Haslam &lt;<a href="mailto:dfhdfh@protonmail.com" target="_blank" class="">dfhdfh@protonmail.com</a> wrote:<br class=""></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="">Friends,<br class=""></div><div class=""> <br class=""></div><div class=""> How to ensure that modules made from OSIS do not display orphaned verse tags (verse number followed by a new line before the paragraph starts) has been known and understood for years.<br class=""></div><div class=""> <br class=""></div><div class=""> Why is there not a simple Sword utility that fixes OSIS files for this one issue?<br class=""></div><div class=""> <br class=""></div><div class=""> We still see far too many module releases in which a Bible with paragraphed text is splattered with such orphaned verse tags.<br class=""></div><div class=""> <br class=""></div><div class=""> <br class=""></div><div class=""> Best regards,<br class=""></div><div class=""> <br class=""></div><div class=""> David<br class=""></div><div class=""> <br class=""></div><div class=""> Sent with ProtonMail Secure Email.<br class=""></div><div class=""> <br class=""></div><div class=""> <br class=""></div><div class=""> <br class=""></div><div class=""> _______________________________________________<br class=""></div><div class=""> sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org" rel="noreferrer" target="_blank" class="">sword-devel@crosswire.org</a><br class=""></div><div class=""> <a href="http://www.crosswire.org/mailman/listinfo/sword-devel" rel="noreferrer noreferrer" target="_blank" class="">http://www.crosswire.org/mailman/listinfo/sword-devel</a><br class=""></div><div class=""> Instructions to unsubscribe/change your settings at above page<br class=""></div></blockquote></div></blockquote><div class=""><br class=""></div><div class=""><br class=""></div></blockquote><div class=""><br class=""></div>_______________________________________________<br class=""> sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org" target="_blank" class="">sword-devel@crosswire.org</a><br class=""> <a href="http://www.crosswire.org/mailman/listinfo/sword-devel" rel="noreferrer" target="_blank" class="">http://www.crosswire.org/mailman/listinfo/sword-devel</a><br class=""> Instructions to unsubscribe/change your settings at above page</blockquote></div> _______________________________________________<br class="">sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org" class="">sword-devel@crosswire.org</a><br class=""><a href="http://www.crosswire.org/mailman/listinfo/sword-devel" class="">http://www.crosswire.org/mailman/listinfo/sword-devel</a><br class="">Instructions to unsubscribe/change your settings at above page</div></blockquote></div><br class=""></div></blockquote><div><br></div><div><br></div>