Hi David, <br><br>I think Michael has made a point which you ignored in your response - Indic and other scripts. <br><br>The correct character in most of these places though is likely a zero width non joiner space character, at least it would be in Arabic derived scripts. <br><br>I think the correct solution is that if we as module makers find such characters like soft hyphens abused to act as ZWNJ replacement we need to go upstream and complain. I admit I have not paid much attention to that problem, but will do so from now on. <br><br>Non standard character use is a problem in many places as we have found (Cyrillic/Latin a etc)<br><br>Peter<br><br><br><br><br><br>Sent from my mobile. Please forgive shortness, typos and weird autocorrects.<div class="quote" style="line-height: 1.5"><br><br>-------- Original Message --------<br>Subject: Re: [sword-devel] Soft hyphens<br>From: David Haslam <dfhmch@googlemail.com><br>To: sword-devel@crosswire.org<br>CC: <br><br><br type="attribution"><blockquote class="quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Having soft hyphens to improve readability on hand held small devices is fine<br>in theory, but it's not in practice. <br><br>The more I've thought about soft hyphens, the more I've understood that<br>their use was a kludge for a particular typesetting task at one time for<br>publishing a printed Bible from Quark Xpress.<br><br>They have no significance outside that context.<br><br>That you can have the same word occur with and without a soft hyphen<br>illustrates the point. They have no semantic significance.<br><br>Were the same Bible needed to be typeset with a different page size or<br>layout, then the whole task would need to be done again differently in the<br>desktop publishing suite.<br><br>I therefore have come to the view that all soft hyphens should be removed<br>from the USFM files.<br><br>If in future the USFM files are repurposed by others to make a printed Bible<br>or PDF edition, then it becomes the responsibility of the licensed publisher<br>to ensure that the layout doesn't break Lingala words in an unnatural way at<br>the end of a line.<br><br>Likewise, to be of use in a module, the soft hyphens would need to be<br>applied consistently to every word capable of being wordwrapped, not<br>haphazardly to only those words that merely happened to be at the end of a<br>line of text in the page layout for the original printed edition.<br><br>[That's responding to Michael's point.]<br><br>NB. The matter is also being pursued in context in Fr Cyrille's LinVB repo<br>on GitLab.<br><br>Does anyone know of any other SWORD module that contains soft hyphens?<br><br>Or is this the first time and context where this topic has come up?<br><br>Obtaining soft hyphen consistency is achievable in two ways.<br>1. Low effort - just remove 'em all.<br>2. Labour intensive - generate a full words list, analyse for soft hyphens,<br>and then apply soft hyphens to those matching words still lacking them.<br><br>Best regards,<br><br>David<br><br><br><br><br><br>--<br>Sent from: http://sword-dev.350566.n4.nabble.com/<br><br>_______________________________________________<br>sword-devel mailing list: sword-devel@crosswire.org<br>http://www.crosswire.org/mailman/listinfo/sword-devel<br>Instructions to unsubscribe/change your settings at above page<br></blockquote></div>