Thanks again!<div><br></div><div>I&#39;ll first give you one further question and then comment on your previous answers.</div><div><br></div><div>What would be a good way of including language versions of verse and chapter id&#39;s in the markup? I previously checked here that osisID&#39;s have to use the standard keywords and syntax. But I&#39;d love to be able to supply the Finnish abbreviation of each verse as additional information. That is: when the osisID of a verse is &quot;Gen.3.8&quot;, it would make life much easier for utilizers of this OSIS file if the verse also somehow contained the Finnish standard notation &quot;1. Moos. 3:8&quot;.</div>
<div><br></div><div>The &quot;obvious&quot; way would be to be able to add a new attribute to the verse tag, like:</div><div>&lt;verse osisID=&quot;Gen.3.8&quot;  sID=&quot;Gen.3.8&quot; FI_ID=&quot;1. Moos. 3:8&quot; /&gt;</div>
<div>but that probably isn&#39;t possible, is it? Or can I somehow declare new custom attributes like Chris declared new custom dash entities in his last reply?</div><div><br></div><div><br></div><div>And now for the previous answers. There&#39;s also at least one new question, at the end of the comment to Peter&#39;s answer.</div>
<div><br></div><div><br></div><div><div class="gmail_quote">2012/11/9 Chris Little <span dir="ltr">&lt;<a href="mailto:chrislit@crosswire.org" target="_blank">chrislit@crosswire.org</a>&gt;</span><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<font color="#999999" size="1">
The encoding is usually indicated with a line like:<br>
&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;<br>
<br>
The doctype shouldn&#39;t be necessary since you&#39;ll generally want to indicate the schema itself, but I think you can add a doctype declaration like the following if you want to:<br>
&lt;!DOCTYPE osis&gt;<br>
<br>
This won&#39;t help you to use the w3 validator since that&#39;s just for HTML, XHTML, &amp; other web format (unless there&#39;s a validator I haven&#39;t found).</font></blockquote><div><br></div><div>Silly me... Didn&#39;t someone mention something about HTML experts? ;)</div>
<div>Of course I was trying to use an irrelevant validator and that&#39;s why I was wondering how the doctype declaration (required by that validator) could be made.</div><div><br></div><div>I downloaded the 30-day trial version of oXygen, and that will probably do just the job I need to do. The full version is a bit too expensive for this single project, but if there will be more XML projects in the future, I&#39;ll certainly consider purchasing it.</div>
<div> </div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im"><font color="#999999" size="1">If you don&#39;t want to encode the characters as Unicode, you can use &amp;#x2013; for the en dash and &amp;#x2014; for em dash. I believe you could also declare your own entities in the DTD:</font></div>

<font color="#999999" size="1"><br>
&lt;!DOCTYPE osis [<br>
        &lt;!ENTITY ndash   &quot;&amp;#x2013;&quot;&gt;<br>
        &lt;!ENTITY mdash   &quot;&amp;#x2014;&quot;&gt;<br>
]&gt;</font></blockquote><div><br></div><div>Yes, this worked!</div><div><br></div><div>2012/11/8 Peter von Kaehne <span dir="ltr">&lt;<a href="mailto:refdoc@gmx.net" target="_blank">refdoc@gmx.net</a>&gt;</span><br><div class="gmail_quote">
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><font color="#999999" size="1">&gt; I&#39;d like to be able to use some code or entity instead of an actual dash<br>
</font><div class="im"><font color="#999999" size="1">&gt; characters (– or —), at least in some places, since we have two<br>&gt; different semantics for the dashes and I&#39;d like to keep them separate in the code.<br>
<br></font></div><font color="#999999" size="1">Don&#39;t have an answer for that, but what is the semantic and is there not a better way to code it than the somewhat arbitrary length of a dash character?</font></blockquote>
</div></div><div><br></div><div>That&#39;s a fair question. Indeed it would be nice to find a better way (I&#39;m not using the length to separate these cases but just different notations of the same length), but I haven&#39;t (at least yet) found the better way.</div>
<div><br></div><div>The two different cases are normal em dashes within sentences as punctuation – just like the dashes in this sentence – and then to indicate a range of chapters and verses in some headings. The latter is not in the markup but in the content to be printed (or otherwise shown to the reader). For example: &quot;Second Speech of Moses (4:44–11:32)&quot; just before Deut.4.44. The range has been included in the official translation by the translation committee and thus cannot be omitted.</div>
<div><br></div><div>At least in Finnish we nowadays use the em dash to indicate ranges as well as punctuation. And I&#39;d just like to enable the users of this OSIS file to search for one or the other without getting ambiguous or extra results.</div>
<div><br></div><div>My solution right now is to use Chris&#39;s way of declaring the &amp;mdash; entity myself and use that for punctuation, and use the actual character &quot;–&quot; for ranges. Not very elegant but it does the job.</div>
<div><br></div><div>If you have a semantically better suggestion, I&#39;ll be happy to use it. </div><div><br></div><div>Actually... would something like this work?</div><div><div>&lt;milestone type=&quot;x-punctuation-dash&quot; marker=&quot;mdash&quot; /&gt;</div>
</div><div><div>&lt;milestone type=&quot;x-range-dash&quot; marker=&quot;mdash&quot; /&gt;</div></div><div><br></div><div><br></div><div> 2012/11/9 Chris Little <span dir="ltr">&lt;<a href="mailto:chrislit@crosswire.org" target="_blank">chrislit@crosswire.org</a>&gt;</span></div>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><font size="1" color="#999999">How would you suggest that an exception like this should be coded? Add<br>

some custom type attribute value to indicate special handling in layout?<br>
</font></blockquote>
<font size="1" color="#999999"><br></font></div><font size="1" color="#999999">
This was exactly the case for which &lt;chapter&gt; was made milestonable. You can switch all of your chapter elements to milestones:</font><br></blockquote><div><br></div><div>I was hoping for some other solution. My impression is that these milestone versions of structure indicators weaken the value and usability of markup: I&#39;d guess there are numerous tools that assume &quot;strong&quot; markup where at least the basic structures are marked with proper start and end tags instead of milestones. </div>
<div><br></div><div>But I guess it has to be done like that, and we do already have the other basic structure block (verses) marked with milestones, so they&#39;ll need to understand milestones anyway.</div><div><br></div>
<div>I&#39;ve done the chapters with containter tags now, but it&#39;s quite simple to convert them to milestones.</div><div><br></div><div>Cheers,</div><div><br></div><div>Markku</div><div><br></div></div></div>