<div dir="ltr">Hello<div><br></div><div>I&#39;d like to add case insensitivity and ignoring of punctuation as part of our BookData Diff-ing tool. I&#39;ve had a brief look through it but it seems to be quite complex, and there does not seem to be an easy place to insert such a check.</div>
<div><br></div><div>The diffs seem to be done at various points during the system and there does not seem to be an obvious place to add a flag for ignoring punctuation/casing of words. This often results in very trivial/minor changes that are not changes in meaning.</div>
<div><br></div><div>I&#39;m not sure what the best approach is, but found that this particular diff tool: <a href="https://code.google.com/p/java-diff-utils">https://code.google.com/p/java-diff-utils</a> allows you to specify an Equalizer. </div>
<div><br></div><div>I had previously added an &#39;unaccented&#39; to ignore accents. This works fine, but results in the displayed text having no accents. The ideal tool would be something that compared texts in both XML fragments and marked up the XML rather than generating new elements.</div>
<div><br></div><div>So I was wondering if it would be worth exploring other diff-ing engines as well?</div><div>Chris</div><div><br></div></div>