Как удалить все разрывы строк?

У меня есть что-то вроде этого:

<node TEXT="   txt A   "/>
<node TEXT="

       txt X

"/>
<node>
   <html>
      <p>
        txt Y
      </p>
   </html>
</node>
<node TEXT="txt B"/>

и я хочу использовать XSLT, чтобы получить это:

txt A
txt X
txt Y
txt B

Я хочу удалить все бесполезные пробелы и разрывы @TEXT и CDATA. Единственный XML-вход, который дает структуру для вывода, это <node> -tags.

Ответы

Ответ 1

Следующее преобразование:

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output method="text"/>
<xsl:template match="*">
  <xsl:apply-templates select="@TEXT | node()"/>
</xsl:template>

<xsl:template match="node/@TEXT | text()">
  <xsl:if test="normalize-space(.)">
    <xsl:value-of select=
     "concat(normalize-space(.), '&#xA;')"/>
  </xsl:if>

  <xsl:apply-templates />
</xsl:template>
</xsl:stylesheet>

при применении к этому XML-документу

<t>
    <node TEXT="   txt A   "/>
    <node TEXT="       txt X"/>
    <node>
        <html>
            <p>        txt Y      </p>
        </html>
    </node>
    <node TEXT="txt B"/>
</t>

создает желаемый результат:

txt A
txt X
txt Y
txt B

Обратите внимание на использование стандартной функции XPath normalize-space(), которая удаляет все ведущие и заканчивая пробелами и заменяя каждую последовательность других пространств одним пробелом.

Ответ 2

Вероятно, вы хотите

 <xsl:strip-space elements="node"/>

объяснил здесь. И эта статья содержит намного больше информации.