Пустые строки при использовании minidom.toprettyxml
Я использовал minidom.toprettyxml для префикса моего xml файла.
Когда я создаю XML файл и использую этот метод, все работы решены, но если я его использую после изменения файла xml (для примера я добавил дополнительные узлы), а затем я возвращаю его в XML, Я получаю пустые строки, каждый раз, когда я его обновляю, у меня все больше и больше пустых строк...
мой код:
file.write(prettify(xmlRoot))
def prettify(elem):
rough_string = xml.tostring(elem, 'utf-8') //xml as ElementTree
reparsed = mini.parseString(rough_string) //mini as minidom
return reparsed.toprettyxml(indent=" ")
и результат:
<?xml version="1.0" ?>
<testsuite errors="0" failures="3" name="TestSet_2013-01-23 14_28_00.510935" skip="0" tests="3" time="142.695" timestamp="2013-01-23 14:28:00.515460">
<testcase classname="TC test" name="t1" status="Failed" time="27.013"/>
<testcase classname="TC test" name="t2" status="Failed" time="78.325"/>
<testcase classname="TC test" name="t3" status="Failed" time="37.357"/>
</testsuite>
любые предложения?
спасибо.
Ответы
Ответ 1
Я нашел решение здесь: http://code.activestate.com/recipes/576750-pretty-print-xml/
Затем я изменил его, чтобы взять строку вместо файла.
from xml.dom.minidom import parseString
pretty_print = lambda data: '\n'.join([line for line in parseString(data).toprettyxml(indent=' '*2).split('\n') if line.strip()])
Вывод:
<?xml version="1.0" ?>
<testsuite errors="0" failures="3" name="TestSet_2013-01-23 14_28_00.510935" skip="0" tests="3" time="142.695" timestamp="2013-01-23 14:28:00.515460">
<testcase classname="TC test" name="t1" status="Failed" time="27.013"/>
<testcase classname="TC test" name="t2" status="Failed" time="78.325"/>
<testcase classname="TC test" name="t3" status="Failed" time="37.357"/>
</testsuite>
Это может помочь вам немного сработать в вашей функции:
def new_prettify():
reparsed = parseString(CONTENT)
print '\n'.join([line for line in reparsed.toprettyxml(indent=' '*2).split('\n') if line.strip()])
Ответ 2
Я нашел легкое решение этой проблемы, просто изменив последнюю строку
из вас prettify(), так что это будет:
def prettify(elem):
rough_string = xml.tostring(elem, 'utf-8') //xml as ElementTree
reparsed = mini.parseString(rough_string) //mini as minidom
return reparsed.toprettyxml(indent=" ", newl='')
Ответ 3
используйте это, чтобы решить проблему с линиями
toprettyxml(indent=' ', newl='\r', encoding="utf-8")
Ответ 4
У меня такая же проблема с Python 2.7 (32b) на машине под Windows 10. Проблема заключается в том, что когда python анализирует XML-текст на объект ElementTree, он добавляет некоторые раздражающие строки для атрибутов "text" или "tail" для каждого элемента.
Этот script удаляет такие символы прерывания строки:
def removeAnnoyingLines(elem):
hasWords = re.compile("\\w")
for element in elem.iter():
if not re.search(hasWords,str(element.tail)):
element.tail=""
if not re.search(hasWords,str(element.text)):
element.text = ""
Используйте эту функцию перед "красивой печатью" вашего дерева:
removeAnnoyingLines(element)
myXml = xml.dom.minidom.parseString(xml.etree.ElementTree.tostring(element))
print myXml.toprettyxml()
Это сработало для меня. Надеюсь, это сработает для вас!