Tôi muốn sử dụng phương thức "findall" để định vị một số phần tử của tệp xml nguồn trong mô-đun ElementTree.
Tuy nhiên, tệp xml nguồn (test.xml) có không gian tên. Tôi cắt một phần của tệp xml làm mẫu:
<?xml version="1.0" encoding="iso-8859-1"?>
<XML_HEADER xmlns="http://www.test.com">
<TYPE>Updates</TYPE>
<DATE>9/26/2012 10:30:34 AM</DATE>
<COPYRIGHT_NOTICE>All Rights Reserved.</COPYRIGHT_NOTICE>
<LICENSE>newlicense.htm</LICENSE>
<DEAL_LEVEL>
<PAID_OFF>N</PAID_OFF>
</DEAL_LEVEL>
</XML_HEADER>
Mã python mẫu dưới đây:
from xml.etree import ElementTree as ET
tree = ET.parse(r"test.xml")
el1 = tree.findall("DEAL_LEVEL/PAID_OFF") # Return None
el2 = tree.findall("{http://www.test.com}DEAL_LEVEL/{http://www.test.com}PAID_OFF") # Return <Element '{http://www.test.com}DEAL_LEVEL/PAID_OFF' at 0xb78b90>
Mặc dù nó có thể hoạt động, vì có một không gian tên "{http://www.test.com}", việc thêm một không gian tên ở trước mỗi thẻ là rất bất tiện.
Làm cách nào tôi có thể bỏ qua không gian tên khi sử dụng phương thức "find", "findall", v.v.
tree.findall("{0}DEAL_LEVEL/{0}PAID_OFF".format('{http://www.test.com}'))
tree.findall("xmlns:DEAL_LEVEL/xmlns:PAID_OFF", namespaces={'xmlns': 'http://www.test.com'})
đủ thuận tiện?