在Python中可以使用XPath来获取HTML或XML文档中的li标签。首先,需要导入相关的库,例如lxml库。
以下是一个使用XPath获取li标签的示例代码:
from lxml import etree # HTML或XML文档的示例字符串 html = """ <html> <body> <ul> <li>Item 1</li> <li>Item 2</li> <li>Item 3</li> </ul> </body> </html> """ # 创建一个XPath解析器 parser = etree.HTMLParser() # 将字符串解析为一个XPath可解析的对象 tree = etree.fromstring(html, parser) # 使用XPath表达式获取li标签 li_tags = tree.xpath('//li') # 遍历获取到的li标签 for li in li_tags: print(li.text) 运行上述代码会输出:
Item 1 Item 2 Item 3 在XPath表达式'//li'中,//表示选择文档中的所有li标签,而li表示选择li标签。因此,tree.xpath('//li')会返回一个包含所有li标签的列表。接下来,可以对这个列表进行遍历来获取每个li标签的内容。