xpath的语法小结

Bertha 。 2022-05-12 03:12 219阅读 0赞

## 不使用scrapy框架进行爬虫的xpath常用方法 ##

### 1.简单介绍 ###

>     XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

### 2. XML文档源码举例 ###

<xml version="1.0" encoding="ISO-8859-1"?>
    
    <bookstore>
    
    <book>
      <title lang="eng">Harry Potter</title>
      <price>29.99</price>
    </book>
    
    <book>
      <title lang="eng">Learning XML</title>
      <price>39.95</price>
    </book>
    
    </bookstore>

### 2.1 实例 ###

在下面的表格中，列出了一些路径表达式以及表达式的结果：

![70][]

## ##

### 2.2 实例 ###

在下面的表格中，列出了带有谓语的一些路径表达式，以及表达式的结果：

![70 1][]

### 3.重点总结     ###

> xpath()返回的永远是一个列表:
> 
> 1.属性匹配:通过属性查找到的节点都放在一个列表里:为<Element div at 0x16e88e2b9c8>对象
> 
>                        --\[<Element div at 0x16e88e2b9c8>, <Element div at 0x16e88e2b8c8> \]
> 
> 2.获取标签的文本内容:/text() 例如:.xpath(//book/title\[@lang="eng"\]/text())
> 
>                        --返回值为列表:\["Harry Potter","Learning XML"\]
> 
> 3.获取某个标签的属性: 例如:href = html.xpath("//a/@href")
> 
>                         --\['https://zhidao.baidu.com/usercenter?uid=330e4069236f25705e79db50&teamType=1'\]

# #

**如果你和我有共同爱好,我们可以加个好友一起交流!**

**![1445380-20180903211901788-1752749014.png][]**

[70]: /images/20220512/1dbe1e107479421e98655174d110d56b.png
[70 1]: /images/20220512/a04f7ccb8eac470d821e94e97500bd64.png
[1445380-20180903211901788-1752749014.png]: /images/20220512/8a85e4bb321d44cb83ae3d811b6c8273.png

xpath的语法小结

发表评论取消回复

还没有评论，来说两句吧...

相关阅读