css&&xpath定位元素

学习爬虫必不可少的是css selector与xpath定位元素位置,索性将xpath与css selector一起学了,顺便做个小记录



css定位元素

css 定位元素法

css class定位:

标准语法:
tag[attribute='value']
即:
标签名[属性='属性值']

简写:
# >> id #可表示id
. >> class .可表示class

注*仅仅id与class 属性可以简写,其他属性必须用标准语法来写
即可写为:
tag#value#valuetag[id='value']
tag.value.valuetag[class='value']

注*单引号内value要完全匹配,如果有两个value就要写两个value
如: div[id='value1 value2']
但用 # 或 .无需写出所有value
但可以追加value
如: .value1.value2

css通配符定位元素:

标准语法:

“^” 表示文本开始

“$” 表示文本结尾
“*” 表示匹配任意元素

xpath 定位元素

语法:
//tag[@attribute='value']

绝对路径定位元素(一般不使用)
绝对路径用 / 表示
表示元素是上一个节点的子节点,不可跳级查找
如:
/html/body/div[1]/div[1]/ul/li[2]

相对路径定位元素
相对路径用 // 表示
表示下级任何子节点或子节点的嵌套节点,可跳级查找
如:
/html/body/div[1]/div[1]/ul/li[2]
可表示为
//li[2]
未完…