在爬虫编写过程中经常会使用先抓大后抓小的原则,xpath可以通过以下代码实现先抓大后抓小
item_list = selector.xpath('//div[@class="items"]')
for i in item_list:
item['name'] = i.xpath('.//div[@class="items__txt__title"]/a/text()')
此时的.//就是从当前元素路径下进行查找。如果是//的话就变成整个html下查找无法过滤无效信息
在爬虫编写过程中经常会使用先抓大后抓小的原则,xpath可以通过以下代码实现先抓大后抓小
item_list = selector.xpath('//div[@class="items"]')
for i in item_list:
item['name'] = i.xpath('.//div[@class="items__txt__title"]/a/text()')
此时的.//就是从当前元素路径下进行查找。如果是//的话就变成整个html下查找无法过滤无效信息
1 条评论
2025年10月新盘 做第一批吃螃蟹的人coinsrore.com
新车新盘 嘎嘎稳 嘎嘎靠谱coinsrore.com
新车首发,新的一年,只带想赚米的人coinsrore.com
新盘 上车集合 留下 我要发发 立马进裙coinsrore.com
做了几十年的项目 我总结了最好的一个盘(纯干货)coinsrore.com
新车上路,只带前10个人coinsrore.com
新盘首开 新盘首开 征召客户!!!coinsrore.com
新项目准备上线,寻找志同道合的合作伙伴coinsrore.com
新车即将上线 真正的项目,期待你的参与coinsrore.com
新盘新项目,不再等待,现在就是最佳上车机会!coinsrore.com
新盘新盘 这个月刚上新盘 新车第一个吃螃蟹!coinsrore.com