一、目标地址
start_urls = ["http://wwwXXXXcn/list.htm"]二、要爬取的内容

三、代码实现
1、复制所有标题的xpath

标题列表=response.xpath('/html/body/div[3]/div[1]/div[1]/ul/li')2、从获取的列表再获取标题和浏览量

for i in 标题列表:
//第一种方法
标题=i.xpath('./b/a/text()')[0]
print(标题.extract())
//第二种方法
浏览量=i.xpath('span/text()')
print(浏览量.extract_first())3、运行该爬虫
scrapy crawl pachong4、运行结果










