ZBLOG

import scrapy class BooksSpide(scrapy.spider): name = "books" #定义爬虫爬去的起始地点,起始地点可以试多个 这里只有一个 start_urls= ['http://books.toscrape.com/'] def parse(self, response): for book in res

是的,代码缩进有问题。最后一行应该与前面的if语句对齐,而不是缩进一个额外的空格。正确的代码如下所示:

import scrapy

class BooksSpider(scrapy.Spider):
    name = "books"
        
    start_urls= ['http://books.toscrape.com/']
    
    def parse(self, response):
        for book in response.css('article.product_pod'):
            name = book.xpath('./h3/a/@title').extract_first()
            price = book.css('p.price_color::text').extract_first()
            yield {
                'name': name,
                'price': price,
            }
                
        next_url = response.css('ul.pager li.next a::attr(href)').extract_first()
        if next_url:
            next_url = response.urljoin(next_url)
            yield scrapy.Request(next_url, callback=self.parse)

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:http://sdn.0voice.com/?id=78

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?