灯塔学院--python爬虫进阶

返回课程中心

Python 爬虫进阶

已完成

目标一：打好爬虫地基

第0关初识爬虫闯关完成

了解爬虫和浏览器的原理

下载文章必做练习

下载图片必做练习

第1关建立爬虫学习目标闯关完成

“开课吧食堂”开始营业必做练习

第2关学习基础HTML知识闯关完成

我的第一个小爬虫

菜谱爬虫必做练习

目标二：爬虫实用法则

第3关掌握爬虫工具Beautiful Soup闯关完成

BeautifulSoup实践

做一顿丰盛的料理必做练习

第4关理解JSON在爬虫中的作用闯关完成

又见五月天

私人日记本必做练习

第5关获取数据和解析数据闯关完成

爬取五月天全部歌曲清单

学唱五月天的歌必做练习

让我们换个歌手必做练习

第6关提取数据和存储数据闯关完成

存储我们爬取到的数据

存储豆瓣新片榜必做练习

第7关掌握爬虫流程闯关完成

获取歌曲评论必做练习

目标三：手把手爬网站

第8关理解cookies闯关完成

学会使用cookie

“解密”加密文章必做练习

第9关掌握Selenium闯关完成

用程序指挥浏览器

用“selenium”来评论菜谱必做练习

第10关学习如何使用代码登录网站并爬取信息闯关完成

让爬虫定时向你汇报

这周有什么新电影看？必做练习

目标四：提升爬虫效率

第11关学习如何使用协程提高爬虫速度闯关完成

建立爬虫军队

成为一个书虫必做练习

第12关协程实战闯关完成

吃什么不会胖？

从「HI 运动」网爬取食物热量必做练习

第13关学习如何使用Scrapy框架闯关完成

scrapy的用法

再爬豆瓣新片榜必做练习

第14关 Scrapy实战闯关完成

建立一个组织有序的爬虫

爬取豆瓣图书短评必做练习

爬取当当图书榜单必做练习

第15关学习常见的反爬虫应对策略闯关完成

青山不改，绿水长流