xingag/spider_python — reverse-engineered prompt
Reverse engineered prompt
帮我做一个 Python 爬虫学习项目,像一个可以直接运行的示例合集。重点是让新手能看懂,每个例子都能抓取公开网页内容,然后保存成 JSON、CSV、图片或简单图表。
我希望里面有几类常见爬虫,普通网页抓取,比如电影、天气、古诗词、段子。也要有多线程下载图片的例子,还有用浏览器自动化抓取招聘信息的例子。再做几个 Scrapy 项目示例,比如抓文章、论坛内容、房产信息、图片下载。代码里多写注释,README 写清楚怎么安装、怎么运行、结果会保存在哪里。
请注意只抓公开数据,不要做绕过登录、破解验证码、侵犯隐私或骚扰网站的功能。需要的话可以上网查一下当前库的最新用法。
Want more depth? Deep Reverse