Skip to content

zhongjunchen/RestaurantCrawler-Pear

 
 

Repository files navigation

爬取外卖平台商家数据,生成可对比的视图 基于 React 的前端请转

项目结构

模块名 文件目录 说明
http服务 web 包含API接口具体实现,基于 Flask Web框架
爬虫实现 crawlers 爬虫的具体实现
爬虫任务执行 jobs 基于消息队列(beanstalkd)的任务调度
数据操作 models 对数据库的 CRUD 操作实现, 基于 Sqlalchemy

爬虫设计

数据库

HTTP 方法说明

  • GET(SELECT):从服务器取出资源(一项或多项)。
  • POST(CREATE):在服务器新建一个资源。
  • PUT(UPDATE):在服务器更新资源(客户端提供改变后的完整资源)。
  • PATCH(UPDATE):在服务器局部更新资源(客户端提供改变的属性)。
  • DELETE(DELETE):从服务器删除资源。
  • HEAD:获取资源的元数据。
  • OPTIONS:获取信息,关于资源的哪些属性是客户端可以改变的。

接口实现

  • 登录注册 /auth/login auth/signup
  • 需要登录的接口,使用装饰器添加验证
  • 登录饿了么
  • 饿了么商家爬虫
  • 饿了么商家菜品爬虫
  • 饿了么商家评论爬虫
  • 饿了么数据分析
  • 美团外卖数据爬取
  • 百度外卖爬取

Api

  • 登录注册 auth/login auth/signup POST

  • 获取饿了么登录短信验证码 config_ele_crawler/sms_code GET
  • 登录饿了么 config_ele_crawler/login_ele GET
  • 搜索饿了么地点 config_ele_crawler/search_address GET
  • 获取饿了么商家 config_ele_crawler/get_restaurants GET

  • 提交爬虫任务 crawler/task POST
  • 获取所有爬虫任务 crawler/task GET
  • 获取单条爬虫任务 crawler/task/<int:crawler_id> GET
  • 删除任务 crawler/task/<int:crawler_id> DELETE

评论词云

About

Python外卖数据爬取与分析 饿了么 美团

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 99.7%
  • Shell 0.3%