Skip to content

python flask vue-element-admin selenium 爬虫 后台

Notifications You must be signed in to change notification settings

junpengxu/Apollo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

42 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Apollo

简介

  • 通过这个项目将自己所会的技术以及自己的架构思想尽可能的体现出来

技术栈

  • python
  • flask
  • vue-element-admin
  • element-ui
  • mysql
  • redis
  • celery

架构

  • 前后端分离的方式,前端通过http请求调用后端接口,目前后端不涉及到微服务架构

部署方式

以下为在本地的部署方式

  1. 前端启动 npm run dev 模型启动在9527端口, 在前端的代码中固定了会通过http请求后端5000端口
  2. 后端启动 python manage.py 默认监听5000端口
  3. 启动celery celery -A app.task.spider_tasks worker -l INFO celery 可以执行的任务都写在了app.task.spider_tasks中

前端架构

  • 直接使用了vue-element-admin框架,代码尽可能复用element-ui中的demo

后端架构

  • 使用flask框架
└── server
    ├── README.md
    ├── app
    │   ├── __init__.py
    │   ├── base                # 定义服务的基类
    │   ├── controllers         # 控制器层,封装一些操作数据库功能,尽可能提供通用的方法,尽量避免接触到业务逻辑
    │   ├── models              # model层,主要是映射到数据库层
    │   ├── task                # 存放celery执行的异步任务
    │   ├── urls.py             # 路由表,将请求映射到views层的具体方法上
    │   ├── utils               # 工具库
    │   └── views               # views层,第一层处理服务接受到的请求,以及处理部分业务相关的逻辑
    ├── config.py               # 与项目相关的配置
    ├── manage.py               # 项目启动文件,
    ├── requirements.txt        # 项目以来文件

功能点

序号 功能项 功能简介 完成进度
1 创建贴吧爬虫任务 根据帖子id,爬去页码,爬去这个帖子下发布的内容,回复内容,以及相关的用户信息 done
2 查看爬虫任务结果 通过可视化列表页面,查看这个任务下爬取的结果信息 done
3 查询功能 查询数据库中的帖子以及帖子的回复内容, 返回搜索到的详细信息, 通过mysql查询可能较慢,后期可以考虑上es,或者是在逻辑上进行优化 todo
4 登录检查 登录检查,非登录用户权限受限 done
5 操作日志 记录了服务所有的api操作 done
6 服务注册 实现了服务注册, 主动心跳的功能,模仿了注册中心的实现 done
7 链路跟踪 接入zipkin,但是服务器的性能并不高,可能要升级性能,目前计划先在本地实现 doing
8 打点监控 接入grafana,但是 服务器的性能并不高,可能要升级性能,目前计划先在本地实现 doing
9 基于redis的配置中心 自己通过界面实现配置的查看与读取 doing
10 用户注册 开放注册功能以及权限控制 doing

TODO

  • 完善controller层向view层返回结果的方式, 替换为字典形式返回,发生异常的情况下
  • 权限控制
  • 邮件通知
  • 分布式爬虫任务
  • 容器化部署