Data analysis through jupyter notebook
18年计划转能源方面的数据挖掘岗位,准备了一些项目。
1. 光伏Pr衰减分析
1.分析历年的光伏发电量数据与辐照度,气温等因素的关系;
2.获得光伏组件的功率衰减曲线并计算组件的Pr值
1.常规的数据分析流程(观察数据,数据预处理,特征工程,建立模型,结果分析等)
2.预测Titanic生还者的数据
1.以德国16年的光伏和风电发电量为结果,分析其与天气,风速等一系列因素的关系;
2.构建线性回归模型,旨在通过17年和18年的气象数据,预测这两年的发电量信息
1.给定44个地产楼盘,按照销量,库存率等信息划分成10组
2.分配给不同的销售组进行销售工作
1.设计实验,获取数据
2.描述统计分析,获得一般特征
3.推论统计分析,确定置信区间,进行假设检验及效应量
4.编制分析报告
1.设计实验,获取数据(流程与5一致)
2.描述统计分析,获得一般特征
3.推论统计分析,确定置信区间,进行假设检验及效应量
4.编制分析报告
1.通过Python中的SQL模块读取数据
2.分析数据结构,并对时间列进一步细化处理
3.通过数据透视表的形势对时间进行分列处理
4.导入K-means模块,并构建聚类可视化类,进行可视化处理
8. 叶片运输问题总结
1.基于运筹学中的运输问题,调用python的pulp模块进行线性优化
2.依据叶片运输问题,构建数据集
3.建立数学模型,添加约束条件
4.求解各个路径分配的运输量,并总结一般问题的结题思路
9. 稀疏矩阵转化与压缩
1.基于用户对商品的评分,获得用户-商品评分矩阵
2.对于数据量巨大的矩阵,必定需要压缩来减少空间占用
3.因此调用了python的scipy.parse模块对矩阵分别进行了COO、CSR、CSC三种形式的压缩