工作计划 ==== # 概要 在短的时间内很难做成一个产品化的,算法丰富的成功, 因此做了初步的规划 此次任务的宗旨不是为了预测股票价格, 而是要发现, 发现相似性, 发现周期性,短期的不变性, 给人直观的展示,辅助判断。 # 规划 ## 算法库 主要依赖于pandas 和 sklearn,做一些初步的算法 ## 具体算法 ### 偏离算法 在时间轴上计算每隔股票的偏离程度,例如偏离5日线,20日线, 计算结果作为新的数据源 ### 方差 做方差计算, 和偏离算法类似,但是不再是以均线为依据,计算结果作为新的数据源 ### 相关性分析 选择某些指标或股票, 其余的股票和他们做相关性分析 前两步生成的数据也可以作为本步骤的数据源 ### 聚类分析 基于KN, KVM, Ensable forest等算法做聚类分析, 具体实现先参考查阅的相关文献