python数据分析之线性回归选择基金
作者:??斜月???? 发布时间:2022-03-09 08:13:59
1 前言
在前面的章节中我们牛刀小试,一直在使用python爬虫去抓取数据,然后把数据信息存放在数据库中,至此已经完成了基本的基本信息的处理,接下来就来处理高级一点儿的内容,今天就从基金的趋势分析开始。
2 基金趋势分析
基金的趋势,就是选择一些表现强势的基金,什么样的才是强势呢?那就是要稳定的,逐步的一路北上。通常情况下,基金都会沿着一条趋势线向上或者向下,基金的趋势形成比股票的趋势更加确定一些。 以下图为例,展示的是华夏中证新能源汽车ETF的走势情况,可以看到这个基金的走势基本上就是按照红色的趋势线。今天要做的就是使用数学-线性回归的方式来计算这个趋势的斜率以及趋势表的可靠性。
这里分析基金走势的模型采用线性回归,假定其走势符合 { y = kx + b }y=kx+b , y 就是对应的收益率, x 为时间。k 值为斜率。现在要做的就是使用这组基金的数据计算这个k值,这样就可以使用这个k值进行基金的对比。
3 数据抓取与分析
3.1 基金数据抓取
抓取基金数据历史收益率的数据
# 抓取基金历史收益率数据连接
http://api.fund.eastmoney.com/pinzhong/LJSYLZS?fundCode=515030&indexcode=000300&type=y
# 参数说明
fundCode 为需要查询的基金代码
indexcode 基金对比基准数据,默认为沪深300(000300)
type 为数据查询的周期,m 一个月 q 3个月 hy 6个月 y 一年 try 3年 fiy 5年 sy 今年来 se 最大
复制代码
在api接口返回的数据中,0 代表的是基金数据, 1 是同类基金的平均值,2 为沪深300的数据。
具体的实现代码见图:
3.2 数据分析
数据分析的方式使用 matplotlib
和 sklearn.linear_model
,第一个是用于数据的图形展示,第二个是线性分析工具,用于计算基金的k值。有关线性分析的内容,有兴趣的可以去查询线性分析的计算细节。
如下图所示,为数据模型计算和图形展示的代码。
以新能源ETF数据为例,我们得到了 y= 0.3541x + b 的趋势线,这个线性模型的评分为0.741。其实这个评分已经相当高了,收益率越大,其波动越大,和线性规划的契合度就越低。
但是有没有例外呢,以天弘增利短债C(008647)为例,其评分相当高,看图形展示就可以知道,但是债券基金的k值比股票基金的k值比是相当的低,高风险,高回报,低风险,低回报。收益是对风险的补偿。
4 总结
在这一章中,介绍了使用线性规划的方式分析基金的趋势情况,并使用量化分析的方法进行基金的分析和筛选。最后可以使用这个方法对所以的基金进行分析,筛选出趋势性强的基金进行投资。
来源:https://juejin.cn/post/7034532696625774629


猜你喜欢
- 这几天接到一个需求需要吧不同系统的数据库进行同步,需要我做一个中间平台进行连接,瞬间就想到了触发器调用接口然后通过API进行传递再写入另一个
- python 内置函数filterclass filter(object): """ filter(funct
- xlwt与xlrd只能针对xls格式的excel进行操作,如果想对xlsx格式进行操作请使用openpyxl模板对excel进行操作xlwt
- 本文实例为大家分享了Django实现文件上传下载的具体代码,供大家参考,具体内容如下一、django实现文件下载(1)、后台接口如果从服务器
- 前言现在正是卡塔尔世界杯激战正酣的时候,每天都有各种各样的新闻。而且,不同的球队,随着比赛的进程,关注的热度也会发生翻天覆地的变化。今天我们
- 最近组内一些Go服务碰到内存相关的问题,所以今天抽时间看了下Go pprof内存指标的含义,为后续查问题做准备。内容主要来自于Go代码中对这
- 本文实例为大家分享了Python OpenCV图像直方图和反向投影的具体代码,供大家参考,具体内容如下当我们想比较两张图片相似度的时候,可以
- 一份基于cnn的手写数字自识别的代码,供大家参考,具体内容如下# -*- coding: utf-8 -*-import tensorflo
- 一、前言Celery是一个基于python开发的分布式任务队列,而做python WEB开发最为流行的框架莫属Django,但是Django
- 之前在做数据分析的过程中,需要对数据进行实时的写入,比如对新生成的数据写入之前已经生成的txt或csv文件中。现在想想其实很简单,所以做一个
- 本文主要介绍了python 边缘扩充方式的实现示例,具体如下:import cv2# big_pad=True:当目标图像高和宽均大于原图时
- 一、索引的优劣势优点:可以快速的检索 、可以加快分组和排序缺点: 占用储存空间、降低数据表的修改操作二、索引的分类主键索引即主索
- 前言首先我们做数据分析,想要得出最科学,最真实的结论,必须要有好的数据。而实际上我们一般面对的的都是复杂,多变的数据,所以必须要有强大的数据
- 概述在开发中,可能会遇到当页面滚动停止之后执行某些操作的需求。在 scrollend 事件之前,并没有可靠的方法来检测页面滚动是否完成。这意
- 为了安全起见,需要经常对数据库作备份,或者还原。对于 MySQL 而言,最方便的方法可能就是用 phpMyAdmin 的导出、导入功能了,但
- 匿名函数匿名函数就是不需要显示式的指定函数名首先看一行代码:def calc(x,y): re
- 卡口转换率将数据导入hive,通过SparkSql编写sql,实现不同业务的数据计算实现,主要讲述车辆卡口转换率,卡口转化率:主要计算不同卡
- 这里分析了php的简单防盗链实现方法。分享飞大家供大家参考。具体如下:index.php页面如下:<html><head&
- Matplotlib官网 如果想了解更多可查看官网。import numpy as np import matplotlib.py
- <?php/** * 车票接口类 * * @author chepiao100 *