Python数据拟合实现最小二乘法示例解析
作者:微小冷 发布时间:2023-12-17 05:46:36
标签:Python,数据拟合,最小二乘法
所谓最小二乘法,即通过对数据进行拟合,使得拟合值与样本值的方差最小。
线性拟合
这个表达式还是非常简单的。
对于有些情况,我们往往选取自然序列作为自变量,这个时候在求自变量的取值时可以用到一些初等数学的推论,对于 x ∈ [ m , n ] 的自然序列来说,有
#文件名core.py
import numpy as np
def leastSquare(x,y):
if len(x)==2:
#此时x为自然序列
sx = 0.5*(x[1]-x[0]+1)*(x[1]+x[0])
ex = sx/(x[1]-x[0]+1)
sx2 = ((x[1]*(x[1]+1)*(2*x[1]+1))
-(x[0]*(x[0]-1)*(2*x[0]-1)))/6
x = np.array(range(x[0],x[1]+1))
else:
sx = sum(x)
ex = sx/len(x)
sx2 = sum(x**2)
sxy = sum(x*y)
ey = np.mean(y)
a = (sxy-ey*sx)/(sx2-ex*sx)
b = (ey*sx2-sxy*ex)/(sx2-ex*sx)
return a,b
测试一下
>>> x = np.arange(25)
>>> y = x*15+20+np.random.randn(len(x))*5#randn生成正态分布噪声
>>> a,b = core.leastSquare(x,y)
>>> plt.scatter(x,y)#原始数据散点图
<matplotlib.collections.PathCollection object at 0x00000218DEBBEDC8>
>>> plt.plot(x,a*x+b)#拟合直线
[<matplotlib.lines.Line2D object at 0x00000218E0314FC8>]
>>> plt.show()
得到
高阶多项式
和前面一样,约定
代码如下
#传入参数格式为np.array,n为阶数
def leastSquareMulti(x,y,n):
X = [np.sum(x**i) for i in range(2*n+1)]
Y = np.array([[np.sum(y*x**i)] for i in range(n+1)])
S = np.array([X[i:i+n+1] for i in range(n+1)])
return np.linalg.solve(S,Y)#
经测试结果如下:
>>> x = np.arange(25)
>>> y = x**3+3*x**2+2*x+12
>>> import core
>>> core.leastSquareMulti(x,y,3)
array([[12.],#此为常数项
[ 2.],
[ 3.],
[ 1.]])
多自变量
对于样本
则相应地其误差方程组可表示为
指数函数
则其代码为
def expFit(x,y):
y0 = y[0:-3]
y1 = y[1:-2]
y2 = y[2:-1]
B,C = leastSquare(y2/y0,y1/y0)
b1 = np.log((B-np.sqrt(B**2+4*C))/2)
b2 = np.log((B+np.sqrt(B**2+4*C))/2)
X = np.exp(b1-b2)*x
Y = y/np.exp(b2*x)
a1,a2 = leastSquare(X,Y)
return a1,a2,b1,b2
以上就是Python数据拟合实现最小二乘法示例解析的详细内容,更多关于Python实现最小二乘法的资料请关注脚本之家其它相关文章!
来源:https://blog.csdn.net/m0_37816922/article/details/97161484


猜你喜欢
- 1 监听启动activity 信息命令adb shell logcat | grep START 可以查看apk包名和Activity名字=
- 下面的表格中列出了已经学习过的数据类型,也是python的核心数据类型之一部分,这些都被称之为内置对象。对象,就是你面对的所有东西都是对象,
- public bool SaveSMSMessage(SMSBatch smsBatch, DataSet smsMessages) { /
- 前言在工作中使用的是oracle数据库,平时想在家测试一些sql是否可以跑的过,可惜自己电脑并没有安装oracle数据库,甚至完全不想安装到
- 笔者通过一周的时间,询问了许多设计人员真实用户,以便确保这六个方面确实是大多数用户所不喜并且有非常大的概率普遍存在于众多的医疗网站之中。那么
- 1. 服务器优化优化原则:内存里的数据要比磁盘上的数据访问起来快;站数据尽可能长时间地留在内存里能减少磁盘读写活动的工作量;让索引信息留在内
- 在VirtualBox中使用Ubuntu虚拟机中,会出现虚拟硬盘不够用的情况:查了一下磁盘空间,如下所示:df -H启动CMD命令行,进入V
- 数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第一部分 优化①:增加次数据文件,设置文件自动增长(
- 1. 栈栈(stack)又名堆栈,它是一种运算受限的线性表。其限制是仅允许在表的一端进行插入和删除运算。这一端被称为栈顶,相对地,把另一端称
- PyCharm是一款很好用很流行的python编辑器。Anaconda是专注于数据分析的Python发行版本,包含了conda、Python
-   在用Python进行数据处理的时候,经常会遇到DataFrame中的某一列本应该是数值类型,但由于数
- 安装方法: regsvr32 parmf.dll附 如果想取消注册可以:regsvr32 /u&nb
- 一、为何人工智能(AI)首选Python?读完这篇文章你就知道了。我们看谷歌的TensorFlow基本上所有的代码都是C++和Python,
- python天数转日期字符串在利用python读取Excel的时候, 日期格式的单元格读取出来是数字,该数字表示1990年01月01日到该日
- 1. 资料1) Protobuf 开发文档https://protobuf.dev/2) protobuf安装指南https://grpc.
- 这篇文章主要介绍了基于Django实现日志记录报错信息,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋
- 一、摘要Python使用被称为异常 的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时,它都会创建一个异常对象。
- pytorch之添加BN层批标准化模型训练并不容易,特别是一些非常复杂的模型,并不能非常好的训练得到收敛的结果,所以对数据增加一些预处理,同
- Python基本输入和输出1.input输入函数input函数:获取用户输入,保存成一个字符串。>>> name = in
- python调用mysql数据库通常通过mysqldb模块,简单说下如何调用1.安装驱动目前有两个MySQL的驱动,我们可以选择其中一个进行