Python实现一个简单三层神经网络的搭建及测试 代码解析
作者:柒七期琦 发布时间:2021-10-09 23:59:20
废话不多说了,直接步入正题,一个完整的神经网络一般由三层构成:输入层,隐藏层(可以有多层)和输出层。本文所构建的神经网络隐藏层只有一层。一个神经网络主要由三部分构成(代码结构上):初始化,训练,和预测。首先我们先来初始化这个神经网络吧!
1.初始化
我们所要初始化的内容包括:神经网络每层上的神经元个数(这个是根据实际问题输入输出而得到的,我们将它设置为一个可自定义量)。
不同层间数据互相传送的权重值。
激活函数(模拟自然界的神经元,刺激信号需要达到一定的程度才能激活神经元)
下面上代码:
def __init__(self, input_nodes_num, hidden_nodes_num, output_nodes_num, lr):
# 初始化神经元个数,可以直接修改
self.input_nodes = input_nodes_num
self.hidden_nodes = hidden_nodes_num
self.output_nodes = output_nodes_num
self.learning_rate = lr
# 初始化权重值,利用正态分布函数进行随机初始化,均值为0,方差为神经元个数开方
self.w_input_hidden = numpy.random.normal(0.0, pow(self.hidden_nodes, -0.5),
(self.hidden_nodes, self.input_nodes))
self.w_hidden_output = numpy.random.normal(0.0, pow(self.output_nodes, -0.5),
(self.output_nodes, self.hidden_nodes))
# 初始化激活函数,激活函数选用Sigmoid函数,更加平滑,接近自然界的神经元行为模式
# lambda定义了一个匿名函数
self.activation_function = lambda x: scipy.special.expit(x)
pass
下面我们来解释一下上述代码段中的一些编程知识。首先是__init__()
它是一个类的构造函数,在构建一个类的对象时会调用此函数,所以我们将神经网络初始化相关代码放到这个函数里。
self.w_input_hidden = numpy.random.normal(0.0, pow(self.hidden_nodes, -0.5),
(self.hidden_nodes, self.input_nodes))
这句代码使用了numpy
库中的random.normal()
函数,为输入层和隐藏层之间的数据传递初始化了权重值,这个函数会根据正态分布随机生成一个
self.hidden_nodes*self.input_nodes
的矩阵(hidden_nodes
和input_nodes
表示隐藏层和输入层神经元的个数)。
self.activation_function = lambda x: scipy.special.expit(x)
这句代码使用lambda
定义了一个匿名函数,将它赋值给激活函数,函数为sigmoid函数,是一条平滑的曲线,比较接近自然界神经元对于刺激信号的反应方式。
2.预测
按照正常顺序,初始化完成后应该进行训练,但由于训练较为复杂,且预测较为简单容易实现,我们先完成这一部分的代码。预测环节需要我们将输入信息进行处理,加权求和后传输给隐藏层神经元,经过激活函数并再次加权求和后,传输给输出层经过输出层神经元的处理得到最终的结果。代码片段如下:
def query(self, inputs_list):
# 转置将行向量转成列向量,将每组数据更好的分隔开来,方便后续矩阵点乘操作
inputs = np.array(inputs_list, ndmin=2).T
# 加权求和后经过sigmoid函数得到隐藏层输出
hidden_inputs = np.dot(self.w_input_hidden, inputs)
hidden_outputs = self.activation_function(hidden_inputs)
# 加权求和后经过sigmoid函数得到最终输出
final_inputs = np.dot(self.w_hidden_output, hidden_outputs)
final_outputs = self.activation_function(final_inputs)
# 得到输出数据列
return final_outputs
这段代码没有什么好说的,比较简单,只需按照笔者上述的步骤做即可。有什么不懂的可以看注释或者留下评论。
3.训练
神经网络的训练问题较为复杂,涉及到神经网络的正向和反向传播,微积分的链式法则,矩阵运算,偏微分求导和梯度下降算法的一些知识,都是机器学习的一些基础知识,在这里就不做过多的赘述,过几天我会新发一篇详细讲一下。下面来了解一下训练代码段的主要任务:
训练和预测一样都要首先读入一些输入并预测输出,不同的是,训练阶段我们是从训练数据集中获取数据,我们知道正确的输出是什么,而预测阶段我们只知道输入而输出需要通过我们训练的模型预测出来。首先训练阶段读入输入并按照当前的模型对其进行预测。
基于训练预测结果和标注好的实际结果的误差更新各个层之间的权值。
下面来贴代码:
def train(self, inputs_list, targets_list):
# 将训练集和测试集中的数据转化为列向量
inputs = np.array(inputs_list, ndmin=2).T
targets = np.array(targets_list, ndmin=2).T
# 隐藏层的输入为训练集与权重值的点乘,输出为激活函数的输出
hidden_inputs = np.dot(self.w_input_hidden, inputs)
hidden_outputs = self.activation_function(hidden_inputs)
# 输出层的输入为隐藏层的输出,输出为最终结果
final_inputs = np.dot(self.w_hidden_output, hidden_outputs)
final_outputs = self.activation_function(final_inputs)
# 损失函数
output_errors = targets - final_outputs
# 隐藏层的误差为权值矩阵的转置与输出误差的点乘
hidden_errors = np.dot(self.w_hidden_output.T, output_errors)
# 对权值进行更新
self.w_hidden_output += self.learning_rate * np.dot((output_errors *
final_outputs * (1.0 - final_outputs)),
np.transpose(hidden_outputs))
self.w_input_hidden += self.learning_rate * np.dot((hidden_errors *
hidden_outputs * (1.0 - hidden_outputs)),
np.transpose(inputs))
上述代码段可能对于一些刚接触机器学习或深度学习的同学来说可能有点不知所云或产生一种好复杂的感觉,但是这只是对反向传播算法,链式法则和偏导的综合应用。我会在另一篇随笔中讲述我的心得(可能讲得不好),感兴趣的可以看一下。
4.测试
三层神经网络构建完成,我用mnist
训练集和测试集对其进行了测试,代码及结果如下:
# 初始化各层神经元个数,期中输入神经元个数取决于读入的因变量,而输出神经元个数取决于分类的可能性个数
input_nodes = 784
hidden_nodes = 100
output_nodes = 10
# 学习率,每次调整步幅大小
learning_rate = 0.2
n = NeuralNetwork(input_nodes, hidden_nodes, output_nodes, learning_rate)
# 获取训练集信息
training_data_file = open('data/mnist_train.csv', 'r')
training_data_list = training_data_file.readlines()
training_data_file.close()
for record in training_data_list:
all_values = record.split(',')
inputs = (numpy.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01
targets = numpy.zeros(output_nodes) + 0.01
targets[int(all_values[0])] = 0.99
n.train(inputs, targets)
pass
print('train successful!')
test_file = open('data/mnist_test.csv', 'r')
test_list = test_file.readlines()
test_file.close()
m = np.size(test_list)
j = 0.0
for record in test_list:
test_values = record.split(',')
np.asfarray(test_values)
results = n.query(np.asfarray(test_values[1:]))
if results[int(test_values[0])] == max(results):
j += 1
pass
print("正确率为;" + str(j/m))
来源:https://www.cnblogs.com/sevent/p/15345472.html?utm_source=tuicool&utm_medium=referral


猜你喜欢
- yolov5的代码模型构建是通过.yaml文件实现的,初次看上去会一头雾水,这里记录一下,也方便自己后面用到的时候查看。以models/yo
- 印刷和网络是不一样的。传统的布局排版并不适于网络,因为传统的印刷布局,几乎只想要什么样的平面效果都能很好的达到,但在网络上设计就很困难,尽管
- 本文实例讲述了php面象对象数据库操作类。分享给大家供大家参考。具体实现代码如下://此处构造一个数据库操作类,封装所有数据库操作 //可以
- selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题,selen
- 大概在九九年做游戏网站的时候,就对文章的发布感到麻烦,不过那会儿玩ASP不精。只是将就用着。在遇到长文件 10000 字时网页就是一大片长了
- 今天我们来写一个有管理功能的留言板程序。所谓的管理功能,其实就是每条留言前有一个选择框,点中要删除的留言,或者点“删除所有留言”,就完成了批
- function gaga(obj){ // 值允许输入一个小数点和数字 obj.value = obj.value.replace(/[^
- 一、Array数组的更改array数组中修改的API示例如下://创建大量相同元素的数组//创建有10个String类型元素的数组,并且每个
- 这是17年的第一篇博文,话说这天又是产品同学跑过来问我说:hi,lenny,你看现在市面上流行各种装逼H5,随便输入点名字啥的就给我生成房产
- 一.Numpy库1.什么是numpy?numpy是python进行科学计算的一个基础软件包,他是一个python库,提供多维数组
- 1、jsp页面,携带值跳转到新页 original.jsp var btnClick = {'click .showne
- 比如做一些高级的配置,还比如在客户端或远程执行数据库操作等工作时,ISQL是很方便的。比如入侵一台有SQL服务的主机,入侵SQL Serve
- 华为2019在线笔试题,现整理如下,以供之后参考GitHub题目介绍####################################
- mouseDown事件和mouseUp事件 大家知道,mouseDown事件和mouseUp事件的组合就是click事件,但是如果在链接上按
- 如下所示:var myarr=new Array(); //先声明一维 for(var i=0;i<2;i++){ //一
- 比较简单的一个页面,类似csdn论坛在ns下的左边列表 描述: 1. 数据名:tree.mdb 表名:tree 表结构:id(自编)&nbs
- 当你第一次在机器上安装MySQL时,mysql数据库中的授权表是这样初始化的:你可以从本地主机(localhost)上以root连接而不指定
- 本文列举了兼容 IE 和 FF 的换行 CSS 推荐样式,详细介绍了word-wrap同word-break的区别。兼容 IE 和 FF 的
- tips:在win10中查找SQL Server 2016配置管理器,用来开启SQL Server网络配置,启用实例TCP/IP协议和Nam
- 那里都有狭窄的空间:网页横幅、新闻标题处的空间、柱状的广告,但一张来自照相机的照片却要大很多,它们的比例一般是 6 × 4 英寸 。你如何处