利用Python读取Excel表内容的详细过程
作者:WYKB_Mr_Q 发布时间:2022-10-24 05:43:33
标签:python,读取,excel
用python读取excel表中的数据
假如说有如下一张存储了数据的excel表,其中x1-x6是特征,y_label是特征对应的类别标签。我们想要使用python对以下数据进行数据分析,那么第一步就要先把excel表中的数据读取出来才行。这里我们主要使用到了python中的pandas库。
首先确定excel表存放的路径所在,比如我的路径是 ‘E:\relate_code\svm\dataset\data.xlsx’.
import pandas as pd
file_path = r'E:\relate_code\svm\dataset\data.xlsx' # r对路径进行转义,windows需要
raw_data = pd.read_excel(file_path, header=0) # header=0表示第一行是表头,就自动去除了
print(raw_data)
这样就可以取出数据了,输出见下图。可以看出,这里就没有表中的x1等表头信息了。
但是,最左边这里还有0-169这些行号额外信息,咱们可以用以下命令只要里面的有用信息,并保存到数组中。
data = raw_data.values # 只提取表中信息
print(data)
输出结果:
这时候数据就都读进来了,并且存储为了数组形式。咱们可以选择想要的数据,比如想把x和y分开,毕竟一个是特征,另一个是标签,这时候可以使用以下代码。
features = data[:, 0:6] # 由于是二维数组,所以第一个冒号表示选择所有行,之后0:6表示只要前六列的数据
labels = data[:, -1] # 标签只要最后一列
1、还可以对特征进行选择,假如只要第四列的特征也可以使用:
feature_4 = data[: 3:4] # 这样得出的数组依然是二维数组,便于后续特征操作
2、如果不想要第四个特征,其它都想要,也可以这样使用,需要用到numpy库:
import numpy as np
feature1_3 = data[:, 0:3] # 取前三列特征
feature5_6 = data[:, 4:6] # 取第5,第6列特征
feature_choose = np.hstack(feature1_3, feature5_6) # 对两份特征进行特征拼接
这里再多说一下,np.hstack()函数和 np.vstack()函数:
这里是np.vstack()函数。主要是进行竖直堆叠,使用这个函数的时候要保证两个数组列数是一致的(都是三列),得出的结果如下。
import numpy as np
arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([7, 8, 9])
print(np.vstack((arr1, arr2)))
下面是np.hstack()函数,主要是进行水平堆叠,使用这个函数的时候要保证行数是一致的(都是两行)。
import numpy as np
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
print(np.hstack((arr1, arr2)))
就先介绍到这里吧,下一篇文章介绍机器学习的代码使用!
来源:https://blog.csdn.net/WYKB_Mr_Q/article/details/122999267


猜你喜欢
- 1、从半年以前要“去中心化”开始,豆瓣作了不少大的调整,重要的是上线了很多的新功能。同城、日记、相册、音乐试听、等等。2、一个多月来,豆瓣上
- title: 利用Django实现一个能与用户交互的初级框架author: Sun-Winddate: September 1, 2021D
- 往列表头部和尾部添加元素往头部添加元素list.insert(index,new_element)@@@index为新元素的插入位置,当in
- 在之前的Python办公自动化案专题中,我们已经介绍了如何有选择的提取某些页面进行合并。但是很多时候,我们并不会预知希望提取的页号,而是希望
- docker安装mysqldocker search mysql 搜索docker pull mysql:5.6
- 在python中enumerate的用法多用于在for循环中得到计数,本文即以实例形式向大家展现python中enumerate的用法。具体
- 最近由于项目需要,开始学习python,然后发现一个非常有用的python交互式编辑器,非常容易上手而且非常有用和实在,本博文是对学习jup
- 如下所示:#加载词典def load_dict_from_file(filepath): _dict = {} tr
- 项目发布版本会遇到经常需要清理缓存的问题,以下是项目禁用缓存的实际方法1.public文件夹中修改 index.html文件meta配置 &
- 最近项目中遇见 Jquery Ajax 缓存问题,load出来的页面状态有时正常,有时不对,记录一下,希望对大家有帮助使用jquery里lo
- 前言任何应用都离不开数据,所以在学习python的时候,当然也要学习一个如何用python操作数据库了。MySQLdb就是python对my
- 从一个字符串开始在CODE上查看代码片派生到我的代码片 >>>time_str='2008-08-08
- append()方法追加传递obj到现有的列表。语法以下是append()方法的语法:list.append(obj)参数&nb
- 首先,建一个文件夹,把你要隐藏的文件放在里面,你的所有黑客程序什么的。假设你建的文件夹叫hacker然后呢,我们给这个文件夹加个扩展名(后缀
- 本篇文章主要介绍Java操作MongoDB。开发环境:System:WindowsIDE:eclipse、MyEclipse 8Databa
- Python实现对变位词的判断,供大家参考,具体内容如下什么是变位词呢?即两个单词都是由相同的字母组成,而各自的字母顺序不同,譬如pytho
- 1. 文件的读写原理:文件的读写称为I/O操作。操作原理:.py文件是用解释器去运行,调用OS操作系统的资源,去操作磁盘上的文件。操作流程:
- 在表中有两个字段:id_no (varchar) , in_date (datetime) ,把in_date相同的记录的in_date依次
- 在看论文《Detecting Regions of Maximal Divergence for Spatio-Temporal Anoma
- 通过神经网络实现线性回归的拟合训练过程只训练一轮的算法是:for 循环,直到所有样本数据使用完毕:读取一个样本数据前向计算反向传播更新梯度P