numpy中的converters和usecols用法详解
作者:温欣' 发布时间:2021-01-23 18:29:29
标签:numpy,converters,usecols
用Python打开Excel数据,读取时需要将”学号“和“ID"转换成字符,以便后续操作
df = pd.read_excel(path, converters={'学号': str, 'ID': str})
以下是我的经历来体会:
我在从Excel读入python的数据时,发现读出的是空值:
import pandas as pd
df=pd.read_excel("D:/Python/05DataMineML/2022STU(1).xlsx")
df
但是分明是有数据的,大概率出现的原因是sheetname
(表的名称)出现了问题。
那就试试其他的方法:
下图是Excel的表头,共有115行数据。
方法一:使用usecols
#获取字段的第一种写法
import pandas as pd
df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',usecols=['学号','姓名','20220101','20220125','20220202','20220208','20220213','20220220','20220226','20220311','20220320','20220327','20220403','randscore'],index_col='姓名',sheet_name='2022STUMOOC')
df.info()
index_col:指定作为表格的索引值
usecols:pandas读取excel使用read_excel()中的usecols参数读取指定的列
sheet_name:表名
重点:要使用usecols参数,sheet_name必须显式写出来。
方法二:使用numpy
#获取字段的第二种写法:使用numpy
import pandas as pd
import numpy as np
df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',converters={'学号':str},usecols=np.arange(3,16),index_col='姓名',sheet_name='2022STU')
df.head()
这里就涉及converters:
converters={'学号':str}
:将学号转换为字符类型,以便后续操作。
这里使用了usecols=np.arange(3,16)
方法三:使用切片区间
#获取字段的第三种写法:切片区间
import pandas as pd
import numpy as np
df=pd.read_excel('../05DataMineML/2022STUMOOC (1).xlsx',converters={'学号':str},usecols=("D:P"),index_col='姓名',sheet_name='2022STUMOOC')
df
这里使用了usecols=("D:P")
,也就是使用了如下图每列的序号值做切片
总结:
converters用法:转换类型。比如将Excel数据一列从int变成str
usecols用法
usecols=[‘学号',‘姓名']
usecols=np.arange(3,16)
usecols=(“D:P”)
来源:https://blog.csdn.net/wxfighting/article/details/123953013


猜你喜欢
- 我们都知道在9i之前,要想获得建表和索引的语句是一件很麻烦的事。我们通常的做法都是通过export with rows=no来得到,但它的输
- 现在写一篇博客总是喜欢先谈需求或者本内容的应用场景,是的,如果写出来的东西没有任何应用价值,确实也没有实际意义。今天的最早的需求是来自于如何
- 实现效果完整代码+详细注释<template> <div class="echart"&g
- 大家知道,在js里encodeURIComponent 方法是一个比较常用的编码方法,但因工作需要,在asp里需用到此方法,查了好多资料,没
- python代码实现冒泡排序代码其实很简单,具体代码如下所示:代码Code highlighting produced by Actipro
- 1,js取得IP地址的方法一<script src="http://pv.sohu.com/cityjson?ie=utf-
- 一、前言 本文翻译自微软的牛人Scott Allen Prototypes and Inheritance in JavaScript ,本
- 目录MySQL数据库重命名的方法 第一种方法:rename database 弃用了第二种方法:mysqldump 备份第三种方法
- 引言手机中拍摄照的照片和视频快爆了,想转移到PC端,并按时间建立文件夹存储到电脑中,本文主要介绍如何通过python获取手机拍摄图片的时间信
- 项目开发中hadoop一直装在虚拟机上,最近要迁移到服务器上。记录下迁移过程。一、为虚拟机添加一块新的硬盘虚拟机的初始硬盘只有30G,容不开
- 一、安装pip install pymysql二、连接数据库三种连接数据库的方式import pymysql# 方式一conn = pymy
- 表的普通字段 一对多字段 多对多字段 插入数据#插入数据def add(request):G_title=request.POST.get(
- 异步过渡方案Generator在使用 Generator 前,首先知道 Generator 是什么。如果读者有 Python 开发经验,就会
- SQL语句中要不要加单引号?犯了一个超级超级蠢的错误,把population写成polulation而不自知,多次提醒我找不到polulat
- 本文实例讲述了Python实现的人工神经网络算法。分享给大家供大家参考,具体如下:注意:本程序使用Python3编写,额外需要安装numpy
- Python的matplotlib模块绘制图形功能很强大,今天就用pyplot绘制一个简单的图形,图形中包括曲线、曲线上的点、注释和指向点的
- 如下所示:def save(data, path): f = xlwt.Workbook() # 创建工作簿 she
- openpyxl模块是一个读写Excel 文档的Python库,openpyxl是一个比较综合的工具,能够同时读取和修改Excel文档。op
- 在Visual Studio 中使用git——什么是Git(一)如果要使用git进行版本管理,其实使用git命令行工具就完全足够了,图形化工
- 本文实例讲述了Python实现测试磁盘性能的方法。分享给大家供大家参考。具体如下:该代码做了如下工作:create 300000 files