Python Pandas教程之series 上的转换操作
作者:海拥 发布时间:2023-08-16 22:20:50
标签:Python,Pandas,series,转换
前言:
在转换操作中,我们执行各种操作,例如更改系列的数据类型,将系列更改为列表等。为了执行转换操作,我们有各种有助于转换的功能,例如.astype()
等.tolist()
。
代码#1:
# 使用 astype 转换 series 数据类型的 Python 程序
# importing pandas module
import pandas as pd
# 从 url 读取 csv 文件
data = pd.read_csv("nba.csv")
# 删除空值列以避免错误
data.dropna(inplace = True)
# 在转换之前存储 dtype
before = data.dtypes
# 使用 astype 转换 dtypes
data["Salary"]= data["Salary"].astype(int)
data["Number"]= data["Number"].astype(str)
# 转换后存储 dtype
after = data.dtypes
# 打印出来比较
print("BEFORE CONVERSION\n", before, "\n")
print("AFTER CONVERSION\n", after, "\n")
输出:
代码 #2:
# Python程序将 series 转换为列表
# 导入 pandas 模块
import pandas as pd
# 导入 regex 模块
import re
# 制作数据框
data = pd.read_csv("nba.csv")
# 删除空值以避免错误
data.dropna(inplace = True)
# 操作前存储 dtype
dtype_before = type(data["Salary"])
# 转换为列表
salary_list = data["Salary"].tolist()
# 操作后存储dtype
dtype_after = type(salary_list)
# 打印数据类型
print("Data type before converting = {}\nData type after converting = {}"
.format(dtype_before, dtype_after))
# 显示列表
salary_list
输出 :
Pandas series 方法:
功能 | 描述 |
---|---|
Series() | 可以使用 Series() 构造函数方法创建熊猫系列。此构造方法接受各种输入 |
combine_first() | 方法用于将两个系列合二为一 |
count() | 返回系列中非 NA/null 观测值的数量 |
size() | 返回基础数据中的元素数 |
name() | 方法允许为 Series 对象(即列)命名 |
is_unique() | 如果对象中的值是唯一的,则方法返回布尔值 |
idxmax() | 提取Series中最高值的索引位置的方法 |
idxmin() | 提取系列中最低值的索引位置的方法 |
sort_values() | 在 Series 上调用方法以按升序或降序对值进行排序 |
sort_index() | 在熊猫系列上调用方法以按索引而不是其值对其进行排序 |
head() | 方法用于从系列的开头返回指定数量的行。该方法返回一个全新的系列 |
tail() | 方法用于从 Series 的末尾返回指定数量的行。该方法返回一个全新的系列 |
le() | 用于将 Caller 系列的每个元素与传递的系列进行比较。对于每个小于或等于传递系列中的元素的元素,它返回 True |
ne() | 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个不等于传递系列中的元素的元素返回 True |
ge() | 用于将 Caller 系列的每个元素与传递的系列进行比较。它为大于或等于传递系列中的元素的每个元素返回 True |
eq() | 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个等于传递系列中的元素的元素返回 True |
gt() | 用于比较两个系列并为每个元素返回布尔值 |
lt() | 用于比较两个系列并为每个元素返回布尔值 |
clip() | 用于剪裁低于和高于传递的最小和最大值的值 |
clip_lower() | 用于裁剪低于传递的最小值的值 |
clip_upper() | 用于剪裁高于传递的最大值的值 |
astype() | 方法用于更改系列的数据类型 |
tolist() | 方法用于将系列转换为列表 |
get() | 在 Series 上调用方法以从 Series 中提取值。这是传统括号语法的替代语法 |
unique() | Pandas unique() 用于查看特定列中的唯一值 |
nunique() | Pandas nunique() 用于获取唯一值的计数 |
value_counts() | 计算每个唯一值在系列中出现的次数的方法 |
factorize() | 方法通过识别不同的值来帮助获得数组的数字表示 |
map() | 将一个对象的值绑定到另一个对象的方法 |
between() | Pandas between() 方法用于系列检查哪些值位于第一个和第二个参数之间 |
apply() | 调用方法并将 Python 函数作为参数提供给每个 Series 值使用该函数。此方法有助于执行 pandas 或 numpy 中未包含的自定义操作 |
来源:https://juejin.cn/post/7139042944064962596
0
投稿
猜你喜欢
- 前言Django 和 DRF(django rest framawork) 的结合在 python 后台中经常出现的组合。对于异常的全局处理
- 这个问题已经不是什么新鲜问题了,网上也有大把的教程,但大多数是授人以鱼,而不授人以渔,经过辛苦的资料收集,思考,调试,整理,我基本上已经把这
- 概要本文只是简单的介绍动态规划递归、非递归算法实现案例一题目一:求数组非相邻最大和[题目描述]在一个数组arr中,找出一组不相邻的数字,使得
- 在使用json.dumps时要注意一个问题>>> import json>>> print json.d
- <title>:一个优质网页最重要的元素HTML 中的 <title> 元素用于在下列情况中提供一小段能够代表该网页
- 下面的asp函数实现了对站点的所有缓存Application的清理,释放!Sub RemoveAllCache() D
- 需求一般Django开发为了保障避免 csrf 的攻击,如果使用Django的模板渲染页面,那么则可以在请求中渲染设置一个csrftoken
- 在使用keras搭建神经网络时,有时需要查看一下预测值和真是值的具体数值,然后可以进行一些其他的操作。这几天查阅了很多资料。好像没办法直接a
- 本文实例为大家分享了Go实现文件上传的具体代码,供大家参考,具体内容如下文件上传:客户端把上传文件转换为二进制流后发送给服务器,服务器对二进
- 网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码。这里有个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据
- pycharm中光标变粗,如下:原因:光标进入了改写状态。解决方法:按一下键盘中的Insert键就好了。
- 今天把Ext.js源码又读了一遍,不过这次比较认真。看完代码,有了不少收获也遇到不少问题。主要总结如下:1、document.execCom
- 最近做了一次口碑网注册流程改造,简单说一下激活邮件的设计上的一些小心得:1、尽量不要用图片,尤其是别把激活链接做成一个点击按钮。2、尽量少的
- 本文实例讲述了Python快速查找算法的应用,分享给大家供大家参考。具体实现方法如下:import randomdef partition(
- 参数Parameters解析响应时间resolveTimeout 数据类型:长整型。简单地说就是程序对目标主机的名字解析解析的一个过程时间。
- python提取特定时间段内的数据尝试一下:data['Date'] = pd.to_datetime(data['
- 该爬虫应用了创建文件夹的功能:#file settingfolder_path = "D:/spider_things/2016.
- 通过XSL转换XML文件 最近,我喜欢上了XML编程,但又苦于它的美观程度又不够,找了许多书才搞定。用XML好是蛮好,但它还是不太适合做显示
- 我们可以通过高级API更简洁地实现多层感知机。import torchfrom torch import nnfrom d2l import
- 如何在页面中实现对电子信箱的访问?emaile.htm<HTML><HEAD><META NAME=