Python数据分析之pandas读取数据
作者:小菜鸡也会有春天 发布时间:2023-06-17 12:53:59
标签:python,pandas
一、三种数据文件的读取
二、csv、tsv、txt 文件读取
1)CSV文件读取:
语法格式:pandas.read_csv(文件路径)
CSV文件内容如下:
import pandas as pd
file_path = "e:\\pandas_study\\test.csv"
content = pd.read_csv(file_path)
content.head() # 默认返回前5行数据
content.head(3) # 返回前3行数据
content.shape # 返回一个元组(总行数,总列数),总行数不包括标题行
content.index # 返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>
content.column # 返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')
content.dtypes # 返回的是每列的数据类型
姓名 object
年龄 int64
籍贯 object
dtype: object
2)CSV文件读取:
语法格式:pandas.read_csv(文件路径)
CSV文件内容如下:
import pandas as pd
file_path = "e:\\pandas_study\\test2.txt"
content = pd.read_csv(file_path,sep='\t',header = None ,names= ['name','age','adress'])
#参数说明:
# header = None 表示没有标题行
# sep='\t' 表示去除分割符中的空格
# names= ['name','age','adress'] ,列名依次自定义为'name','age','adress'
content.head() # 默认返回前5行数据
content.head(3) # 返回前3行数据
content.shape # 返回一个元组(总行数,总列数),总行数不包括标题行
content.index # 返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>
content.column # 返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')
content.dtypes # 返回的是每列的数据类型
三、excel文件读取
import pandas as pd
file_path = "e:\\pandas_study\\test3.xlsx"
content = pd.read_excel(file_path)
content.head() # 默认返回前5行数据
content.head(3) # 返回前3行数据
content.shape # 返回一个元组(总行数,总列数),总行数不包括标题行
content.index # 返回索引,是一个可迭代的对象<class 'pandas.core.indexes.range.RangeIndex'>
content.column # 返回所有的列名 Index(['姓名', '年龄', '籍贯'], dtype='object')
content.dtypes # 返回的是每列的数据类型
姓名 object
年龄 int64
籍贯 object
dtype: object
四、数据库表格读取
语法: pandas.read_sql(sql语句,数据库连接对象)
数据对象的创建,可以根据pymysql,cx_oracle等模块连接mysql或者oracle。
来源:https://blog.csdn.net/weixin_50640351/article/details/117336508


猜你喜欢
- 前言上回说到我们如何把拉勾的数据抓取下来的,既然获取了数据,就别放着不动,把它拿出来分析一下,看看这些数据里面都包含了什么信息。(本次博客源
- 编程语言中反射的概念在计算机科学领域,反射是指一类应用,它们能够自描述和自控制。也就是说,这类应用通过采用某种机制来实现对自己行为的描述(s
- 由于Oracle自身比较复杂,在Linux环境下安装要涉及很多方面的因素。本文分两个方面介绍在Linux RedHat 6.0环境下Orac
- 听说 FaceBook 开放其网站的代码了,期前也算是了解过 FaceBook 的架构,所以重点就是看其代码的质量。可以毫不夸张的说,Fac
- 在Python中,有许多用于发送HTTP请求的库,其中最受欢迎的是requests、aiohttp和httpx。这三个库的性能和功能各不相同
- 相信很多初学python的小伙伴都会遇到这样的坑:环境变量配置不好,无法正常启动python。那么环境变量究竟是个什么东西呢?为什么要设置它
- 有两种方法供参考.一种是实实在在的将图片先用ASPJPEG组件做成想要的尺寸,再读取好处是节省服务器带宽,速度快坏处是处理起来较为麻烦,并网
- 先来看javascript的直接写在了input上 <input name="pwuser" type="
- explain用于获取查询执行计划信息,一、语法只需要在select前加上explain即可,如:mysql> explain sel
- rebase在git中是一个非常有魅力的命令,使用得当会极大提高自己的工作效率;相反,如果乱用,会给团队中其他人带来麻烦。它的作用简要概括为
- 鉴于最近一段时间一直在折腾的CNN网络效果不太理想,主要目标是为了检测出图像中的一些关键点,可以参考人脸的关键点检测算法。但是由于从数据集的
- 如下所示:L = ['adam', 'Lisa', 'bart', 'Paul
- 前言最近在用yolov5参加比赛,yolov5的技巧很多,仅仅用来参加比赛,着实有点浪费,所以有必要好好学习一番,在认真学习之前,首先向yo
- Python 中的函数eval()?是一个非常有用的工具,在前期,我们一起学习过该函数点击查看:Python eval 函数动态地计算数学表
- 安装golang使用homebrew安装golang。homebrew是MacOS 平台下的软件包管理工具,拥有安装、卸载、更新、查看、搜索
- 本文介绍使用python+pyqt5开发桌面程序的一个可视化UI视图布局一、环境包的安装1、如果还不知道虚拟环境的可以参考,或者直接使用pi
- 一、读者指引 读者指引帮助你掌握本文的梗概。以免你看了大半才明白这编文章不适合你,给你造成视觉污染。如果你正在用ASP+XML写一些程序,或
- 首先,我们看看models.py里的模型,有个upload_to参数,为了和过去一刀两断,楼主决定给upload_to赋值一个新的值叫ava
- sys.argv[]是用来获取命令行参数的,sys.argv[0]表示代码本身文件路径,所以参数从1开始,以下两个例子说明:1、使用sys.
- 目录简介实现原理源码运行结果简介大家都知道在微信朋友圈或者微博以及QQ动态中,有很多“强迫症患者”发图片都爱发9张,而有些图是一张图片分成的