Python数据分析基础之文件的读取
作者:生生世世酒 发布时间:2022-10-16 21:25:21
目录
一·Numpy库中操作文件
1.操作csv文件
2.在pycharm中操作csv文件
3.其他情况(.npy类型文件)
二·Pandas库中操作文件
1.操作csv文件
2.从剪贴板上复制数据
3.读取excel或xlsx文件
三·补充
1.常用
2.pandas中读取文件的函数
总结
前言:如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库;如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库
一·Numpy库中操作文件
1.操作csv文件
import numpy as np
a=np.random.randint(0,10,size=(3,4))
np.savetext("score.csv",a,deliminter=",")
a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名
或者
import numpy as np
data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)
skiprows:跳过第一行,dtype:数据读出的类型为字符型
2.在pycharm中操作csv文件
import csv
with open("score.csv",'r')as fp:
reader=csv.reader(fp)
for x in reader:
print(x)
reader:迭代器
3.其他情况(.npy类型文件)
import numpy as np
c=np.random.randint(0,10,size=(2,3))
np.save("文件名",c)
c1=np.load("文件名.npy")
二·Pandas库中操作文件
1.操作csv文件
import pandas as pd
df=pd.read_csv("exl.csv")
或者
import pandas as pd
pd.read_table("exl.csv",sep=',')
sep
:分隔符
2.从剪贴板上复制数据
import pandas as pd
BS=pd.read_clipboard
3.读取excel或xlsx文件
import pandas as pd
df=read_excel("exl.xlsx")
三·补充
1.常用
import os
os.chdir()
chdir()中写上你想读取文件的目录,表示将目录转化到你想读取文件的目录.
2.pandas中读取文件的函数
read_csv
从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为逗号read_table
同上,但默认分隔符为制表符(“t”)read_fwf
读取定宽列格式数据(无分隔符)read_clipboard
读取剪贴板中的数据read_excel
从Excel 或xlsx文件中读取表格数据read_hdf
读取pandas写的HDF5文件read_html
读取html文档中的所以表格read_json
读取json字符串中的数据read_msgpack
二进制格式编码的pandas数据read_pickle
读取python pickle 格式中存储的任意对象read_sas
读取存储于SAS系统自定义存储格式为SAS数据集read_sql
读取SQL查询结果为pandas的DataFrameread_stata
读取stata文件格式的数据集
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!
来源:https://blog.csdn.net/m0_63137059/article/details/122048958
猜你喜欢
- 本文实例讲述了Linux下安装Memcached服务器和客户端与php使用。分享给大家供大家参考,具体如下:Memcached是高性能的分布
- 1.官网下载Pycharm community版如pycharm-community-2017.3.1.tar.gz。2. #解压tar.g
- 浏览器的具体功能都储存在服务器端的Browscap.ini中:<% SET
- 如果不是因为总监审查严格,一定要求这个细节解决掉,也许我也不会去深究根源性的解决办法,再此感谢MTIME负责而严格的同事。首先描述一下问题:
- 前一段时间导师叫我写一个批处理的小程序,就是循环修改辐射传输模型软件MODTRAN的输入参数,然后运行MODTRAN软件进行计算,输出需要的
- 在实际工作中,无论是对数据库系统(DBMS),还是对数据库应用系统(DBAS),查询优化一直是一个热门话题。一个成功的数据库应用系统的开发,
- 在认识ImageMagick之前,我使用的图像浏览软件是KuickShow,截图软件是KSnapShot,这两款软件都是KDE附带的软件,用
- 从codered到nimda等,一大堆蠕虫把原来需要人工利用的漏洞都变成了程序自动利用了,大家还想去手工操作这些IIS漏洞么?让我们调整重心
- 头疼的挂马事件申请了个免费空间弄了个小站空间还可以二年多了挺稳定的只是从今年年初开始网页老莫名奇妙的被人挂马仔细检查了网站 不存在什么漏洞应
- 一,十进制(decimal system)转换函数说明 1,十进制转二进制 decbin() 函数,如下实例 echo decbin(12)
- 本文实例为大家分享了python实现登录与注册系统的具体代码,供大家参考,具体内容如下实现功能1.调用文本文件里的用户信息2.可以将注册信息
- 今天在项目中向数据库的CLOB属性插入一段篇文章(1000~2000)字就会报一个字符串过长的错误。网上说用流来处理,没有这么做。这像是一个
- 以下是IE7中新支持的属性:min-height,max-height,min-width,max-width这个hack还可以使最大高度兼
- 一、前言越来越多的网站和App开始为用户搭建签到系统,以此来吸引和留住用户。签到系统是一种轻量、互动性强的营销方式,通过用户签到获取免费权益
- 比如下面一个listbinfo = ['lao','wang','python']我们通过h
- 背景:有一个爬虫服务,需要定时从公开网站上拉取一些数据,为了避免被识别为爬虫(防爬虫的识别需要根据很多特征,时间仅仅是其中一个维度),需要在
- #测试网址: http://localhost/blog/testurl.php?id=5 //获取域名或主机地址 echo $_SERVE
- Sometimes we have need to interact with an application,for examp
- 采集文章给建站带来了很大的方便,特别是一些小网站,人员有限,资金有限,适当的使用采集功能可以很快丰富我们的网站,采集这么厉害可能你会觉的代码
- 为了防止采集,我试过各种方法,绝大多数方法是“ * 剑”---防止了采集,也影响了搜索引擎收录,实在不爽!一天本人忽发奇想:何不