Python数据分析基础之文件的读取
作者:生生世世酒 发布时间:2022-10-16 21:25:21
目录
一·Numpy库中操作文件
1.操作csv文件
2.在pycharm中操作csv文件
3.其他情况(.npy类型文件)
二·Pandas库中操作文件
1.操作csv文件
2.从剪贴板上复制数据
3.读取excel或xlsx文件
三·补充
1.常用
2.pandas中读取文件的函数
总结
前言:如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库;如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库
一·Numpy库中操作文件
1.操作csv文件
import numpy as np
a=np.random.randint(0,10,size=(3,4))
np.savetext("score.csv",a,deliminter=",")
a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名
或者
import numpy as np
data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)
skiprows:跳过第一行,dtype:数据读出的类型为字符型
2.在pycharm中操作csv文件
import csv
with open("score.csv",'r')as fp:
reader=csv.reader(fp)
for x in reader:
print(x)
reader:迭代器
3.其他情况(.npy类型文件)
import numpy as np
c=np.random.randint(0,10,size=(2,3))
np.save("文件名",c)
c1=np.load("文件名.npy")
二·Pandas库中操作文件
1.操作csv文件
import pandas as pd
df=pd.read_csv("exl.csv")
或者
import pandas as pd
pd.read_table("exl.csv",sep=',')
sep
:分隔符
2.从剪贴板上复制数据
import pandas as pd
BS=pd.read_clipboard
3.读取excel或xlsx文件
import pandas as pd
df=read_excel("exl.xlsx")
三·补充
1.常用
import os
os.chdir()
chdir()中写上你想读取文件的目录,表示将目录转化到你想读取文件的目录.
2.pandas中读取文件的函数
read_csv
从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为逗号read_table
同上,但默认分隔符为制表符(“t”)read_fwf
读取定宽列格式数据(无分隔符)read_clipboard
读取剪贴板中的数据read_excel
从Excel 或xlsx文件中读取表格数据read_hdf
读取pandas写的HDF5文件read_html
读取html文档中的所以表格read_json
读取json字符串中的数据read_msgpack
二进制格式编码的pandas数据read_pickle
读取python pickle 格式中存储的任意对象read_sas
读取存储于SAS系统自定义存储格式为SAS数据集read_sql
读取SQL查询结果为pandas的DataFrameread_stata
读取stata文件格式的数据集
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!
来源:https://blog.csdn.net/m0_63137059/article/details/122048958


猜你喜欢
- pytorch 中的 state_dict 是一个简单的python的字典对象,将每一层与它的对应参数建立映射关系.(如model的每一层的
- 我就废话不多说啦,还是直接看代码吧!list1 = [1,2,3,4]a,b,c,d = list1则a = 1b =2等这种方式只有当左边
- 一份完全按照李航<<统计学习方法>>介绍的HMM代码,供大家参考,具体内容如下#coding=utf8 '&
- 楔子随着自媒体时代,现在对视频的处理变得越来越常见。我们可以使用Adobe的一些专业工具,但是效率不高;如果只是对视频进行一些简单的处理的话
- 本文实例讲述了JavaScript使用setTimeout实现延迟弹出警告框的方法。分享给大家供大家参考。具体如下:先给大家展示一个延迟/定
- 一、下载MySQL首先,去数据库的官网http://www.mysql.com下载MySQL。点击进入后的首页如下: 然后点击do
- PHP mysqli_stmt_init() 函数初始化声明并返回 mysqli_stmt_prepare() 使用的对象:<?php
- 字典数据结构分析/* The ma_values pointer is NULL for a combined table * or poi
- 在Google Reader上看到网友分享的一个链接,真的发现自己已经out了。上面的这张图,是纯CSS实现的,没有背景图、没有Javasc
- (1)IN运算符:它可以用来匹配一个固定集合中的某一项。比如说一个集合里面的年份有(2001,2003,2005),那么就可以有:SELEC
- 本文实例讲述了python切片的步进、添加、连接简单操作。分享给大家供大家参考,具体如下:步进切片:#coding:utf-8a="
- <? // 建立一个指向新COM组件的索引 $word = new C
- pyecharts产生背景Echarts是由百度开源的数据可视化,凭借良好的交互性和精巧的图表设计,得到众多开发者的认可,而python很适
- var p="",s="4e00"; for( var i=0;i<255;i++){ p+=
- 除了使用Django内置表单,有时往往我们需要自定义表单。对于自定义表单Post方式提交往往会带来由CSRF(跨站请求伪造)产生的错误&qu
- 环境准备数据库版本:MySQL 5.7.20-log建表 SQLDROP TABLE IF EXISTS `t_ware_sale_stat
- 本文实例讲述了Python爬虫爬取杭州24时温度并展示操作。分享给大家供大家参考,具体如下:散点图 爬虫杭州今日24时温度 https://
- 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。re 模块使 Python 语言拥有全部的正则表达式功能。
- 目录系列教程一、MySQL简介二、MySQL的发展历史三、MariaDB的基本使用1、基本安装与配置2、客户端命令:mysql3、其他客户端
- 1.在服务器环境中安装centosyum install python3X[X代表版本号]ubuntuapt-get install pyt