Python的这些库,你知道多少?
作者:肥学大师 发布时间:2021-12-12 04:02:39
一、导读
通常,开发大量原始代码是一个费时费力的工作而且有时候有很多专业知识我们不可能都一 一弄懂,为了避免这种情况,我们会尽可能多地使用库中已有的类来创建对象,通常仅需要一行代码。因此,库能够帮助我们使用适量的代码执行重要的任务。我想这也是为什么python能够活跃在我们身边的原因之一吧,欢迎大家点赞收藏,日后学习。
二、前戏
刚才忘了说了,大家在用python的时候我还是推荐大家下一个集成开发环境Anaconda
这里面能够更好的管理这些第三方库文件,其好处只有你真正用过才知道老规矩想用的话自己查,老师说过:“程序员最长走的两条路一是自己去百度;二是找别人帮你百度!!!” 这真的是名言
三、Python标准库
有时候你可能想不到python标准库里面有这么多工功能,Python标准库提供了丰富的功能,包括文本/二进制数据处理、数学运算、函数式编程、文件/目录访问、数据持久化、数据压缩/归档、加密、操作系统服务、并发编程、进程间通信、网络协议、JSON / XML /其他Internet数据格式、多媒体、国际化、GUI、调试、分析等。下面列出了一部分Python标准库模块。
difflib:差异计算工具
collections:建立在列表、元组、字典和集合基础上的加强版数据结构。
csv:处理用逗号分隔值的文件。
datetime, time:日期和时间操作。
decimal:定点或浮点运算,包括货币计算。
doctest:通过验证测试或嵌入在docstring中的预期结果进行简单的单元测试。
json:处理用于Web服务和NoSQL文档数据库的JSON(JavaScript Object Notation)数据。
math:常见的数学常量和运算。
os:与操作系统进行交互。
queue:一种先进先出的数据结构。
random:伪随机数操作。
re:用于模式匹配的正则表达式。
sqlite3:SQLite关系数据库访问。
statistics:数理统计函数,如均值、中值、众数和方差等。
sys:—命令行参数处理,如标准输入流、输出流和错误流。
timeit:性能分析。
string:通用字符串操作
textwrap:文本填充
unicodedata:Unicode字符数据库
stringprep:互联网字符串准备工具
readline:GNU按行读取接口
rlcompleter:GNU按行读取的实现函数
Python拥有一个庞大且仍在快速增长的开源社区,社区中的开发者来自许多不同的领域。该社区中有大量的开源库是Python受欢迎的最重要的原因之一。
许多任务只需要几行Python代码就可以完成,这会令人感到很神奇。下面列出了一些流行的数据科学库。
四、科学计算与统计
NumPy(Numerical Python):Python没有内置的数组数据结构。它提供的列表类型虽然使用起来更方便,但是处理速度较慢。NumPy提供了高性能的ndarray数据结构来表示列表和矩阵,同时还提供了处理这些数据结构的操作。
SciPy(Scientific Python):SciPy基于NumPy开发,增加了用于科学处理的程序,例如积分、微分方程、额外的矩阵处理等。scipy.org负责管理SciPy和NumPy。
StatsModels:为统计模型评估、统计测试和统计数据研究提供支持。
IPython是Python科学计算标准工具集的组成部分,它可以把很多东西联系到一起,有点类似一个增强版的Python shell。目的是为了提高编程,测试和调试Python代码的速度,好像很多国外的大学教授,还有Google大牛都很喜欢用IPython,确实很方便。
五、数据处理与分析
pandas:一个非常流行的数据处理库。pandas充分利用了NumPy的ndarray类型,它的两个关键数据结构是Series(一维)和DataFrame(二维)。
modin[14] pandas加速库,接口语法与pandas高度一致
dask[15] pandas加速库,接口语法与pandas高度一致
plydata[16] pandas管道语法库
六、可视化
Pyecharts Echarts 是个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时pyecharts 诞生了
Matplotlib:可高度定制的可视化和绘图库。Matplotlib可以绘制正规图、散点图、柱状图、等高线图、饼图、矢量场图、网格图、极坐标图、3D图以及添加文字说明等。
Seaborn:基于Matplotlib构建的更高级别的可视化库。与Matplotlib相比,Seaborn改进了外观,增加了可视化的方法,并且可以使用更少的代码创建可视化。
七、机器学习、深度学习和强化学习
scikit-learn:一个顶级的机器学习库。机器学习是AI的一个子集,深度学习则是机器学习的一个子集,专注于神经网络。
Keras:最易于使用的深度学习库之一。Keras运行在TensorFlow(谷歌)、CNTK(微软的深度学习认知工具包)或Theano(蒙特利尔大学)之上。
TensorFlow:由谷歌开发,是使用最广泛的深度学习库。TensorFlow与GPU(图形处理单元)或谷歌的定制TPU(Tensor处理单元)配合使用可以获得最佳的性能。TensorFlow在人工智能和大数据分析中有非常重要的地位,因为人工智能和大数据对数据处理的需求非常巨大。
OpenAI Gym:用于开发、测试和比较强化学习算法的库和开发环境。
pytorch Pytorch是torch的python版本,是由Facebook开源的神经网络框架,专门针对 GPU 加速的深度神经网络(DNN)编程。Torch 是一个经典的对多维矩阵数据进行操作的张量(tensor )库,在机器学习和其他数学密集型应用有广泛应用。与Tensorflow的静态计算图不同,pytorch的计算图是动态的,可以根据计算需要实时改变计算图。但由于Torch语言采用 Lua,导致在国内一直很小众,并逐渐被支持 Python 的 Tensorflow 抢走用户。作为经典机器学习库 Torch 的端口,PyTorch 为 Python 语言使用者提供了舒适的写代码选择。
八、自然语言处理
NLTK(Natural Language Toolkit):用于完成自然语言处理(NLP)任务。
TextBlob:一个面向对象的NLP文本处理库,基于NLTK和模式NLP库构建,简化了许多NLP任务。
Gensim:功能与NLTK类似。通常用于为文档合集构建索引,然后确定另一个文档与索引中每个文档的相似程度。
来源:https://blog.csdn.net/jiahuiandxuehui/article/details/117622657


猜你喜欢
- 类的定义Python中,定义类是通过class关键字,例如我们定义一个存储学生信息的类:class Student(object):pass
- 本文实例为大家分享了python实现简单tftp的具体代码,供大家参考,具体内容如下tftp是基于udp的协议实现简单的tftp,首先要有t
- 这只是个asp小技巧类的东西,它虽然适合在每个不同文件名里调用这个函数,但是也是有前提的,下面让我们来仔细看看其中的原委。 &n
- 1、说明拼接文件路径,可以有多个参数。2、语法os.path.join(path1,path2,*)path1 初始路径。path2 需要拼
- 事件流浏览器中的事件流意味着页面上可有不仅一个,甚至多个元素响应同一个事件。而这一个或多个元素响应事件发生的先后顺序在各个浏览器(主要针对I
- 浅拷贝和深拷贝拷贝函数是专门为可变数据类型list、set、dict使用的一种函数。作用是,当一个值指向另一个值的时候,也不会影响指向的值,
- 前言前面我们讲过了error类型来处理一般的错误,本文会描述使用panic函数和recover函数来处理比较极端的错误。简单来说,当程序运行
- mysql> SELECT something FROM tbl_name &nb
- 一、 了解postman1. 什么是postman?------ 软件测试用来做接口测试的工具。2. 如何下载postman--
- 导读需要使用python做一个将很多个不规则PPT导出成用文件夹归纳好的图片集,所以就需要使用comtypes调用本机电脑上的ppt软件,批
- 有些项目可能涉及到使用多个数据库的情况,方法很简单。1.在settings中设定DATABASE比如要使用两个数据库:DATABASES =
- 用Pyinstaller封装一个py文件时,过程没有问题,但打开后会出现闪退的现象。因此上网找,找到了上面网址所示的解决方法。也就是用cmd
- 知识点requestsparselreos环境 python3.8pycharm2021目标网址:https://mm.enter
- 由于工作需要,在做最优分箱的时候,始终写不出来高效的代码,所以就找到了R语言中的最优分箱的包,这个时候考虑到了在python中调用R语言,完
- 想要追赶 Python 的热潮,应该如何学习呢?现在许多人在自学之外,都会选择去培训机构学习。选择培训机构的的标准是什么呢?什么样的pyth
- 准备工作我们需要把秒杀的商品加入购物车,因为脚本点击的是全选,所以不需要的商品要移出购物车。过程分析1.打开某宝网站;pq = webdri
- 1. HADOOP背景介绍1.1 什么是HADOOP1.HADOOP是apache旗下的一套开源软件平台2.HADOOP提供的功
- 因为即将开始淘宝的项目,在前端方面必然要深入了解taobao ued规范,规范还是比较全的,只是对taobao.com的编码和字符集的选择有
- 本文实例讲述了Python 函数用法。分享给大家供大家参考,具体如下:demo.py(函数定义):# say_hello() # 不能在定义
- 前言为了让大家更好的理解本期知识点,先介绍以下几个知识点:线性结构、非线性结构、循环、迭代、遍历、递归。线性结构:数组、队列非线性结构:树、