python学习与数据挖掘应知应会的十大终端命令
作者:Python学习与数据挖掘 发布时间:2022-03-05 10:38:19
IT界的每个人都应该知道终端(Terminal)的基本知识,数据科学家也不例外。有时,终端是你的全部,尤其是在将模型和数据管道部署到远程机器时。
让我们开始吧!
1、wget
wget实用程序用于从远程服务器下载文件。你可以用它来下载数据集,只要你知道网址,可以使用wget命令下载它,我以如下url为例:
https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv
如果你在Mac上,默认情况下wget不可用,请从终端执行brew install wget进行安装。数据集现在已经下载,让我们继续一些基本的探索。
2、head
如果你是Python用户,这会让您感到熟悉。否则,head命令用于打印文件的前N行。默认打印10行:
如果你想要一个不同的数字,比如说3,你可以使用-n参数。完整的命令是:
head -n 3 airline-passengers.csv
3、tail
tail命令与head命令非常相似,但它将打印最后N行。
默认打印10行:
与head一样,还可以使用-n参数指定要打印的行数。
我们现在已经介绍了基础知识,所以让我们继续讲一些更有趣的内容。
4、wc
有时你想知道文件中有多少个数据点。不需要打开它并手动滚动到底部。一个简单的命令可以为您节省一些时间:
总之,airline-passengers.csv文件包含144行。
5、grep
此命令用于处理文本,可以匹配字符串和正则表达式。我们将使用它只提取包含字符串“1949”的行。这是一个简单的数据集,所以我们不会有任何问题。默认情况下,grep命令将打印结果,但我们可以将其保存到另一个CSV文件:
6、cat
为了验证上一个操作是否成功,我们可以使用cat命令。它用于将整个文件打印到shell。你也可以用它来组合文件和更多,但这是另一个时间的主题。
现在,让我们打印整个文件。数据是按月汇总的,因此总共应该有12行:
7、find
你可以使用find命令搜索文件和文件夹。例如,执行以下命令将当前目录(由点指定)中的所有CSV文件打印到shell:
星号(*)表示文件名无关紧要,只要它以“.csv”结尾。
8、sort
顾名思义,sort命令可用于按某种标准对文件内容进行排序。例如,以下命令按乘客数量升序对数据集进行排序:
-k2参数指定对第二列进行排序。如果要按降序对文件排序,可以指定一个附加的-r参数:
9、nano
虽然技术上不是shell命令,但执行它会打开Nano编辑器。下面是如何创建Python文件:
nano pyfile.py
在这里,让我们编写一些简单的Python代码:
您可以在编辑器中编写任何Python代码,并进行对于简单终端命令来说过于复杂的分析。完成后,可以运行Python文件:
10、Variables
让我们用Variables来结束今天的文章。例如,当文件路径变长时,或者您需要多次使用它们时,它们可以派上用场。
下面是如何声明两个字符串变量并使用mv命令将airline-passengers-1949.csv文件重命名为new.csv:
ls命令用于列出目录中的文件,如我们所见,重命名操作成功。
来源:https://blog.csdn.net/weixin_38037405/article/details/118077361


猜你喜欢
- 切片的声明切片可以看成是数组的引用(实际上切片的底层数据结构确实是数组)。在 Go 中,每个数组的大小是固定的,不能随意
- 1)当我们拿到一个题目时,首先会根据已经知道的条件,进行数据的初步整理和分析。相当于填写出9宫格里,所有的“确定项”,以及标记“可能选项”。
- 1、创建保存mysql备份文件的路径 /mysqldata #mkdir /mysqldata 2、创建/usr/sbin/bakmysql
- 编程小白在线学习代码,前几天帮女朋友合并表格cv大佬在线泪目,想想之前合并表格也是一直cv,重复性且效率低下的操作完全可以用代码来实现。就用
- Golang 复制文件夹,包括文件夹中的文件/** * 拷贝文件夹,同时拷贝文件夹中的文件 * @param srcPath 需要拷贝的文件
- Python之POST调用Restful接口示例# -*- coding: utf-8 -*-import jsonimport reimp
- NTP(Network Time Protocol)是由美国德拉瓦大学的David L. Mills教授于1985年提出,设计用来在Inte
- 本文实例讲述了PHP笛卡尔积实现算法。分享给大家供大家参考,具体如下:<?php$arr = array(array(1,3,4,5)
- 1. 集合 set 简介集合的最大特征是其每个元素都是唯一的,它可以删除、可以增加、也可以通过增删实现替换元素,但是它是没有下标的,你无法通
- 一行代码对话ChatGPT最近ChatGPT火爆全球,哪怕你不是程序员,应该也听过他的大名了。今天我们就来一起体验一下~1行Python代码
- 网上关于javascript实现数字时钟效果的实例很多,但是本文给大家介绍的是滚动效果的数字时钟。小编觉得效果很炫,下面分享给大家。先来看看
- 这篇文章主要介绍了Python使用微信接入图灵机器人过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需
- salt分发后,主动将已完成的任务数据推送到redis中,使用redis的生产者模式,进行消息传送#coding=utf-8import f
- 大型的连锁店有一个大问题。每天,在每家商店会发生数千次交易。公司执行官希望对这些数据进行挖掘。哪些产品卖得好?哪些不好?有机产品在哪里卖得好
- 本章为大家介绍的模块,在python2的时候,并不受宠,主要的问题是存在安全漏洞,发现问题就要及时解决,因此在现在3版本中,已经得到了妥善的
- Vuejs 本身就是一个 MVVM 的框架。但是在监听 window 上的 事件 时,往往会显得 力不从心。比如 这次是 window.re
- 前言最近公司为客户重新部署了一套新环境,由我来完成了基础环境的配置,配置过程中总结了一些经验,分享给各位园友使用 curl 命令检查网络拿到
- 一、Mysql使用limit分页select * from stu limit m, n; //m = (startPage-1)*page
- 内容摘要:一般情况下,如果我们想了解股市行情,必须登录专业股票网站,输入公司代码才能看到具体股价。其实,利用XMLHTTP协议,我们每个人都
- 机器学习分两大类,有监督学习(supervised learning)和无监督学习(unsupervised learning)。有监督学习