Linux中split大文件分割和cat合并文件详解
作者:daisy 发布时间:2021-05-24 15:49:42
前言
当需要将较大的数据上传到服务器,或从服务器下载较大的日志文件时,往往会因为网络或其它原因而导致传输中断而不得不重新传输。这种情况下,可以先将大文件分割成小文件后分批传输,传完后再合并文件。
1. 分割文件
文件分割可以使用split命令,该即支持文本文件分割,又支持二进制文件分割;而合并文件可以使用cat命令。
1.1 文本文件分割
分割文本文件时,可以按文件大小分割,也可以按文本行数分割。
按文件大小分割
按文件大小分割文件时,需要以-C参数指定分割后的文件大小:
$ split -C 100M large_file.txt stxt
如上所示,我们将大文件large_file.txt按100M大小进行分割,并指定了分割后文件前缀stxt;当不指定前缀时,split会自动对分割文件进行命名,一般会以x开头。
按行分割
文本文件还可以以行为单位进行分割,以行数进行分割时会忽略文件大小,并以-l参数指定分割后文件的行数:
$ split -l 1000 large_file.txt stxt
1.2 二进制文件分割
二进制文件分割类似于按大小分割文本文件,不同的是以-b参数来指定分割后的文件大小:
$ split -b 100M data.bak sdata
2. 文件合并
文件合并使用cat命令,上面几种方式分割的文件都可以使用cat命令合并。
cat命令合并分割文件:
$ cat stxt* > new_file.txt
3. 命令格式
3.1 split命令说明
split命令格式如下:
split [选项]... [要切割的文件 [输出文件前缀]]
命令参数
-a, --suffix-length=N 使用长度为 N 的后缀 (默认 2)
-b, --bytes=SIZE 设置输出文件的大小。支持单位:m,k
-C, --line-bytes=SIZE 设置输出文件的最大行数。与 -b 类似,但会尽量维持每行的完整性
-d, --numeric-suffixes 使用数字后缀代替字母
-l, --lines=NUMBER 设备输出文件的行数
--help 显示版本信息
--version 输出版本信息
3.2 cat命令说明
cat是Linux下使用频率较高的命令之一,该令详细介绍:
cat连接文件并打印到标准输出设备上
cat命令的常见使用场景有:
显示文件内容:
$ cat filename
创建一个空文件:
$ cat > filename
文件合并:
$ cat file1 file2 > file
来源:https://itbilu.com/linux/man/Nkz2hoeNm.html
猜你喜欢
- 今天给Godaddy主机用户介绍下.htaccess。.htaccess文档让你可以自定义你的站点或者站点上的某个具体的目录的行为。例如,如
- 无疑,Linux和Unix是最强大的命令行操作系统。虽然我们也可以使用这些操作系统的图形用户界面(GUI),不过在涉及到管理系统配置时,命令
- 一抬头,又是窗外朦朦,不知多少人家,此时梦中。多少草根站长,此时挑灯夜战。回首间,已埋在Admin5近两年。虽然钱赚的不多,但是阅历增加无数
- 11月13日消息 今天下午,央视网宣布宣布其集合了“UGC(用户产生内容)+SNS”功能的&
- 一、首先把php的压缩包(这里以PHP4.3.2为例)解压到C:\php-4.3.2-Win32目录中,然后从其中找到一个叫php.ini-
- 1. 输入命令:cd /media2. 输入命令:sh VBoxLinuxAdditions.run3. 可能会出现错误:解决的办法是依次输
- 开篇不废话直奔主题,小弟今年元旦刚做的新站,是关于网络免费资源的518免费网。做的时候抱着很大的勇气和信心,毕竟还是第一次嘛(俺的第一次就这
- 7.网站经常无法访问也许你拥有最好的网页内容,最好的网络服务,但是如果你的网站因为各种原因经常无法访问,或者访问速度很慢,那么,你拥有的用户
- 用法:date [选项]... [+格式] 或:date [-u|--utc|--universal] [MMDDhhmm[[CC]YY][
- /etc/fstab机自动挂载分区/磁盘,规定哪个分区/设备,挂载到哪里 [root@oldboy ~]# cat /etc/fstab##
- WWW,也有人称它为WEB,是应用目前互联网上增长最快的网络信息服务,也是最方便和最受欢迎的信息服务类型。其最大的特点为集成性,它可以集成多
- 11月27日消息,据国外媒体报道,中国互联网络信息中心(CNNIC)日前发布的最新报告显示,腾讯网游用户占了中国大型网络游戏用户总人数的44
- 一、网站设计网站全站用W3C网站设计制作,采用DIV+CSS进行网页布局设计,title与meta字数控制在15字以上,少用图片、Flash
- 一、症状:根身份验证在 SSH 上起作用,使用 root 帐户登录 VMware 设备管理(VAMI),并且密码在 VCSA 6.7. x
- Hadoop streamingHadoop为MapReduce提供了不同的API,可以方便我们使用不同的编程语言来使用MapReduce框
- 从baidu去年宣布进军C2C,就猜到baidu作IM是迟早的事。因为要作C2C,肯定免不了IM工具。有了阿里他爸的旺旺的启发。BAIDU自
- 由中国互联网协会主办、工业和信息化部等部委指导的2008(第七届)中国互联网大会,于2008年9月23日至25日在南京会议展览中心召开。本届
- 四周的一切都在日新月异,只有我们的IT/软件行业似乎停滞不前或者步子太慢胆子太小变化太少,我们是在用联想电脑,但那只是联想的外衣,电脑的心是
- 安装前准备通过rpm命令检查centos上是否已经安装mysql,然后卸载已经存在的mysql版本[root@localhost src]#
- FTP服务是Internet上的标准服务之一,用来在网络上传输文件。在linux系统中,通常用wu-ftpd来实现该服务(www.wu-ft