C# 如何合并和拆分PDF文件
作者:Dwaynerbing 发布时间:2023-08-19 21:37:33
标签:c#,合并,pdf,拆分
一、合并和拆分PDF文件的方式
PDF文件使用了工业标准的压缩算法,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页“,可以单独处理各页,特别适合多处理器系统的工作。PDF文件结构主要可以分为四个部分:首部、文件体、交叉引用表、尾部。PDF操作类库非常多,如下图所示,常用的类库有:Spire.Pdf、iTextSharp。
二、使用 Spire.Pdf 合并和拆分PDF文件
使用 Nuget 添加Spire.Pdf 类库,然后添加如下代码:
/// <summary>
/// 合并PDF文件
/// </summary>
/// <param name="files">待合并文件列表</param>
/// <param name="outFile">合并生成的文件名称</param>
static void SpirePdfMerge(string[] files, string outFile)
{
var doc = Spire.Pdf.PdfDocument.MergeFiles(files);
doc.Save(outFile, FileFormat.PDF);
}
/// <summary>
/// 按每页拆分PDF文件
/// </summary>
/// <param name="inFile">待拆分PDF文件名称</param>
static void SpirePdfSplit(string inFile)
{
var doc = new Spire.Pdf.PdfDocument(inFile);
doc.Split("SpirePdf_拆分-{0}.pdf");
doc.Close();
}
三、使用 iTextSharp 合并和拆分PDF文件
使用 Spire.Pdf 操作PDF文件,简单高效,但生成的PDF文件带有水印,即使使用破解版在第一页还是有水印,我们可以使用 iTextSharp 类库,该类库生成的PDF无水印,具体使用如下:
/// <summary>
/// 合并PDF文件
/// </summary>
/// <param name="inFiles">待合并文件列表</param>
/// <param name="outFile">合并生成的文件名称</param>
static void iTextSharpPdfMerge(List<String> inFiles, String outFile)
{
using (var stream = new FileStream(outFile, FileMode.Create))
{
using (var doc = new Document())
{
using (var pdf = new PdfCopy(doc, stream))
{
doc.Open();
inFiles.ForEach(file =>
{
var reader = new PdfReader(file);
for (int i = 0; i < reader.NumberOfPages; i++)
{
var page = pdf.GetImportedPage(reader, i + 1);
pdf.AddPage(page);
}
pdf.FreeReader(reader);
reader.Close();
});
}
}
}
}
/// <summary>
/// 按每页拆分PDF文件
/// </summary>
/// <param name="inFile">待拆分PDF文件名称</param>
static void iTextSharpPdfSplit(string inFile)
{
using (var reader = new PdfReader(inFile))
{
// 注意起始页是从1开始的
for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++)
{
using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i)))
{
var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create));
sourceDocument.Open();
var importedPage = pdfCopyProvider.GetImportedPage(reader, i);
pdfCopyProvider.AddPage(importedPage);
}
}
}
}
四、测试结果
完整代码如下:
using Spire.Pdf;
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net.Mime;
using System.Text;
using System.Threading.Tasks;
using iTextSharp.text;
using iTextSharp.text.pdf;
using PdfDocument = iTextSharp.text.pdf.PdfDocument;
namespace Pdf
{
class Program
{
static void Main(string[] args)
{
try
{
SpirePdfMerge(Directory.GetFiles("Merge"), "SpirePdfMerge.pdf");
Console.WriteLine("使用 Spire.Pdf 合并文件完成...");
SpirePdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\1.pdf");
Console.WriteLine("使用 Spire.Pdf 拆分文件完成...");
iTextSharpPdfMerge(Directory.GetFiles("Merge").ToList(), "iTextSharpPdfMerge.pdf");
Console.WriteLine("使用 iTextSharp 合并文件完成...");
iTextSharpPdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\2.pdf");
Console.WriteLine("使用 iTextSharp 拆分文件完成...");
}
catch (Exception e)
{
Console.WriteLine(e);
}
finally
{
Console.ReadKey();
}
}
#region Spire.Pdf
/// <summary>
/// 合并PDF文件
/// </summary>
/// <param name="files">待合并文件列表</param>
/// <param name="outFile">合并生成的文件名称</param>
static void SpirePdfMerge(string[] files, string outFile)
{
var doc = Spire.Pdf.PdfDocument.MergeFiles(files);
doc.Save(outFile, FileFormat.PDF);
}
/// <summary>
/// 按每页拆分PDF文件
/// </summary>
/// <param name="inFile">待拆分PDF文件名称</param>
static void SpirePdfSplit(string inFile)
{
var doc = new Spire.Pdf.PdfDocument(inFile);
doc.Split("SpirePdf_拆分-{0}.pdf");
doc.Close();
}
#endregion
#region iTextSharp.text.pdf
/// <summary>
/// 合并PDF文件
/// </summary>
/// <param name="inFiles">待合并文件列表</param>
/// <param name="outFile">合并生成的文件名称</param>
static void iTextSharpPdfMerge(List<String> inFiles, String outFile)
{
using (var stream = new FileStream(outFile, FileMode.Create))
{
using (var doc = new Document())
{
using (var pdf = new PdfCopy(doc, stream))
{
doc.Open();
inFiles.ForEach(file =>
{
var reader = new PdfReader(file);
for (int i = 0; i < reader.NumberOfPages; i++)
{
var page = pdf.GetImportedPage(reader, i + 1);
pdf.AddPage(page);
}
pdf.FreeReader(reader);
reader.Close();
});
}
}
}
}
/// <summary>
/// 按每页拆分PDF文件
/// </summary>
/// <param name="inFile">待拆分PDF文件名称</param>
static void iTextSharpPdfSplit(string inFile)
{
using (var reader = new PdfReader(inFile))
{
// 注意起始页是从1开始的
for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++)
{
using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i)))
{
var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create));
sourceDocument.Open();
var importedPage = pdfCopyProvider.GetImportedPage(reader, i);
pdfCopyProvider.AddPage(importedPage);
}
}
}
}
#endregion
}
}
测试效果如下图所示:
来源:https://www.cnblogs.com/dongweian/p/14305928.html


猜你喜欢
- 本文实例讲述了C#采用OpenXml实现给word文档添加文字的方法,分享给大家供大家参考。具体方法如下:一般来说,使用OpenXml给wo
- 一.导入方式由于jdk中没有servlet对应的jar包,所以需要咱们手动引入,有两种方式:1.可以采取向lib目录导入servlet-ap
- 一 前言最近网上比较火的代码生成器,知识追寻者抽空试试了一下,感觉不是友好,只能说功能比较呆板吧,还需要自己玩填空题,修修补补,然后再次打开
- 本文为大家分享了JSplitPane的使用方法,供大家参考,具体内容如下1、swing分割窗口控件JSplitPane,用来将窗口分割成两个
- 本文实例讲述了Android编程实现禁止系统锁屏与解锁亮屏的方法。分享给大家供大家参考,具体如下:需求:某个时刻任务执行完毕,关闭屏幕,某时
- 最近正好也没什么可忙的,就回过头来鼓捣过去的知识点,到Servlet部分时,以前学习的时候硬是把从上到下的继承关系和接口实现记得乱七八糟。这
- 这篇文章主要介绍了java多线程关键字final和static详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价
- Service是什么 Service是一个android 系统中的应用程序组件,它跟Activity的级别差不多,但是他没有图形化界面,不能
- 1 pom.xml文件注:热部署功能spring-boot-1.3开始有的<!--添加依赖--><dependency&g
- Java类加载全过程一个java文件从被加载到被卸载这个生命过程,总共要经历4个阶段:加载->链接(验证+准备+解析)->初始化
- ThreadLocal与线程成员变量还有区别,ThreadLocal该类提供了线程局部变量。这个局部变量与一般的成员变量不一样,Thread
- app的启动方式: 1.)冷启动 当启动应用时,后台没有该应用的进程,这时系统会重新创建一个新的进程分配给该应用,这个启
- 简介GraalVM是高性能的JDK,支持Java/Python/JavaScript等语言。它可以让Java变成二进制文件来执行,让程序在任
- 传统的Trie实现简单,但是占用的空间实在是难以接受,特别是当字符集不仅限于英文26个字符的时候, * 起来的空间根本无法接受。双数组Trie
- 这篇文章主要介绍了Springboot分页插件使用实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要
- 前言前面文章讲了消息是如何保存的以及consumeQueue与Index文件更新机制。随着消息的增加,Broker不可能一直保存所有消息,B
- Android中oncreate中获得控件高度或宽度的实现方法onCreate函数只是提供了数据初始化的机会,此时还没有正式绘制图形。在图形
- 本文参考借鉴:https://www.jb51.net/article/102983.htm先上效果图:自定义控件:AttendancePr
- 桥接模式概述桥接模式(Bridge Pattern)也称为桥梁模式、接口(Interfce)模式或柄体(Handle and Body)模式
- Android Bitmap详解及Bitmap的内存优化一、Bitmap:Bitmap是Android系统中的图像处理的最重要类之一。用它可