软件编程
位置:首页>> 软件编程>> C#编程>> C# 如何合并和拆分PDF文件

C# 如何合并和拆分PDF文件

作者:Dwaynerbing  发布时间:2023-08-19 21:37:33 

标签:c#,合并,pdf,拆分

一、合并和拆分PDF文件的方式

    PDF文件使用了工业标准的压缩算法,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页“,可以单独处理各页,特别适合多处理器系统的工作。PDF文件结构主要可以分为四个部分:首部、文件体、交叉引用表、尾部。PDF操作类库非常多,如下图所示,常用的类库有:Spire.Pdf、iTextSharp。

C# 如何合并和拆分PDF文件

二、使用 Spire.Pdf 合并和拆分PDF文件

      使用 Nuget 添加Spire.Pdf 类库,然后添加如下代码:


/// <summary>
   /// 合并PDF文件
   /// </summary>
   /// <param name="files">待合并文件列表</param>
   /// <param name="outFile">合并生成的文件名称</param>
   static void SpirePdfMerge(string[] files, string outFile)
   {
     var doc = Spire.Pdf.PdfDocument.MergeFiles(files);
     doc.Save(outFile, FileFormat.PDF);
   }

/// <summary>
   /// 按每页拆分PDF文件
   /// </summary>
   /// <param name="inFile">待拆分PDF文件名称</param>
   static void SpirePdfSplit(string inFile)
   {
     var doc = new Spire.Pdf.PdfDocument(inFile);
     doc.Split("SpirePdf_拆分-{0}.pdf");
     doc.Close();
   }

三、使用 iTextSharp 合并和拆分PDF文件

      使用 Spire.Pdf 操作PDF文件,简单高效,但生成的PDF文件带有水印,即使使用破解版在第一页还是有水印,我们可以使用  iTextSharp 类库,该类库生成的PDF无水印,具体使用如下:


/// <summary>
   /// 合并PDF文件
   /// </summary>
   /// <param name="inFiles">待合并文件列表</param>
   /// <param name="outFile">合并生成的文件名称</param>
   static void iTextSharpPdfMerge(List<String> inFiles, String outFile)
   {
     using (var stream = new FileStream(outFile, FileMode.Create))
     {
       using (var doc = new Document())
       {
         using (var pdf = new PdfCopy(doc, stream))
         {
           doc.Open();
           inFiles.ForEach(file =>
           {
             var reader = new PdfReader(file);
             for (int i = 0; i < reader.NumberOfPages; i++)
             {
               var page = pdf.GetImportedPage(reader, i + 1);
               pdf.AddPage(page);
             }
             pdf.FreeReader(reader);
             reader.Close();
           });
         }
       }
     }
   }

/// <summary>
   /// 按每页拆分PDF文件
   /// </summary>
   /// <param name="inFile">待拆分PDF文件名称</param>
   static void iTextSharpPdfSplit(string inFile)
   {
     using (var reader = new PdfReader(inFile))
     {
       // 注意起始页是从1开始的
       for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++)
       {
         using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i)))
         {
           var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create));
           sourceDocument.Open();
           var importedPage = pdfCopyProvider.GetImportedPage(reader, i);
           pdfCopyProvider.AddPage(importedPage);
         }
       }
     }
   }

四、测试结果

      完整代码如下:


using Spire.Pdf;
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net.Mime;
using System.Text;
using System.Threading.Tasks;
using iTextSharp.text;
using iTextSharp.text.pdf;
using PdfDocument = iTextSharp.text.pdf.PdfDocument;

namespace Pdf
{
 class Program
 {
   static void Main(string[] args)
   {
     try
     {
       SpirePdfMerge(Directory.GetFiles("Merge"), "SpirePdfMerge.pdf");
       Console.WriteLine("使用 Spire.Pdf 合并文件完成...");

SpirePdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\1.pdf");
       Console.WriteLine("使用 Spire.Pdf 拆分文件完成...");

iTextSharpPdfMerge(Directory.GetFiles("Merge").ToList(), "iTextSharpPdfMerge.pdf");
       Console.WriteLine("使用 iTextSharp 合并文件完成...");

iTextSharpPdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\2.pdf");
       Console.WriteLine("使用 iTextSharp 拆分文件完成...");

}
     catch (Exception e)
     {
       Console.WriteLine(e);
     }
     finally
     {
       Console.ReadKey();
     }
   }

#region Spire.Pdf

/// <summary>
   /// 合并PDF文件
   /// </summary>
   /// <param name="files">待合并文件列表</param>
   /// <param name="outFile">合并生成的文件名称</param>
   static void SpirePdfMerge(string[] files, string outFile)
   {
     var doc = Spire.Pdf.PdfDocument.MergeFiles(files);
     doc.Save(outFile, FileFormat.PDF);
   }

/// <summary>
   /// 按每页拆分PDF文件
   /// </summary>
   /// <param name="inFile">待拆分PDF文件名称</param>
   static void SpirePdfSplit(string inFile)
   {
     var doc = new Spire.Pdf.PdfDocument(inFile);
     doc.Split("SpirePdf_拆分-{0}.pdf");
     doc.Close();
   }

#endregion

#region iTextSharp.text.pdf

/// <summary>
   /// 合并PDF文件
   /// </summary>
   /// <param name="inFiles">待合并文件列表</param>
   /// <param name="outFile">合并生成的文件名称</param>
   static void iTextSharpPdfMerge(List<String> inFiles, String outFile)
   {
     using (var stream = new FileStream(outFile, FileMode.Create))
     {
       using (var doc = new Document())
       {
         using (var pdf = new PdfCopy(doc, stream))
         {
           doc.Open();
           inFiles.ForEach(file =>
           {
             var reader = new PdfReader(file);
             for (int i = 0; i < reader.NumberOfPages; i++)
             {
               var page = pdf.GetImportedPage(reader, i + 1);
               pdf.AddPage(page);
             }
             pdf.FreeReader(reader);
             reader.Close();
           });
         }
       }
     }
   }

/// <summary>
   /// 按每页拆分PDF文件
   /// </summary>
   /// <param name="inFile">待拆分PDF文件名称</param>
   static void iTextSharpPdfSplit(string inFile)
   {
     using (var reader = new PdfReader(inFile))
     {
       // 注意起始页是从1开始的
       for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++)
       {
         using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i)))
         {
           var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create));
           sourceDocument.Open();
           var importedPage = pdfCopyProvider.GetImportedPage(reader, i);
           pdfCopyProvider.AddPage(importedPage);
         }
       }
     }
   }

#endregion

}
}

      测试效果如下图所示:

C# 如何合并和拆分PDF文件

来源:https://www.cnblogs.com/dongweian/p/14305928.html

0
投稿

猜你喜欢

手机版 软件编程 asp之家 www.aspxhome.com