如何使用C#讀取PDF文件
在本篇文章中,我們將介紹如何使用C#語言來讀取PDF文件。我們將包括讀取PDF全部文本內(nèi)容、讀取指定區(qū)域的文本內(nèi)容以及讀取PDF中的圖片。 下載并安裝Spire.Pdf.dll類庫 首先,你需要下
在本篇文章中,我們將介紹如何使用C#語言來讀取PDF文件。我們將包括讀取PDF全部文本內(nèi)容、讀取指定區(qū)域的文本內(nèi)容以及讀取PDF中的圖片。
下載并安裝Spire.Pdf.dll類庫
首先,你需要下載并安裝Spire.Pdf.dll類庫。你可以從安裝路徑下的Bin文件夾獲取dll文件。然后,在你的項(xiàng)目中引用該dll文件。
讀取PDF文件的全部文本內(nèi)容
以下是一個(gè)示例代碼,演示了如何使用C#讀取PDF文件的全部文本內(nèi)容:
using Spire.Pdf;
using System;
using ;
using System.Text;
namespace ExtractText_PDF
{
class Program
{
static void Main(string[] args)
{
//實(shí)例化PdfDocument類對(duì)象,并加載PDF文檔
PdfDocument doc new PdfDocument();
doc.LoadFromFile("sample.pdf");
//實(shí)例化一個(gè)StringBuilder對(duì)象
StringBuilder content new StringBuilder();
//遍歷文檔所有PDF頁面,提取文本
foreach (PdfPageBase page in )
{
(page.ExtractText());
}
//將提取到的文本寫為.txt格式并保存到本地路徑
String fileName "獲取文本.txt";
File.WriteAllText(fileName, ());
("獲取文本.txt");
}
}
}
讀取PDF文件中的指定區(qū)域文本內(nèi)容
以下是一個(gè)示例代碼,演示了如何使用C#讀取PDF文件中的指定區(qū)域文本內(nèi)容:
using Spire.Pdf;
using ;
using System.Text;
using System.Drawing;
namespace ExtractText1_PDF
{
class Program
{
static void Main(string[] args)
{
//創(chuàng)建PdfDocument類實(shí)例,并加載PDF文檔
PdfDocument pdf new PdfDocument();
pdf.LoadFromFile("sample.pdf");
//獲取PDF第一頁
PdfPageBase page [0];
//從第一頁的指定矩形區(qū)域內(nèi)提取文本
string text page.ExtractText(new RectangleF(50, 50, 500, 170));
//保存文本到.txt文件,并打開文檔
StringBuilder sb new StringBuilder();
(text);
File.WriteAllText("Extract.txt", ());
("Extract.txt");
}
}
}
讀取PDF文件中的圖片
以下是一個(gè)示例代碼,演示了如何使用C#讀取PDF文件中的圖片:
using Spire.Pdf;
using ;
using System.Drawing;
namespace ExtractImages_PDF
{
class Program
{
static void Main(string[] args)
{
//創(chuàng)建一個(gè)PdfDocument類對(duì)象,加載PDF測(cè)試文檔
PdfDocument doc new PdfDocument();
doc.LoadFromFile("sample.pdf");
//聲明List類對(duì)象
Listlt;Imagegt; ListImage new Listlt;Imagegt;();
//遍歷PDF文檔所有頁面
for (int i 0; i lt; ; i )
{
//獲取文檔所有頁,并提取頁面中的所有圖片
PdfPageBase page [i];
Image[] images page.ExtractImages();
if (images ! null images.Length gt; 0)
{
(images);
}
}
//將獲取到的圖片保存到本地路徑
if ( gt; 0)
{
for (int i 0; i lt; ; i )
{
Image image ListImage[i];
("image" (i 1).ToString() ".png", );
}
//打開獲取到的