国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Rumah pembangunan bahagian belakang C++ Bagaimana untuk Mengekstrak Teks dengan Pemformatan daripada PDF Menggunakan iTextSharp?

Bagaimana untuk Mengekstrak Teks dengan Pemformatan daripada PDF Menggunakan iTextSharp?

Jan 11, 2025 am 10:46 AM

How to Extract Text with Formatting from PDFs Using iTextSharp?

Ekstrak teks berformat menggunakan iTextSharp

Pengenalan:

iTextSharp ialah perpustakaan yang berkuasa untuk memanipulasi dan menjana dokumen PDF, tetapi kadangkala sukar untuk mengekstrak teks dengan format yang dikehendaki. Artikel ini menyediakan kaedah untuk mengekstrak maklumat teks dan pemformatan daripada PDF menggunakan iTextSharp.

Strategi pengekstrakan tersuai:

Untuk mengekstrak teks berformat, anda boleh membuat pelaksanaan ITextExtractionStrategy tersuai. Dasar ini mentakrifkan cara maklumat pemaparan teks dikendalikan.

Coretan kod:

Kod berikut mentakrifkan strategi tersuai yang menjejaki perubahan dalam garis dasar, nama fon dan saiz fon serta menjana HTML dengan gaya yang sesuai:

<code>public class TextWithFontExtractionStategy : iTextSharp.text.pdf.parser.ITextExtractionStrategy
{
    // ... (此處省略)

    public void RenderText(iTextSharp.text.pdf.parser.TextRenderInfo renderInfo)
    {
        // 確定字體屬性
        string curFont = renderInfo.GetFont().PostscriptFontName;
        if (renderInfo.GetTextRenderMode() == (int)TextRenderMode.FillThenStrokeText)
        {
            curFont += "-Bold";
        }

        // 檢查基線、字體或字體大小的變化
        Vector curBaseline = renderInfo.GetBaseline().GetStartPoint();
        Single curFontSize = renderInfo.GetAscentLine().GetEndPoint()[Vector.I2] - curBaseline[Vector.I2];
        if ((this.lastBaseLine == null) || (curBaseline[Vector.I2] != lastBaseLine[Vector.I2]) ||
            (curFontSize != lastFontSize) || (curFont != lastFont))
        {
            // 生成帶有更新樣式的HTML span
            result.AppendFormat("</code>

Penggunaan:

Untuk menggunakan strategi tersuai, anda boleh menentukannya semasa mengekstrak teks:

<code>PdfReader reader = new PdfReader("MyDocument.pdf");
TextWithFontExtractionStategy strategy = new TextWithFontExtractionStategy();
string textWithFormatting = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);</code>

Output:

Pembolehubah

textWithFormatting akan mengandungi teks yang diekstrak dengan teg HTML yang mencerminkan maklumat pemformatan, termasuk fon dan saiz fon.

Kesimpulan:

Strategi pengekstrakan tersuai ini membolehkan anda mengekstrak teks PDF dengan format yang diingini. Ini ialah alat berkuasa yang boleh digunakan untuk menghasilkan semula teks dan gaya dengan tepat dalam dokumen PDF.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Teks dengan Pemformatan daripada PDF Menggunakan iTextSharp?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

C Polymorphism: Adakah fungsi melebih -lebihkan jenis polimorfisme? C Polymorphism: Adakah fungsi melebih -lebihkan jenis polimorfisme? Jun 20, 2025 am 12:05 AM

Ya, kelebihan fungsi adalah bentuk polimorfik dalam C, khususnya polimorfisme kompilasi masa. 1. Kelebihan fungsi membolehkan pelbagai fungsi dengan nama yang sama tetapi senarai parameter yang berbeza. 2. Pengkompil memutuskan yang berfungsi untuk memanggil pada masa penyusunan berdasarkan parameter yang disediakan. 3.

Apakah pelbagai jenis polimorfisme di C? Dijelaskan Apakah pelbagai jenis polimorfisme di C? Dijelaskan Jun 20, 2025 am 12:08 AM

C mempunyai dua jenis polimorf utama: polimorfisme kompilasi masa dan polimorfisme jangka masa. 1. Polimorfisme masa kompilasi dilaksanakan melalui fungsi overloading dan templat, memberikan kecekapan yang tinggi tetapi boleh menyebabkan kod kembung. 2. Polimorfisme runtime dilaksanakan melalui fungsi maya dan warisan, memberikan fleksibiliti tetapi overhead prestasi.

C: Adakah polimorfisme benar -benar berguna? C: Adakah polimorfisme benar -benar berguna? Jun 20, 2025 am 12:01 AM

Ya, polimorfisme di C sangat berguna. 1) Ia menyediakan fleksibiliti untuk membolehkan penambahan mudah jenis baru; 2) Menggalakkan penggunaan semula kod dan mengurangkan pertindihan; 3) Memudahkan penyelenggaraan, menjadikan kod lebih mudah untuk berkembang dan menyesuaikan diri dengan perubahan. Walaupun terdapat cabaran pengurusan prestasi dan memori, kelebihannya amat penting dalam sistem yang kompleks.

D Destructors: Kesalahan biasa D Destructors: Kesalahan biasa Jun 20, 2025 am 12:12 AM

C destructorscanleadtoSeveralCommonerrors.toavoidthem: 1) pencegahandoubledeletionbysettingpointerstonullptrorusingsmartpointers.2)

Polimorfisme di C: Panduan Komprehensif Dengan Contoh Polimorfisme di C: Panduan Komprehensif Dengan Contoh Jun 21, 2025 am 12:11 AM

Polimorfisme dalam C dibahagikan kepada polimorfisme runtime dan polimorfisme kompilasi masa. 1. Polimorfisme runtime dilaksanakan melalui fungsi maya, yang membolehkan kaedah yang betul dipanggil secara dinamik pada masa runtime. 2. Polimorfisme masa kompilasi dilaksanakan melalui fungsi overloading dan templat, memberikan prestasi dan fleksibiliti yang lebih tinggi.

C Tutorial untuk orang yang tahu python C Tutorial untuk orang yang tahu python Jul 01, 2025 am 01:11 AM

Orang yang belajar python pemindahan ke c kekeliruan yang paling langsung adalah: Mengapa anda tidak boleh menulis seperti python? Kerana C, walaupun sintaks lebih kompleks, menyediakan keupayaan kawalan asas dan kelebihan prestasi. 1. Dari segi struktur sintaks, C menggunakan pendakap kerinting {} dan bukannya lekukan untuk mengatur blok kod, dan jenis pembolehubah mesti diisytiharkan secara eksplisit; 2. Dari segi sistem jenis dan pengurusan ingatan, C tidak mempunyai mekanisme pengumpulan sampah automatik, dan perlu menguruskan memori secara manual dan memberi perhatian kepada melepaskan sumber. Teknologi RAII boleh membantu pengurusan sumber; 3. 4. Dari segi perpustakaan standard, STL menyediakan bekas dan algoritma yang kuat, tetapi perlu menyesuaikan diri dengan idea pengaturcaraan generik; 5

Apakah pelbagai bentuk polimorfisme di C? Apakah pelbagai bentuk polimorfisme di C? Jun 20, 2025 am 12:21 AM

C Polymorphisminkludescompile-time, runtime, andtemplatePolymorphism.1) compile-timePolymorphismusesfunctionandoperatoroveroveroverfiency.2) runtimepolymorphismemplempemplemplorfuntionsflonflexibility.3) TemplatePolymorphismenabenabenabenabenabenaben

C Polimorfisme: Gaya Pengekodan C Polimorfisme: Gaya Pengekodan Jun 19, 2025 am 12:25 AM

C Polymorphismisuniqueduetoitscombinationofcompile-timeandruntimePolymorphism, membolehkanforbotheficiencyandflexibility.toharnessitspowerstylishly: 1) menggunakanmartpointerslikestd :: unik_ptrformemorymanagement, 2)

See all articles