


Comment extraire du texte avec formatage à partir de PDF à l'aide d'iTextSharp??
Jan 11, 2025 am 10:46 AMExtraire le texte formaté à l'aide d'iTextSharp
Introduction?:
iTextSharp est une bibliothèque puissante pour manipuler et générer des documents PDF, mais il est parfois difficile d'extraire du texte au format souhaité. Cet article fournit une méthode pour extraire le texte et les informations de formatage d'un PDF à l'aide d'iTextSharp.
Stratégie d'extraction personnalisée?:
Pour extraire du texte formaté, vous pouvez créer une implémentation ITextExtractionStrategy personnalisée. Cette stratégie définit la fa?on dont les informations de rendu du texte sont traitées.
Extrait de code?:
Le code suivant définit une stratégie personnalisée qui suit les modifications de la ligne de base, du nom de la police et de la taille de la police et génère du HTML avec le style approprié?:
<code>public class TextWithFontExtractionStategy : iTextSharp.text.pdf.parser.ITextExtractionStrategy { // ... (此處省略) public void RenderText(iTextSharp.text.pdf.parser.TextRenderInfo renderInfo) { // 確定字體屬性 string curFont = renderInfo.GetFont().PostscriptFontName; if (renderInfo.GetTextRenderMode() == (int)TextRenderMode.FillThenStrokeText) { curFont += "-Bold"; } // 檢查基線、字體或字體大小的變化 Vector curBaseline = renderInfo.GetBaseline().GetStartPoint(); Single curFontSize = renderInfo.GetAscentLine().GetEndPoint()[Vector.I2] - curBaseline[Vector.I2]; if ((this.lastBaseLine == null) || (curBaseline[Vector.I2] != lastBaseLine[Vector.I2]) || (curFontSize != lastFontSize) || (curFont != lastFont)) { // 生成帶有更新樣式的HTML span result.AppendFormat("</code>
Utilisation?:
Pour utiliser une stratégie personnalisée, vous pouvez la spécifier lors de l'extraction du texte?:
<code>PdfReader reader = new PdfReader("MyDocument.pdf"); TextWithFontExtractionStategy strategy = new TextWithFontExtractionStategy(); string textWithFormatting = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);</code>
Sortie?:
La variabletextWithFormatting contiendra le texte extrait avec des balises HTML reflétant les informations de formatage, y compris la police et la taille de la police.
Conclusion?:
Cette stratégie d'extraction personnalisée vous permet d'extraire du texte PDF au format souhaité. Il s'agit d'un outil puissant qui peut être utilisé pour reproduire avec précision le texte et les styles dans les documents PDF.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Oui, la surcharge de la fonction est une forme polymorphe en C, en particulier le polymorphisme à temps de compilation. 1. La surcharge de fonction permet plusieurs fonctions avec le même nom mais différentes listes de paramètres. 2. Le compilateur décide de la fonction à appeler au moment de la compilation en fonction des paramètres fournis. 3. Contrairement au polymorphisme d'exécution, la surcharge de fonction n'a pas de frais généraux supplémentaires au moment de l'exécution et est simple à implémenter mais moins flexible.

C a deux types polymorphes principaux: le polymorphisme à temps de compilation et le polymorphisme d'exécution. 1. Le polymorphisme à temps de compilation est implémenté par la surcharge et les modèles de fonction, offrant une efficacité élevée mais peut conduire à des ballonnements de code. 2. Le polymorphisme d'exécution est implémenté via des fonctions virtuelles et l'héritage, offrant une flexibilité mais des surcharges de performances.

Oui, les polymorphismes en C sont très utiles. 1) Il offre une flexibilité pour permettre une addition facile de nouveaux types; 2) favorise la réutilisation du code et réduit la duplication; 3) simplifie la maintenance, ce qui rend le code plus facile à développer et à s'adapter aux modifications. Malgré les défis des performances et de la gestion de la mémoire, ses avantages sont particulièrement importants dans les systèmes complexes.

C DestructorScanLeadtoseveralComMonErrors.toavoidThem: 1) empêcher lesDoubleleteTIeBySettingPointerStonullPtorUsingsMartPointers.2) manchexceptions indestructorycatchingandloggingthem.3) useVirtualDontructor

Les gens qui étudient le transfert de Python à C la confusion la plus directe est: pourquoi ne pouvez-vous pas écrire comme Python? Parce que C, bien que la syntaxe soit plus complexe, fournit des capacités de contr?le sous-jacentes et des avantages de performance. 1. En termes de structure de syntaxe, C utilise des accolades bouclées {} au lieu de l'indentation pour organiser les blocs de code, et les types de variables doivent être explicitement déclarés; 2. En termes de gestion du système et de la mémoire, C n'a pas de mécanisme de collecte de déchets automatique et doit gérer manuellement la mémoire et faire attention à la libération des ressources. La technologie RAII peut aider la gestion des ressources; 3. Dans les fonctions et les définitions de classe, C doit accéder explicitement aux modificateurs, constructeurs et destructeurs, et prend en charge des fonctions avancées telles que la surcharge de l'opérateur; 4. En termes de bibliothèques standard, STL fournit des conteneurs et des algorithmes puissants, mais doit s'adapter aux idées de programmation génériques; 5

Les polymorphismes en C sont divisés en polymorphismes d'exécution et en polymorphismes à temps de compilation. 1. Le polymorphisme d'exécution est implémenté via des fonctions virtuelles, permettant à la bonne méthode d'être appelée dynamiquement au moment de l'exécution. 2. Le polymorphisme à temps de compilation est implémenté par la surcharge et les modèles de fonction, offrant des performances et une flexibilité plus élevées.

C polymorphismisclusedescompile-time, runtime, andemplatepolymorphism.1) compile-timepolymormususFunctionandOperoLoloadingForefficiency.

C polymorphismismeniqueduetoittscombinationofcompile-timendruntimepolymorphism, permettant à la permission de Bothefficiency et de laFlexibilité.
