PDF Text Reader für Excel Word Access
Die folgende COM Control Anwendung
kann in Ms Office Programme eingebunden werden um PDF Dokumente als Text zu
importieren.
Dabei muss man das COM
Control in den vba Makro Code einbinden und kann dann per einzelnem Aufruf den
Text-Inhalt einer Pdf Datei erhalten und anschliessend in das Excel oder Word
Dokument übernehmen
Anwendung:
in Excel Word Powerpoint Access
Betrifft:
Vba Makro Code, PDF Reader PDF Import
Code-Seite
Beispiel in Excel
Funktioniert auch in Ms Word, Office, Outlook, Powerpoint
Mit den Zeilen wird der PDF Reader
aufgerufen und der Text des PDF Dokuments als String ausgelesen
'< get PDF Text >
Dim pdf_Reader As New Pdf_Text_Reader.pdf_Reader
sText = pdf_Reader.get_Text(sFilename)
'</ get PDF Text >
|
Beispiel Code in vba
Option Explicit On
Public Sub Read_PDF_Text()
'------------< Read_PDF_Text() >------------
Dim ws As Worksheet
Set ws = ActiveSheet
Dim sFilename As String
sFilename = "C:\_Daten\Desktop\VS_Projects\ActiveX\Pdf_Text_Reader\_Test\PDF_Import_Excel.pdf"
Dim sText As String
'< get PDF Text >
Dim pdf_Reader As New Pdf_Text_Reader.pdf_Reader
sText = pdf_Reader.get_Text(sFilename)
'</ get PDF Text >
'----< Read as Lines >----
Dim arrLines
arrLines = Split(sText, vbLf)
Dim iLine As Integer
iLine = 1
Dim vLine
For Each vLine In arrLines
iLine = iLine + 1
ws.Cells(iLine + 20, 2).Value = vLine
Next
'----</ Read as Lines >----
'------------</ Read_PDF_Text() >------------
End Sub
|
Control
Einbinden
Hierzu muss man das folgende
COM Control einbinden
(im Anhang zum Download)
Zur Makro Code / Vba Code
seite kommt man mit Alt-F11
Vba-Code Seite ->Menü->Extras->Verweise
Und dann mit Durchsuchen die
Datei : Pdf_Text_Reader.tlb einbinden
Installation
Pdf_Text_Reader.dll
Der Pdf_Text_Reader ist eine
COM Control Datei, welche als .dll vorhanden ist. Die Anwendung verwendet
iTextSharp zum Auslesen des Textes.
Die Register.bat und
Unregister.bat dienen zur Installation auf dem Rechner.
Die folgenden Dateien werden
im Anhang benötigt.
Register.bat
Auf dem Zielrechner muss man die
Register.bat anpassen.
In der Register.bat steht der
Code zum Installieren auf dem PC
In der register.bat muss man
mit Bearbeiten den Pfad zur COM.dll Datei anpassen.
Einfach die xxxxx austauschen
gegen den Pfad, wo sich die Datei Pdf_Text_Reader.dll befindet
C:\Windows\Microsoft.NET\Framework\v4.0.30319\regasm.exe "C:\\xxxxxxxxxxx\Pdf_Text_Reader.dll"
/tlb /codebase
pause
|
Dann die Datei ausführen als
Administrator