Inicio

Nosotros Nuestros Docentes Nuestros Asesores Nuestras política de privacidad y protección de datos personales Nuestros términos y condiciones Noticias Empleos

Cursos Certificación Linux Cursos Consultor SAP Cursos de Análisis de Datos Cursos de Gestión de Proyectos Cursos de Gestión y Optimización Empresarial Cursos Microsoft Cursos SAP

Diplomados Análisis de Datos Gestión Ágil de Proyectos con SCRUM y Lean Six Sigma Gestión de Proyectos Herramientas de Transformación digital SAP Integral SAP Minería

Otros Capacitación Corporativa Entrenamiento SAP Learning Hub Preguntas frecuentes Acceso a Sevidores SAP

Foro Contáctanos

Iniciar sesión

¡Caminando hacia el éxito!

Aprende en Comunidad

Avalados por :

¡Acceso SAP S/4HANA desde $100!

Acceso a SAP

Inicio
Preguntas
Cómo leer el contenido de un archivo PDF en Java: Tutorial paso a paso

Cómo leer el contenido de un archivo PDF en Java: Tutorial paso a paso

Crear

Creado 01/03/2024
Modificado 01/03/2024
632 Vistas

0

Hi

the scenario is File to Proxy, i have to read a pdf files content(all text) i have written the code

import java.io.IOException;

import java.io.FileReader;

import java.io.BufferedReader;

import java.io.*;

import org.apache.pdfbox.util.*;

import org.apache.pdfbox.pdmodel.*;

class ReadPdf

{

public static void main(String args[])

{

PDDocument pd;

BufferedWriter wr;

try {

File input = new File("original.pdf"); // The PDF file from where you would like to extract

File output = new File("SampleText.txt"); // The text file where you are going to store the extracted data

pd = PDDocument.load(input);

System.out.println(pd.getNumberOfPages()); //prints number of pages

System.out.println(pd.isEncrypted()); //false as not encrypted

pd.save("CopyOfOriginal.pdf"); // Creates a copy called "CopyOforiginal.pdf"

PDFTextStripper stripper = new PDFTextStripper();

stripper.setStartPage(1); //Start extracting from page 1

stripper.setEndPage(1); //Extract till page 1

wr = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(output)));

stripper.writeText(pd, wr);

if (pd != null) {

pd.close();

}

// I use close() to flush the stream.

wr.close();

}

catch (Exception e)

{

e.printStackTrace();

}

}

}

it works i have modified it to work in java mapping as

import java.io.InputStream;

import java.io.OutputStream;

import java.util.Map;

import java.util.HashMap;

import java.io.IOException;

import java.io.FileReader;

import java.io.BufferedReader;

import java.io.*;

import org.apache.pdfbox.util.*;

import org.apache.pdfbox.pdmodel.*;

import com.sap.aii.mapping.api.AbstractTransformation;

import com.sap.aii.mapping.api.StreamTransformationException;

import com.sap.aii.mapping.api.TransformationInput;

import com.sap.aii.mapping.api.TransformationOutput;

public class PdftoXml extends AbstractTransformation

{

public void transform(TransformationInput in, TransformationOutput out) throws StreamTransformationException

{

PDDocument pd;

BufferedWriter wr;

try {

pd = PDDocument.load(in.getInputPayload().getInputStream()); //convert Tranformationimput to inputstream than pass it to PDDocument constructor to read Pdf from Inputstream.

//System.out.println(pd.getNumberOfPages()); //prints number of pages

PDFTextStripper stripper = new PDFTextStripper();

stripper.setStartPage(1); //Start extracting from page 1

stripper.setEndPage(1); //Extract till page 1

String str = stripper.getText(pd);

String content[] = str.split("\n");

String result ="<?xml version=\"1.0\" encoding=\"UTF-8\"?>";

SAP PI

Pedro Pascal

Se unió el 07/03/2018

Responder

Facebook

Twitter

Pinterest

Telegram

Linkedin

Whatsapp

4 Respuestas

0

Solo necesitas agregar esos archivos JAR a la carpeta raíz del proyecto (en eclipse/nwds).

Haz clic derecho en la carpeta del proyecto (raíz) -> importar -> General (Archivo de Archivo) -> selecciona tu archivo JAR

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

0

Me alegra saberlo Vinay

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

0

Gracias, señor.

Tu blog fue increíble, pude probar mi archivo binario directamente en OM y obtuve el resultado.

Coloqué el archivo de la API de Apache tal como está con el nombre de pdfbox bajo el archivo importado y mi segundo archivo con el nombre de pdf pudo acceder a él.

El programa de mapeo de Java (el segundo) anterior está un poco equivocado.

result = result.concat("<field1>"+content[0]+"</field1>");

result = result.concat("<field2>"+content[1]+"</field1>");

result = result.concat("<field3>"+content[2]+"</field1>");

result = result.concat("<field4>"+content[3]+"</field1>");

Tiene que ser

result = result.concat("<field1>"+content[0]+"</field1>");

result = result.concat("<field2>"+content[1]+"</field2>");

result = result.concat("<field3>"+content[2]+"</field3>");

result = result.concat("<field4>"+content[3]+"</field4>");

Actualmente solo lee 4 líneas del pdf.

Saludos

Vinay

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

0

Hola Vinay,

Los archivos jar de la API externa deben formar parte de tu archivo de desarrollo de Java en la carpeta raíz.

También podrías utilizar el concepto de mi blog para probar directamente tu código de mapeo de Java desde el mapeo de interfaz/operación.

Saludos cordiales,

Praveen Gujjeti

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS

Nombre completo

Correo electrónico

Curso de interés

Celular

Etiquetas más populares

Preguntas más populares

¿Cuál es la diferencia entre las unidades PC y EA?

Estimado Experto, ¿Podrías por favor decirme amablemente cuál es la diferencia entre las unidades PC y EA? Parece que ambas significan cada una, todas... Gracias...

01/03/2024 · 10K+ Vistas · 2 Respuestas
Cómo modificar un archivo .apk existente: Guía paso a paso

Hoy me gustaría compartir contigo mis descubrimientos sobre cómo se puede modificar un archivo .apk existente. Un archivo .apk representa la aplicación móvil tal como está ins...

01/03/2024 · 18K+ Vistas · 1 Respuestas
Generación de Números de Tarjetas de Crédito Válidos para Pruebas: Amplía tus Horizontes de Testing

¿Has estado probando la funcionalidad de tarjetas de pago y alguna vez has pensado en conseguir más datos de prueba (números de tarjetas de crédito válidos) para expandir tus horizontes...

01/03/2024 · 34K+ Vistas · 0 Respuestas
Cómo Imprimir el Importe Total de una Factura en Letras: Ejemplo de Convertir 1500.00 a Mil Quinientos Pesos 00/100 M.N.

Hola ¿Qué tal? ¿Alguien sabe cómo puedo imprimir el importe total de una factura en letras? Ejemplo 1500.00 Mil Quinientos Pesos 00/100 M.N. Saludos...

01/03/2024 · 21K+ Vistas · 4 Respuestas
Cómo evitar y solucionar java.lang.NullPointerException en Java

Hola a todos, ¿Alguien puede decirme sobre java.lang.NullPointerException? Cuándo recibiremos este tipo de error y cómo solucionarlo. Si obtenemos este error, ¿dónde debemo...

01/03/2024 · 17K+ Vistas · 4 Respuestas

Partners:

Libro de reclamaciones

[email protected]

(+51) 1641 9379
(+57) 1489 6964

© 2025 Copyright. Todos los derechos reservados.

Desarrollado por Prime Institute

¡Hola! Soy Diana, asesora académica de Prime Institute, indícame en que curso estas interesado, saludos!

Hola ¿Puedo ayudarte?