Inicio

Nosotros Nuestros Docentes Nuestros Asesores Nuestras política de privacidad y protección de datos personales Nuestros términos y condiciones Noticias Empleos

Cursos Certificación Linux Cursos Consultor SAP Cursos de Análisis de Datos Cursos de Gestión de Proyectos Cursos de Gestión y Optimización Empresarial Cursos Microsoft Cursos SAP

Diplomados Análisis de Datos Gestión Ágil de Proyectos con SCRUM y Lean Six Sigma Gestión de Proyectos Herramientas de Transformación digital SAP Integral SAP Minería

Otros Capacitación Corporativa Entrenamiento SAP Learning Hub Preguntas frecuentes Acceso a Sevidores SAP

Foro Contáctanos

Iniciar sesión

¡Caminando hacia el éxito!

Aprende en Comunidad

Avalados por :

¡Acceso SAP S/4HANA desde $100!

Acceso a SAP

Inicio
Preguntas
Como ler o conteúdo de um arquivo PDF em Java: Tutorial passo a passo

Como ler o conteúdo de um arquivo PDF em Java: Tutorial passo a passo

Crear

Creado 01/03/2024
Modificado 01/03/2024
192 Vistas

0

Olá

o cenário é de Arquivo para Proxy, tenho que ler o conteúdo de arquivos PDF (todo o texto) e escrevi o código

import java.io.IOException;

import java.io.FileReader;

import java.io.BufferedReader;

import java.io.*;

import org.apache.pdfbox.util.*;

import org.apache.pdfbox.pdmodel.*;

class ReadPdf

{

public static void main(String args[])

{

PDDocument pd;

BufferedWriter wr;

try {

File input = new File("original.pdf"); // O arquivo PDF de onde você gostaria de extrair

File output = new File("SampleText.txt"); // O arquivo de texto onde você vai armazenar os dados extraídos

pd = PDDocument.load(input);

System.out.println(pd.getNumberOfPages()); //imprime o número de páginas

System.out.println(pd.isEncrypted()); //falso pois não está criptografado

pd.save("CopyOfOriginal.pdf"); // Cria uma cópia chamada "CopyOforiginal.pdf"

PDFTextStripper stripper = new PDFTextStripper();

stripper.setStartPage(1); //Começa a extrair da página 1

stripper.setEndPage(1); //Extrai até a página 1

wr = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(output)));

stripper.writeText(pd, wr);

if (pd != null) {

pd.close();

}

// Eu uso close() para limpar o fluxo.

wr.close();

}

}

está funcionando, modifiquei para funcionar no mapeamento de java como

import java.io.InputStream;

import java.io.OutputStream;

import java.util.Map;

import java.util.HashMap;

import java.io.IOException;

import java.io.FileReader;

import java.io.BufferedReader;

import java.io.*;

import org.apache.pdfbox.util.*;

import org.apache.pdfbox.pdmodel.*;

import com.sap.aii.mapping.api.AbstractTransformation;

import com.sap.aii.mapping.api.StreamTransformationException;

import com.sap.aii.mapping.api.TransformationInput;

import com.sap.aii.mapping.api.TransformationOutput;

public class PdftoXml extends AbstractTransformation

{

public void transform(TransformationInput in, TransformationOutput out) throws StreamTransformationException

{

PDDocument pd;

BufferedWriter wr;

try {

pd = PDDocument.load(in.getInputPayload().getInputStream()); //converter Tranformationimput para inputstream e passá-lo para o construtor PDDocument para ler o PDF do Inputstream.

//System.out.println(pd.getNumberOfPages()); //imprime o número de páginas

PDFTextStripper stripper = new PDFTextStripper();

stripper.setStartPage(1); //Começa a extrair da página 1

stripper.setEndPage(1); //Extrai até a página 1

String str = stripper.getText(pd);

String content[] = str.split("\n");

String result ="<?xml version=\"1.0\" encoding=\"UTF-8\"?>";

SAP PI

Pedro Pascal

Se unió el 07/03/2018

Responder

Facebook

Twitter

Pinterest

Telegram

Linkedin

Whatsapp

4 Respuestas

0

Basta adicionar esses arquivos JAR à pasta raiz do projeto (no eclipse/nwds).

Clique com o botão direito na pasta do projeto (raiz) -> Importar -> Geral (Arquivo de Arquivo) -> selecione seu arquivo JAR

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

0

Fico feliz em saber, Vinay

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

0

Obrigado, senhor.

Seu blog foi incrível, pude testar meu arquivo binário diretamente no OM e obtive o resultado.

Coloquei o arquivo da API do Apache exatamente como está, com o nome de pdfbox sob o arquivo importado e meu segundo arquivo com o nome de pdf conseguiu acessá-lo.

O programa de mapeamento Java (o segundo) anterior está um pouco equivocado.

result = result.concat("<field1>"+content[0]+"</field1>");

result = result.concat("<field2>"+content[1]+"</field1>");

result = result.concat("<field3>"+content[2]+"</field1>");

result = result.concat("<field4>"+content[3]+"</field1>");

Deve ser

result = result.concat("<field1>"+content[0]+"</field1>");

result = result.concat("<field2>"+content[1]+"</field2>");

result = result.concat("<field3>"+content[2]+"</field3>");

result = result.concat("<field4>"+content[3]+"</field4>");

Atualmente, lê apenas 4 linhas do pdf.

Saudações

Vinay

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

0

Olá Vinay,

Os arquivos jar da API externa devem fazer parte do seu arquivo de desenvolvimento Java na pasta raiz.

Você também pode usar o conceito do meu blog para testar diretamente seu código de mapeamento Java a partir do mapeamento de interface/operação.

Atenciosamente,

Praveen Gujjeti

Respondido el 15/04/2024

LUCIANO RIOJA GHIOTTO

Se unió el 13/07/2019

Agregar

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS

Nombre completo

Correo electrónico

Curso de interés

Celular

Etiquetas más populares

SAP Netweaver JAVA 7.50 Basado en HANA × 2
SAP FS BANKING × 2
SuccessFactors × 2
SAP Adobe Forms × 10
SAP Cloud Application Studio × 2
SAP NWDS × 18

Preguntas más populares

¿Cuál es la diferencia entre las unidades PC y EA?

Estimado Experto, ¿Podrías por favor decirme amablemente cuál es la diferencia entre las unidades PC y EA? Parece que ambas significan cada una, todas... Gracias...

01/03/2024 · 10K+ Vistas · 2 Respuestas
Cómo modificar un archivo .apk existente: Guía paso a paso

Hoy me gustaría compartir contigo mis descubrimientos sobre cómo se puede modificar un archivo .apk existente. Un archivo .apk representa la aplicación móvil tal como está ins...

01/03/2024 · 18K+ Vistas · 1 Respuestas
Generación de Números de Tarjetas de Crédito Válidos para Pruebas: Amplía tus Horizontes de Testing

¿Has estado probando la funcionalidad de tarjetas de pago y alguna vez has pensado en conseguir más datos de prueba (números de tarjetas de crédito válidos) para expandir tus horizontes...

01/03/2024 · 34K+ Vistas · 0 Respuestas
Cómo Imprimir el Importe Total de una Factura en Letras: Ejemplo de Convertir 1500.00 a Mil Quinientos Pesos 00/100 M.N.

Hola ¿Qué tal? ¿Alguien sabe cómo puedo imprimir el importe total de una factura en letras? Ejemplo 1500.00 Mil Quinientos Pesos 00/100 M.N. Saludos...

01/03/2024 · 21K+ Vistas · 4 Respuestas
Cómo evitar y solucionar java.lang.NullPointerException en Java

Hola a todos, ¿Alguien puede decirme sobre java.lang.NullPointerException? Cuándo recibiremos este tipo de error y cómo solucionarlo. Si obtenemos este error, ¿dónde debemo...

01/03/2024 · 17K+ Vistas · 4 Respuestas

Partners:

Libro de reclamaciones

[email protected]

(+51) 1641 9379
(+57) 1489 6964

© 2025 Copyright. Todos los derechos reservados.

Desarrollado por Prime Institute

¡Hola! Soy Diana, asesora académica de Prime Institute, indícame en que curso estas interesado, saludos!

Hola ¿Puedo ayudarte?