Java - Leer una plantilla word con java

 
Vista:

Leer una plantilla word con java

Publicado por paricia (2 intervenciones) el 07/08/2007 23:21:32
Genet necesito leer secciones de una plantilla word , con extension .doc
intente con POI mediante estas sentencias

WordDocument wd = new WordDocument("c:\\midocumento.doc");
StringWriter docTextWriter = new StringWriter();
wd.writeAllText(new PrintWriter(docTextWriter));
docTextWriter.close();
String text = docTextWriter.toString();
System.out.println(text);

pero el resultado obtenido era algo asi:

"Versión 1.0 Historial de Revisiones

FechaVersiónDescripciónAutor25/07/20071.0CotizaciónAlejandro R
Tabla de Contenido
1. Identificación. 4"

Como no era lo que esperaba, lo que hice fueintentar con textmining.text.extraction.WordExtractor;

FileInputStream in = new FileInputStream ("c:\\midocumento.doc");
WordExtractor extractor = new WordExtractor();

String str = extractor.extractText(in);
System.out.println(str);

Con igual resultado, si fuera textoplano no hay problema o un archivo gord con solo texto lo lee, el problema aca es la plantilla

les agradezco cualquier ayuda

gracias
Patricia
Valora esta pregunta
Me gusta: Está pregunta es útil y esta claraNo me gusta: Está pregunta no esta clara o no es útil
0
Responder