Leer una plantilla word con java
Publicado por paricia (2 intervenciones) el 07/08/2007 23:21:32
Genet necesito leer secciones de una plantilla word , con extension .doc
intente con POI mediante estas sentencias
WordDocument wd = new WordDocument("c:\\midocumento.doc");
StringWriter docTextWriter = new StringWriter();
wd.writeAllText(new PrintWriter(docTextWriter));
docTextWriter.close();
String text = docTextWriter.toString();
System.out.println(text);
pero el resultado obtenido era algo asi:
"Versión 1.0Historial de Revisiones
FechaVersiónDescripciónAutor25/07/20071.0CotizaciónAlejandro R
Tabla de Contenido
1. Identificación. 4"
Como no era lo que esperaba, lo que hice fueintentar con textmining.text.extraction.WordExtractor;
FileInputStream in = new FileInputStream ("c:\\midocumento.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
System.out.println(str);
Con igual resultado, si fuera textoplano no hay problema o un archivo gord con solo texto lo lee, el problema aca es la plantilla
les agradezco cualquier ayuda
gracias
Patricia
intente con POI mediante estas sentencias
WordDocument wd = new WordDocument("c:\\midocumento.doc");
StringWriter docTextWriter = new StringWriter();
wd.writeAllText(new PrintWriter(docTextWriter));
docTextWriter.close();
String text = docTextWriter.toString();
System.out.println(text);
pero el resultado obtenido era algo asi:
"Versión 1.0Historial de Revisiones
FechaVersiónDescripciónAutor25/07/20071.0CotizaciónAlejandro R
Tabla de Contenido
1. Identificación. 4"
Como no era lo que esperaba, lo que hice fueintentar con textmining.text.extraction.WordExtractor;
FileInputStream in = new FileInputStream ("c:\\midocumento.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
System.out.println(str);
Con igual resultado, si fuera textoplano no hay problema o un archivo gord con solo texto lo lee, el problema aca es la plantilla
les agradezco cualquier ayuda
gracias
Patricia
Valora esta pregunta


0