JAVA读取word文件
关键词 JAVA    word                                         
作者:bluerain                    QQ:89062647
1。读取word文件有两种方法,用hbase官方文档jacob包,可以修改生成word文件内容。如果只读取word里的文本内容的话,可以用poi读取word文件,先到/maven2/org/textmining/tm-extractors/下载tm-extractors-0.4.jar
2。读取word里的文本内容的示列代码
    import java.io.*;
    action.WordExtractor;
    public class TestPoi {
    public TestPoi() {
    }
    public static void main(String args[]) throws Exception
    {
        try{
    FileInputStream in = new FileInputStream ("D:/szqxjzhbase/doc/修改后/2001-2005/重大致灾暴雨/20050819-20/技术总结/2005820日一次大暴雨过程低空急流脉动与强降水关系分析 .doc");
        //  FileInputStream in = new FileInputStream ("D:/szqxjzhbase/技术测试/新建 Microsoft Word 文档.doc");
    WordExtractor extractor = new WordExtractor();
    System.out.println(in.available());
    String str = actText(in);
//    System.out.println("the result length is"+str.length());
    System.out.println(str);
        }catch(Exception e){
        e.printStackTrace();
    }
    }
    }
3。问题:有时候有图片读的时候会报个错,但在图片前面加个回车符号就好了,可能与这个包的内部机制有关
java 操作word而言,java2word 是我到的最强大好用的组件了

java2word 是一个在java程序中调用 MS Office Word 文档的组件(类库)。该组件提供了一组简单的接口,以便java程序调用他的服务操作Word 文档。

这些服务包括:

打开文档、新建文档、
查文字、替换文字,
插入文字、插入图片、插入表格,
在书签处插入文字、插入图片、插入表格等。
填充数据到表格中
读取表格数据

1.1版增强的功能:
指定文本样式,指定表格样式。如此,则可动态排版word文档。
填充表格数据时,可指定从哪行哪列开始填充。配合输入数据的大小,你可以修改表中的任意部分,甚至只修改一个单元格的内容。
合并单元格。

更多激动人心的功能见详细说明:
www.heavenlake/java2word/doc

下载地址:
dev.heavenlake:81/developer/viewthread?thread=24

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。