java读取word文档,获取文本内容,保留基本的换行格式。
java用POI对word进行解析。所需jar包,用maven引入
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.2-FINAL</version>
</dependency>
前端用webuploader上传控件,限制上传文件类型仅支持text和word.
txt为word的文本内容
⑵ Java中如何用I/O流读取一个Word文档的内容
添加spire.doc.jar为依赖,使用下面的代码可以读取word文档内容到txt文档
import com.spire.doc.Document;
import com.spire.doc.FileFormat;
import java.io.IOException;
public class ConvertWordToOtherFormats {
public static void main(String[] args) throws IOException {
//创建Document对象回
Document doc = new Document();
//加载Word文档
doc.loadFromFile("C:\Users\Administrator\Desktop\test.docx");
//将Word保存为TXT格式答
doc.saveToFile("ToTXT.txt",FileFormat.Txt);
}