java讀取word文檔,獲取文本內容,保留基本的換行格式。
java用POI對word進行解析。所需jar包,用maven引入
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.2-FINAL</version>
</dependency>
前端用webuploader上傳控制項,限制上傳文件類型僅支持text和word.
txt為word的文本內容
⑵ Java中如何用I/O流讀取一個Word文檔的內容
添加spire.doc.jar為依賴,使用下面的代碼可以讀取word文檔內容到txt文檔
import com.spire.doc.Document;
import com.spire.doc.FileFormat;
import java.io.IOException;
public class ConvertWordToOtherFormats {
public static void main(String[] args) throws IOException {
//創建Document對象回
Document doc = new Document();
//載入Word文檔
doc.loadFromFile("C:\Users\Administrator\Desktop\test.docx");
//將Word保存為TXT格式答
doc.saveToFile("ToTXT.txt",FileFormat.Txt);
}