C# NPOI Word .docx 内容读取

1、NPOI DLL 下载,现在https://archive.codeplex.com/?p=npoi 只能下载源码

      百度了一下 用VS 的Nuget 下载,VS2010   工具    外部扩展器   Nuget package manager 下载 安装  重启

2、新建项目   WordFileRead  在解决方案资源管理器  下引用,右键,管理Nuget程序包(N) 搜索NPOI  安装,在项目文件夹下

package 下对应文件夹有NPOI的DLL。

3、添加引用,编写按段落读取

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.Data;
using System.Reflection;
using Microsoft.Office.Interop.Word;
using System.IO;

using NPOI.XWPF.Model;
using NPOI.XWPF.Extractor;
using NPOI.XWPF.UserModel;

using NPOI.OpenXmlFormats.Wordprocessing;

namespace WordFileRead
{
    class Program
    {
        [STAThread]
        static void Main(string[] args)
        {
            OpenFileDialog ofd = new OpenFileDialog();
            ofd.InitialDirectory = "";
            ofd.Filter = "Word文件|*.docx";
            ofd.Multiselect = true;
            string[] WordUrl;//数据源路径集合
           
            DialogResult r = ofd.ShowDialog();
            if (r == DialogResult.OK)
            {
                WordUrl = ofd.FileNames;
            }
            else
            {
                return;
            }
            for (int i = 0; i < WordUrl.Length; i++)
            {
                string wordFile = "";
                wordFile = WordUrl[i];
                Stream stream = File.OpenRead(wordFile);
                XWPFDocument doc = new XWPFDocument(stream);
                foreach (var para in doc.Paragraphs)
                {
                    string text = para.ParagraphText; //获得文本
                    if(text.Trim()!="")
                    Console.WriteLine(text);
                }
            }
            Console.ReadLine();
        }
    }
}

你可能感兴趣的:(C#)