C#通过OLEDB导出大数据到Excel

        C#导出数据到Excel,基本有两种方法,一种方法是通过Microsoft.Office.Interop.Excel.Application,一行一列的写入Excel中;另一种方法是通过OLEDB,利用DataSet批量更新的放大写入Excel中。

        这两种方法各有用处。通过Microsoft.Office.Interop.Excel.Application传数据到Excel中,可以比较好的控制表格的格式,以便于直接 查看和打印,但效率低;通过OLEDB传数据到Excel中,格式不方便控制,但效率高。

        我最近在导出大数据时(750w用户数据,分城市导出,每个Excel文件只有一个sheet,其中最多1000条),通过Microsoft.Office.Interop.Excel.Application传数据到Excel中一直没有成功,这种方法通过COM传数据的方法存在内存释放以及FrameWork框架方面的问题;后来我通过OLEDB成功导出。


      1、准备工作:在磁盘中建立一个模版Excel文件,这个Excel文件的sheet1的第一行填写好表头。

      2、核心代码:

           2.1、 取出城市数据到 DataTable cityDt="所有城市并按id排序";

           2.2、文件存放的文件夹 fileOutFolder

          2.3、我把数据分在五台计算机上导出,于是有一个城市分类的方法

           private void city(int cityMode)
           {
                   int cityRowNum = cityDt.Rows.Count;
                   int cityColumnNum = cityDt.Columns.Count;
                  for (int i = 0; i < cityRowNum; i++)
                 {
                         if (i % 5 == cityMode)  fileOutOleDb(i);
                 }            
                 this.Close();
           }

         2.4、读取需要导出的城市的用户记录数

          private int  findUserCount(int cityId)

         {

                  读取数据库数据

        }

        2.5、读取相应页的用户数

        private DataTable findUser(int cityId,int int skipNum)

        {

              return DataTable("select * from user where id="+cityId.toString()+" limit "+skipNum.tostring+",1000");

        }

       2.6、导出Excel文件处理

 

        private void fileOutOleDb(int i)

        {

            int city_id = Convert.ToInt32(cityDt.Rows[i][0]);

            string city_ename = cityDt.Rows[i]["ename"].ToString();

            string city_name = cityDt.Rows[i]["ename"].ToString();

            int userCount = findUserCount(city_id);

            int pageCount = userCount / 1000;

            if (pageCount * 1000 < userCount) userCount += 1;

            int beginPageNo = 1;// Convert.ToInt32(textBox3.Text);

            int endPageNo = pageCount;// Convert.ToInt32(textBox4.Text);

            string curDirectory = fileOutFolder + "\\" + city_name;

            if (!Directory.Exists(curDirectory))

            {

                Directory.CreateDirectory(curDirectory);

            }



            for (int j = beginPageNo; j <= endPageNo; j++)

            {

                textBox2.Text = j.ToString();

                try

                {

                    //1、读出数据

                    DataTable tempdt = findUser(Convert.ToInt32(cityDt.Rows[i][0]), j * 1000);

                    //判断文件是否存在,不存在则拷贝一个文件

                    string fileFullName = curDirectory + "\\" + city_name + "_" + j.ToString() + ".xls";

                    if (!File.Exists(fileFullName))

                    {

                        File.Copy("d:\\model.xls", fileFullName);

                    }



                    //2、得到连接对象

                    string strCon = string.Format(@"Provider=Microsoft.ACE.OLEDB.12.0;Data Source={0};Extended Properties='Excel 12.0;HDR=YES;IMEX=0'", fileFullName);

                    OleDbConnection myConn = new OleDbConnection(strCon);

                    string strCom = "SELECT * FROM [Sheet1$]";

                    myConn.Open();

                    OleDbDataAdapter myDataAdapter = new OleDbDataAdapter(strCom, myConn);

                    DataSet myDataSet = new DataSet();

                    myDataAdapter.Fill(myDataSet, "[Sheet1$]");

                    myConn.Close();

                    DataTable dt = myDataSet.Tables[0]; //初始化DataTable实例

                    dt.PrimaryKey = new DataColumn[] { dt.Columns["id"] };//创建索引列



                    int rowNum = tempdt.Rows.Count;

                    int colNum = tempdt.Columns.Count;

                    for (int k = 0; k < rowNum; k++)

                    {

                        DataRow myRow = dt.NewRow();

                        for (int m = 0; m < colNum; m++) myRow[m] = tempdt.Rows[k][m];

                        dt.Rows.Add(myRow);

                    }

                    OleDbCommandBuilder odcb = new OleDbCommandBuilder(myDataAdapter);

                    odcb.QuotePrefix = "[";   //用于搞定INSERT INTO 语句的语法错误

                    odcb.QuoteSuffix = "]";



                    myDataAdapter.Update(myDataSet, "[Sheet1$]"); //更新数据集对应的表

                }

                catch

                {

                }

                if (j == pageCount) break;

                //System.Threading.Thread.Sleep(1000);

            }

        }


 

这个数据导出,有两个瓶颈,一个是读取数据,一个是一个城市数据量特别大。我导出100w的需要37分钟,开始导出非常快(20个文件,2W左右),到后面1分钟就2个文件了。


            

       

 

你可能感兴趣的:(Excel)