c# 提取word文件中的图片问题

最近遇到一个项目就是要从一份word中提取出所有的图片信息,功能看起来不是很难,只要使用office自带的Microsoft.Office.Interop.Word就可以解决问题。网上也有不少的文章来说明如何去实现。不过总体来说网上的内容分为两派一个是使用剪贴板来实现,一个是通过将图片转为byte数组来完成。个人倾向于后者,但是在实践过程中遇到了问题。

问题一:通过byte的方式来实现图片的提取会导致提取出来的图片的质量严重下降,这样的图片质量下降是无法通过修改图片质量的代码来优化和提高的。目前为止我还没有想到什么办法来很好的解决,只能是换方法来实现, 不过个人猜想是因为word中图片的dpi问题导致,因为原本很小的图片导出后就会变的很大(尺寸)。所以不得不使用剪贴板的方法来实现,但是用第一种方法也会有局限性。

下面分别的贴出实现的代码

 第一种,通过byte的方式,关键语句为(byte[])shape.Range.EnhMetaFileBits;

foreach (InlineShape shape  in  item.Range.InlineShapes)
{
   if  (shape.Type  ==  WdInlineShapeType.wdInlineShapePicture)
   {
     // 获取Word中的图片
     byte [] img  =  ( byte [])shape.Range.EnhMetaFileBits;
     Bitmap bmp  =   new  Bitmap( new  MemoryStream(img));
   }
}

 第二种,通过剪贴板,如下

 

foreach  (InlineShape shape  in  item.Range.InlineShapes)
{
    
// 判断类型
     if  (shape.Type  ==  WdInlineShapeType.wdInlineShapePicture)
    {
        
// 利用剪贴板保存数据
        shape.Select();  // 选定当前图片
        WordApp.Selection.Copy(); // copy当前图片
         if  (Clipboard.ContainsImage())
        {
            Bitmap bmp 
=   new  Bitmap(Clipboard.GetImage());
            fileName 
=  System.Guid.NewGuid()  +  defaultPicExtension;
            bmp.Save(savePath 
+  fileName, System.Drawing.Imaging.ImageFormat.Png);
        }
    }
}

 

问题二:通过控制台的方式编写程序可能会遇到剪贴板无法使用的事情,需要引用System.Window.Form来解决问题。
 

 

希望有经验的朋友可以帮忙解释一下第一种方法的问题所在,最后贴上实现的全部代码
 

 

private   void  bt_readreport_Click( object  sender, EventArgs e)
{
    
// 初始化控件值
    ClearControl();
    StringBuilder reportContent 
=   new  StringBuilder();

    
object  Nothing  =  System.Reflection.Missing.Value;
    
object  filename  =   " 文件完整路径和名称 " ;
    Microsoft.Office.Interop.Word.Application WordApp 
=   new  Microsoft.Office.Interop.Word.ApplicationClass();
    Microsoft.Office.Interop.Word.Document WordDoc 
=  WordApp.Documents.Open( ref  filename,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing,  ref  Nothing);
    
// 循环文章中的各个章节
     foreach  (Paragraph item  in  WordDoc.Paragraphs)
    {
        
if  (item  !=   null )
        {
            
if  (item.Range.Text.Trim()  !=   "" )
            {
                
// 判断该范围内是否存在图片
                 if  (item.Range.InlineShapes.Count  !=   0 )
                {
                    
foreach  (InlineShape shape  in  item.Range.InlineShapes)
                    {
                        
// 判断类型
                         if  (shape.Type  ==  WdInlineShapeType.wdInlineShapePicture)
                        {
                            
// 利用剪贴板保存数据
                            shape.Select();  // 选定当前图片
                            WordApp.Selection.Copy(); // copy当前图片
                             string  fileName  =   "" ;
                            
if  (Clipboard.ContainsImage())
                            {
                                Bitmap bmp 
=   new  Bitmap(Clipboard.GetImage());
                                fileName 
=  System.Guid.NewGuid()  +   " .png " ;
                                bmp.Save(savePath 
+  fileName, System.Drawing.Imaging.ImageFormat.Png);
                            }
                        }
                    }
                }
                
// 在总目录中添加相应信息
                reportContent.AppendLine(item.Range.Text.Trim());
            }
        }
    }
    WordDoc.Close(
ref  Nothing,  ref  Nothing,  ref  Nothing);
    WordApp.Quit(
ref  Nothing,  ref  Nothing,  ref  Nothing);
}
 

 对了,Png的效果要比JPG好,而且文件也不大,推荐使用

你可能感兴趣的:(优化,C#,null,Office,byte)