• C# 提取PPT文本和图片的实现方案


    在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。

    原文档:

    1. 提取文本

    步骤一:创建一个Presentation实例并加载文档

    Presentation presentation = new Presentation(@"C:UsersAdministratorDesktopsample.pptx", FileFormat.Pptx2010);

    步骤二:创建一个StringBuilder对象

    StringBuilder sb = new StringBuilder();

     步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容

    复制代码
     foreach (ISlide slide in presentation.Slides)
                {
                    foreach (IShape shape in slide.Shapes)
                    {
                        if (shape is IAutoShape)
                        {
                            foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
                            {
                                sb.Append(tp.Text + Environment.NewLine);
                            }
                        }
                    }
                }
    复制代码

    步骤四:写入Txt文档

     File.WriteAllText("target.txt", sb.ToString());
     Process.Start("target.txt");

    2. 提取图片

     这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。

         2.1提取所有图片

    步骤一:初始化一个Presentation类实例,并加载文档

     Presentation ppt = new Presentation();
     ppt.LoadFromFile(@"C:UsersAdministratorDesktopsample.pptx");

    步骤二:遍历文档中图片,提取图片并保存

     for (int i = 0; i < ppt.Images.Count; i++)
     {
         Image image = ppt.Images[i].Image;
         image.Save(string.Format(@"....Images{0}.png", i));
     }

    提取的图片已保存到项目文件夹下

           2.2.提取特定幻灯片中的图片

    步骤一:创建一个Presentation类实例,并加载文档

    Presentation PPT = new Presentation();
    PPT.LoadFromFile(@"C:UsersAdministratorDesktopsample.pptx");

    步骤二:获取第三张幻灯片,提取并保存图片

    复制代码
    int i = 0;
    foreach (IShape s in PPT.Slides[2].Shapes)
    {
        if (s is SlidePicture)
        {
            SlidePicture ps = s as SlidePicture;
            ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
            i++;
        }
        if (s is PictureShape)
        {
            PictureShape ps = s as PictureShape;
            ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
            i++;
        }
    }
    复制代码

    提取的第三张幻灯片中的图片已保存至指定位置

  • 相关阅读:
    数据结构与算法之PHP实现二叉树的遍历
    数据结构与算法之二叉树的基本概念和类型
    JS实现下拉单的二级联动
    数据结构与算法之PHP实现队列、栈
    数据结构与算法之PHP实现链表类(单链表/双链表/循环链表)
    数据结构与算法之数组、链表、队列、栈
    大型网站架构总结
    MySQL分库分表
    C基础 那些年用过的奇巧淫技
    C高级 服务器内核分析和构建 (一)
  • 原文地址:https://www.cnblogs.com/zzp0320/p/7890348.html
Copyright © 2020-2023  润新知