go读取pptx文件

主要使用 “baliance.com/gooxml” 中的 presentation 包
原理:windows下pptx格式文件实际上是一个压缩包,打开之后可以看到具体的格式
下列代码主要是获取文件中的所有文本,如下:

package main

import (
	"fmt"
	"runtime"
	"time"
	"baliance.com/gooxml/presentation"
)

func main() {
	ppt, err := presentation.Open("测试.pptx")
	if err != nil {
		fmt.Println(err)
		return
	}
	//循环每页ppt
	for _, slide := range ppt.Slides() {
		//所有的控件
		for _, choice := range slide.X().CSld.SpTree.Choice {
			if choice.Sp == nil {
				continue
			}
			//一个文本框或一个控件
			for _, sp := range choice.Sp {
				if sp.TxBody == nil {
					continue
				}
				//数据
				for _, p := range sp.TxBody.P {
					textrun := p.EG_TextRun
					var text string
					//所有的EG_TextRun中的数据组合起来是一段
					for _, run := range textrun {
						if run.R != nil {
							text += run.R.T
						}
					}
					if len(text) == 0 {
						continue
					}
					//打印一段数据
					fmt.Println(text)
				}
			}
		}

	}
}

你可能感兴趣的:(Go,golang,开发语言,后端)