第17课:RPA追加写入未知行的表格(练兵场四)


▼课程概要:在网页上应用获取元素文本获取了多条内容,需要写入Excel表格,并且每次写入时在上次写入的基础上加一行写入,即追加写入。



★练兵介绍

启动谷歌浏览器,打开百度并搜索"七点遇见"。进入第一条搜索内容七点遇见-知乎的主页,先用数据抓取命令获取当页所有标题内容,再用数据抓取命令获取所有正文内容;新建名为"七点遇见"的工作簿,将两次获取的结果追加写入表格。

所需命令:启动浏览器、等待元素、点击目标、数据抓取、打开Excel工作簿、获取行数、写入区域。★动作拆分

▼启动浏览器并进入"七点遇见"知乎首页

前面几节课已详细讲过,这里鹏飞老师只贴出代码。
注意每次跳转页面的时候,需要加一条"等待元素"的命令,提高程序稳定性;注意每条命令加好注释,提高代码可读性。

▼数据抓取标题和正文内容

应用数据抓取功能,注意标题和正文并不是相同的块级目标,需要分别抓取。这里我们复习下数据抓取命令。----点击标题栏的数据抓取命令。
----选择标题目标,再选择相同的层级标题目标。这里第二次选择的目标可以是相邻的标题即可,不用选择最后一个标题。
----我们想获取的是文本内容,只勾选文字即可,本次不勾选链接。
----此时可看到抓取数据成功,点击下一步即可。
----本次只抓取当页数据,点击完成即可结束。

标题内容得到了,使用数据抓取功能再次抓取正文即可,这里不再演示。

▼新建工作簿并追加写入

----新建名为"七点遇见"的工作簿使用的是打开Excel工作簿的命令,配置路径为源目录文件夹。老师采用的是@res"七点遇见.xlsx"的写法。不懂的同学没关系,下节课鹏飞老师用一节课时间讲解路径的事情。先照葫芦画瓢写上。这里注意新建工作簿和打开工作簿都是这条命令。
----清除区域写入前必要的操作。因为并不是我们打开的表格一定是空白的。所以写入前先使用清除区域命令清除原有数据。但这里我们要先做一件事。因为区域是类似"A1:B2"这种形式的,B2中的"2"表示最后行数。因此,我们需要先获取现在的表格行数srow,然后拼接区域为"A1:B"&srow进行数据清除。
获取行数要一如既往的注意工作簿对象和工作表名是否正确。下面就可以清除区域了。
配置区域为"A1:B"&srow,同样注意两坑:工作簿对象和工作表名。----写入标题数据抓取得到的结果为二维数组,写入时需要的命令为写入区域。
因为原始表格为空白的,写入的开始单元格为A1即可,数据为之前抓取赋值的变量arrayData1,同样注意两坑。好,敲黑板,划重点!现在开始追加写入正文内容了,该如何实现呢?追加写入,就是在现有行数的基础上再加一行开始写入。所以第一步要做的是再次获取现有行数。----获取行数
----拼接区域写入标题同样需要使用写入区域命令。该命令需要配置的主要内容为开始单元格。追加写入,开始单元格应为A列、原有行数+1行(即刚获取的行数srow),拼接后应为"A"&srow+1。数据应为抓取赋予的变量arrayData2。因此配置写入正文内容的代码应这样写:

▼关闭工作簿

默认是自动保存的。程序编写结束。

★明日预告路径的使用方法。你学会了嘛?下课!

往期推荐

第12课:如何应用RPA读写数据?

第13课:表格追加写入技巧

本文使用 文章同步助手 同步

你可能感兴趣的:(第17课:RPA追加写入未知行的表格(练兵场四))