看了大牛(cdsn账号:coder-pig)的文章自己写前台后台每天去新闻网站爬取要闻生成早报,我也想要这样的早报!!!
但是我不会写前台后台,甚至连大牛的教程都看不懂,只会点刚学的python代码,怎么办?只能投机倒把了。。
1.监控公共号的消息,他会在每天9:45左右发抠腚早报
2.如果有“早报速读”字样,开始爬取链接里的早报内容
3.转发到指定群
话不多说,去写代码了。。
一阵瞎J8分析后。。。这是公共号消息的msg
{'MsgId': '3443134733782715912', 'FromUserName': '@7a5edf4e2a6be986154727c83bba642e', 'ToUserName': '@6ec4c9e8790be02f8fcbad989d418f74', 'MsgType': 49, 'Content': '\n\n\t\n\t\t『 抠腚早报速读』| 第190301期 \n\t\t要闻速读\n\n1、星巴克否认猫爪杯存在饥饿营销:今天一次性发售3000个。\n\n2、 体坛联播|中超冬季转会耗资16.5亿,武磊身价创历史纪录。\n\n3、罗永浩退出聊天宝股东行列,王威成公司实际控制人。 \n\t\t \n\t\tview \n\t\t5 \n\t\t0 \n\t\t \n\t\thttp://mp.weixin.qq.com/s?__biz=MzUyNzQ0ODIzNg==&mid=2247484399&idx=1&sn=7a559f06a02560b713616a4da085b4f1&chksm=fa7e222ccd09ab3ab8e66e7742c8e134bdfbb60d35ab74f663949de3a3337428ea52e26ed0ab&scene=0&xtrack=1#rd \n\t\t \n\t\t \n\t\t \n\t\t0 \n\t\t\n\t\t\t \n\t\t\t0 \n\t\t\t \n\t\t\t \n\t\t\t \n\t\t\t \n\t\t\t \n\t\t\t \n\t\t \n\t\t\n\t\t\t \n\t\t \n\t\t\n\t\t\t \n\t\t\t305b0201000454305202010002041f57de3702032df08e02045796bc7702045c7932fb042d6175706170706d73675f346463616533356362323634313466665f313535313434363737383534365f323432330204010800030201000400 \n\t\t\tc09a39d97fc3aac412a6560851dc810c \n\t\t\t31329 \n\t\t\t120 \n\t\t\t120 \n\t\t\t558d07af779d1d633bcf70ace06733c1 \n\t\t\t558d07af779d1d633bcf70ace06733c1 \n\t\t\t1 \n\t\t\t \n\t\t\t0 \n\t\t \n\t\t \n\t\t3 \n\t\t \n\t\t抠腚男孩 \n\t\t \n\t\thttp://mmbiz.qpic.cn/mmbiz_jpg/GoRPyTxk6kAhvBW4gRDqicO1WhPiaibl0oIzINOuDEibDZcrheKRyTYFvS8OGbJSicDyumUFpzSGibsgQHXOSPNQBe1w/640?wx_fmt=jpeg&wxtype=jpeg&wxfrom=0 \n\t\t \n\t\t \n\t\t \n\t\t\n\t\t\t0 \n\t\t\t \n\t\t \n\t\t\n\t\t\t0 \n\t\t\t \n\t\t \n\t\t\n\t\t\t0 \n\t\t\tnull \n\t\t\tnull \n\t\t \n\t\t\n\t\t\t0 \n\t\t\tnull \n\t\t\tnull \n\t\t\tnull \n\t\t\tnull \n\t\t\t0 \n\t\t \n\t\t\n\t\t\t \n\t\t\t \n\t\t\t \n\t\t\t \n\t\t \n\t\t \n\t\tc09a39d97fc3aac412a6560851dc810c \n\t\t\n\t\t\t \n\t\t\t \n\t\t\t0 \n\t\t\t\n\t\t\t\t120 \n\t\t\t\t120 \n\t\t\t\t0 \n\t\t\t \n\t\t \n\t\t \n\t\t\n\t\t\t0 \n\t\t \n\t\t\n\t\t\t0 \n\t\t\t0 \n\t\t \n\t \n\t \n\t0 \n\t\n\t\t1 \n\t\t \n\t \n\t \n \n', 'Status': 3, 'ImgStatus': 2, 'CreateTime': 1551446780, 'VoiceLength': 0, 'PlayLength': 0, 'FileName': '『抠腚早报速读』| 第190301期', 'FileSize': '', 'MediaId': '', 'Url': 'http://mp.weixin.qq.com/s?__biz=MzUyNzQ0ODIzNg==&mid=2247484399&idx=1&sn=7a559f06a02560b713616a4da085b4f1&chksm=fa7e222ccd09ab3ab8e66e7742c8e134bdfbb60d35ab74f663949de3a3337428ea52e26ed0ab&scene=0&xtrack=1#rd', 'AppMsgType': 5, 'StatusNotifyCode': 0, 'StatusNotifyUserName': '', 'RecommendInfo': {'UserName': '', 'NickName': '', 'QQNum': 0, 'Province': '', 'City': '', 'Content': '', 'Signature': '', 'Alias': '', 'Scene': 0, 'VerifyFlag': 0, 'AttrStatus': 0, 'Sex': 0, 'Ticket': '', 'OpCode': 0}, 'ForwardFlag': 0, 'AppInfo': {'AppID': '', 'Type': 0}, 'HasProductId': 0, 'Ticket': '', 'ImgHeight': 0, 'ImgWidth': 0, 'SubMsgType': 0, 'NewMsgId': 3443134733782715912, 'OriContent': '', 'EncryFileName': '%E3%80%8E%E6%8A%A0%E8%85%9A%E6%97%A9%E6%8A%A5%E9%80%9F%E8%AF%BB%E3%80%8F%7C%20%E7%AC%AC190301%E6%9C%9F', 'User': <User: {'MemberList': <ContactList: []>, 'Uin': 0, 'UserName': '@7a5edf4e2a6be986154727c83bba642e', 'NickName': 'xxx', 'HeadImgUrl': '/cgi-bin/mmwebwx-bin/webwxgeticon?seq=629476004&username=@7a5edf4e2a6be986154727c83bba642e&skey=@crypt_22fa8655_9511ed835567f694c3466c82024905da', 'ContactFlag': 1, 'MemberCount': 0, 'RemarkName': '', 'HideInputBarFlag': 0, 'Sex': 1, 'Signature': '', 'VerifyFlag': 0, 'OwnerUin': 0, 'PYInitial': 'ZYFDXXJ', 'PYQuanPin': 'zhongyinfudengxuxiaoji', 'RemarkPYInitial': '', 'RemarkPYQuanPin': '', 'StarFriend': 0, 'AppAccountFlag': 0, 'Statues': 0, 'AttrStatus': 209019, 'Province': '山东', 'City': '济宁', 'Alias': '', 'SnsFlag': 17, 'UniFriend': 0, 'DisplayName': '', 'ChatRoomId': 0, 'KeyWord': 'qq1', 'EncryChatRoomId': '', 'IsOwner': 0}>, 'Type': 'Sharing', 'Text': '『抠腚早报速读』| 第190301期'}
写个正则抓吧
万能正则公式。。。<url>(.*?)</url>
得到链接:
http://mp.weixin.qq.com/s?__biz=MzUyNzQ0ODIzNg==&mid=2247484399&idx=1&sn=7a559f06a02560b713616a4da085b4f1&chksm=fa7e222ccd09ab3ab8e66e7742c8e134bdfbb60d35ab74f663949de3a3337428ea52e26ed0ab&scene=0&xtrack=1#rd'
然后requests.get网页,再用正则提取出需要的内容
提取正文的正则表达式(\d\d?、.*?)
消息整合下,最后发送到指定的群里
#公共号消息监听,转发早报
@itchat.msg_register(itchat.content.SHARING, isMpChat=True)
def reply_msg(msg):
#
#print(msg)
msg_Text=msg['Text']
if '早报速读' in msg_Text:
#print(True)
group_list=[u'学习园地',u'测试呀',u'和我一起练琴吧']#在此添加想要发送的群名称!
msg_from_user = msg['User']['NickName']
msg_content=msg['Content']
msg_time_rec = time.strftime("%Y%m%d", time.localtime())
url=re.search("(.*?) ", msg['Content']).group(1)
if url.startswith('):
url=re.search('',url).group(1)
print(url)
req=r.get(url)
new=[]
new=re.findall("(\d\d?、.*?)
",req.text)
news=''
for i in new:
news+=i+'\n'
news='『大喵晨报』|第'+msg_time_rec+'期\n'+news[:len(news)-1]
#print(news) 再把news发送到制定群即可
#itchat.send_msg(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+'转发晨报成功!',toUserName="filehelper")#发送到文件助手的log信息
for group in group_list:
chat=itchat.search_chatrooms(name=group)
if len(chat)>0:
itchat.send(news, toUserName=chat[0]['UserName'])
itchat.send_msg(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+"#"+group+'#转发晨报成功!',toUserName="filehelper")#发送到文件助手的log信息