Python——轻松拥有自己的自动化早报!

看了大牛(cdsn账号:coder-pig)的文章自己写前台后台每天去新闻网站爬取要闻生成早报,我也想要这样的早报!!!
Python——轻松拥有自己的自动化早报!_第1张图片
但是我不会写前台后台,甚至连大牛的教程都看不懂,只会点刚学的python代码,怎么办?只能投机倒把了。。

思路:

1.监控公共号的消息,他会在每天9:45左右发抠腚早报
2.如果有“早报速读”字样,开始爬取链接里的早报内容
3.转发到指定群

话不多说,去写代码了。。
一阵瞎J8分析后。。。这是公共号消息的msg

{'MsgId': '3443134733782715912', 'FromUserName': '@7a5edf4e2a6be986154727c83bba642e', 'ToUserName': '@6ec4c9e8790be02f8fcbad989d418f74', 'MsgType': 49, 'Content': '\n\n\t\n\t\t『 抠腚早报速读』| 第190301期\n\t\t要闻速读\n\n1、星巴克否认猫爪杯存在饥饿营销:今天一次性发售3000个。\n\n2、 体坛联播|中超冬季转会耗资16.5亿,武磊身价创历史纪录。\n\n3、罗永浩退出聊天宝股东行列,王威成公司实际控制人。\n\t\t\n\t\tview\n\t\t5\n\t\t0\n\t\t\n\t\thttp://mp.weixin.qq.com/s?__biz=MzUyNzQ0ODIzNg==&mid=2247484399&idx=1&sn=7a559f06a02560b713616a4da085b4f1&chksm=fa7e222ccd09ab3ab8e66e7742c8e134bdfbb60d35ab74f663949de3a3337428ea52e26ed0ab&scene=0&xtrack=1#rd\n\t\t\n\t\t\n\t\t\n\t\t0\n\t\t\n\t\t\t\n\t\t\t0\n\t\t\t\n\t\t\t\n\t\t\t\n\t\t\t\n\t\t\t\n\t\t\t\n\t\t\n\t\t\n\t\t\t\n\t\t\n\t\t\n\t\t\t\n\t\t\t305b0201000454305202010002041f57de3702032df08e02045796bc7702045c7932fb042d6175706170706d73675f346463616533356362323634313466665f313535313434363737383534365f323432330204010800030201000400\n\t\t\tc09a39d97fc3aac412a6560851dc810c\n\t\t\t31329\n\t\t\t120\n\t\t\t120\n\t\t\t558d07af779d1d633bcf70ace06733c1\n\t\t\t558d07af779d1d633bcf70ace06733c1\n\t\t\t1\n\t\t\t\n\t\t\t0\n\t\t\n\t\t\n\t\t3\n\t\t\n\t\t抠腚男孩\n\t\t\n\t\thttp://mmbiz.qpic.cn/mmbiz_jpg/GoRPyTxk6kAhvBW4gRDqicO1WhPiaibl0oIzINOuDEibDZcrheKRyTYFvS8OGbJSicDyumUFpzSGibsgQHXOSPNQBe1w/640?wx_fmt=jpeg&wxtype=jpeg&wxfrom=0\n\t\t\n\t\t\n\t\t\n\t\t\n\t\t\t0\n\t\t\t\n\t\t\n\t\t\n\t\t\t0\n\t\t\t\n\t\t\n\t\t\n\t\t\t0\n\t\t\tnull\n\t\t\tnull\n\t\t\n\t\t\n\t\t\t0\n\t\t\tnull\n\t\t\tnull\n\t\t\tnull\n\t\t\tnull\n\t\t\t0\n\t\t\n\t\t\n\t\t\t\n\t\t\t\n\t\t\t\n\t\t\t\n\t\t\n\t\t\n\t\tc09a39d97fc3aac412a6560851dc810c\n\t\t\n\t\t\t\n\t\t\t\n\t\t\t0\n\t\t\t\n\t\t\t\t120\n\t\t\t\t120\n\t\t\t\t0\n\t\t\t\n\t\t\n\t\t\n\t\t\n\t\t\t0\n\t\t\n\t\t\n\t\t\t0\n\t\t\t0\n\t\t\n\t\n\t\n\t0\n\t\n\t\t1\n\t\t\n\t\n\t\n\n', 'Status': 3, 'ImgStatus': 2, 'CreateTime': 1551446780, 'VoiceLength': 0, 'PlayLength': 0, 'FileName': '『抠腚早报速读』| 第190301期', 'FileSize': '', 'MediaId': '', 'Url': 'http://mp.weixin.qq.com/s?__biz=MzUyNzQ0ODIzNg==&mid=2247484399&idx=1&sn=7a559f06a02560b713616a4da085b4f1&chksm=fa7e222ccd09ab3ab8e66e7742c8e134bdfbb60d35ab74f663949de3a3337428ea52e26ed0ab&scene=0&xtrack=1#rd', 'AppMsgType': 5, 'StatusNotifyCode': 0, 'StatusNotifyUserName': '', 'RecommendInfo': {'UserName': '', 'NickName': '', 'QQNum': 0, 'Province': '', 'City': '', 'Content': '', 'Signature': '', 'Alias': '', 'Scene': 0, 'VerifyFlag': 0, 'AttrStatus': 0, 'Sex': 0, 'Ticket': '', 'OpCode': 0}, 'ForwardFlag': 0, 'AppInfo': {'AppID': '', 'Type': 0}, 'HasProductId': 0, 'Ticket': '', 'ImgHeight': 0, 'ImgWidth': 0, 'SubMsgType': 0, 'NewMsgId': 3443134733782715912, 'OriContent': '', 'EncryFileName': '%E3%80%8E%E6%8A%A0%E8%85%9A%E6%97%A9%E6%8A%A5%E9%80%9F%E8%AF%BB%E3%80%8F%7C%20%E7%AC%AC190301%E6%9C%9F', 'User': <User: {'MemberList': <ContactList: []>, 'Uin': 0, 'UserName': '@7a5edf4e2a6be986154727c83bba642e', 'NickName': 'xxx', 'HeadImgUrl': '/cgi-bin/mmwebwx-bin/webwxgeticon?seq=629476004&username=@7a5edf4e2a6be986154727c83bba642e&skey=@crypt_22fa8655_9511ed835567f694c3466c82024905da', 'ContactFlag': 1, 'MemberCount': 0, 'RemarkName': '', 'HideInputBarFlag': 0, 'Sex': 1, 'Signature': '', 'VerifyFlag': 0, 'OwnerUin': 0, 'PYInitial': 'ZYFDXXJ', 'PYQuanPin': 'zhongyinfudengxuxiaoji', 'RemarkPYInitial': '', 'RemarkPYQuanPin': '', 'StarFriend': 0, 'AppAccountFlag': 0, 'Statues': 0, 'AttrStatus': 209019, 'Province': '山东', 'City': '济宁', 'Alias': '', 'SnsFlag': 17, 'UniFriend': 0, 'DisplayName': '', 'ChatRoomId': 0, 'KeyWord': 'qq1', 'EncryChatRoomId': '', 'IsOwner': 0}>, 'Type': 'Sharing', 'Text': '『抠腚早报速读』| 第190301期'}

写个正则抓吧

万能正则公式。。。<url>(.*?)</url>

得到链接:

http://mp.weixin.qq.com/s?__biz=MzUyNzQ0ODIzNg==&mid=2247484399&idx=1&sn=7a559f06a02560b713616a4da085b4f1&chksm=fa7e222ccd09ab3ab8e66e7742c8e134bdfbb60d35ab74f663949de3a3337428ea52e26ed0ab&scene=0&xtrack=1#rd'

然后requests.get网页,再用正则提取出需要的内容

提取正文的正则表达式

(\d\d?、.*?)

消息整合下,最后发送到指定的群里

最终代码如下

#公共号消息监听,转发早报
@itchat.msg_register(itchat.content.SHARING, isMpChat=True)
def reply_msg(msg):
    #
    #print(msg)
    msg_Text=msg['Text']
    if '早报速读' in msg_Text:
        #print(True)
    
        group_list=[u'学习园地',u'测试呀',u'和我一起练琴吧']#在此添加想要发送的群名称!
        msg_from_user = msg['User']['NickName']
        msg_content=msg['Content']
        msg_time_rec = time.strftime("%Y%m%d", time.localtime())
        url=re.search("(.*?)", msg['Content']).group(1)
        if url.startswith('):
            url=re.search('',url).group(1)
        
        print(url)
        req=r.get(url)
        new=[]
        new=re.findall("

(\d\d?、.*?)

"
,req.text) news='' for i in new: news+=i+'\n' news='『大喵晨报』|第'+msg_time_rec+'期\n'+news[:len(news)-1] #print(news) 再把news发送到制定群即可 #itchat.send_msg(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+'转发晨报成功!',toUserName="filehelper")#发送到文件助手的log信息 for group in group_list: chat=itchat.search_chatrooms(name=group) if len(chat)>0: itchat.send(news, toUserName=chat[0]['UserName']) itchat.send_msg(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())+"#"+group+'#转发晨报成功!',toUserName="filehelper")#发送到文件助手的log信息

你可能感兴趣的:(牌神Python)