陈建驱

邮件定时发送微博热搜

个人博客：http://www.chenjianqu.com/

原文链接：http://www.chenjianqu.com/show-93.html

使用爬虫把微博热搜和天气预报爬下来，并通过邮件定时发送给自己查看。目录：

1.爬取微博热搜

2.邮件发送

3.爬取天气预报

4.综合程序

爬取微博热搜

我这里使用Python的正则表达式进行爬取，这虽然是一种原始的方式，但是应对简单的爬虫任务时却很有效。首先打开微博热搜的页面：https://d.weibo.com/231650_ctg1_-_all#。然后F12进入调试模式。接着根据想要爬去的内容定位到网页元素，对于想要爬取热搜的话，可以定位到

下一步，切换到Network窗口，点击网页刷新，找到网页内容文件。经过查找，发现在Doc内容的231650_ctg1_-_all里面。查看该文件的请求头的内容，写代码的时候需要用到。下面是Python的代码：

import requests
date_url='https://d.weibo.com/231650_ctg1_-_all'
user_agent = r'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
header = {
    'Content-Type':'application/x-www-form-urlencoded',
    'User-Agent':user_agent,
    'Connection': 'keep-alive',
    'Host':'d.weibo.com',
    'Referer':r'https://weibo.com/?category=1760',
    'Sec-Fetch-Mode':'navigate',
    'Sec-Fetch-Site':'same-origin',
    'Sec-Fetch-User':'?1',
    'Upgrade-Insecure-Requests':'1',
    'Cookie':r'SINAGLOBAL=3157249405177.425.1576929340602; SCF=Al6xXQQ55-6jcuFXUVP0A6SEVlMaKwwCLiZUNjT9niWFZphUNGW7iw5NY4L42KvBQbIpbHZIIsILhHH8bZ5OnbM.; SUHB=0WGdKi-XaWA8Uj; ALF=1611383135; SUB=_2AkMpZMs-f8NxqwJRmPoVxW3rb4VwzAHEieKfODrlJRMxHRl-yT9kqn0vtRB6AuTl0ValAGtvAToNrCinxEZouvLjQMeG; SUBP=0033WrSXqPxfM72-Ws9jqgMF55529P9D9W5va2LfoCEFCfOQu6BQpoCk; login_sid_t=8bc131d1a2f8aa8965871b50f73c6c2d; cross_origin_proto=SSL; _s_tentry=passport.weibo.com; UOR=www.pythontip.com,widget.weibo.com,www.baidu.com; Apache=5219702142720.495.1580745741891; ULV=1580745741899:5:1:1:5219702142720.495.1580745741891:1579837074450; YF-Page-G0=46fe8b26d816d699836422a078175e33|1580745781|1580745767'
}
r = requests.post(url=date_url,  headers=header)
raw_text=r.text
re_s1 = r""
re_s2=r""
re_pic=r""
re_pic_src=r"src=(.*?)jpg"
re_sub=r"(.*?)div>"
re_link=r""
re_link_src=r"href=(.*?) class="
re_key=r"#(.*?)#"
s1 = re.findall(re_s1,raw_text,re.S|re.M)
for line_s1 in s1:
    s2=re.findall(re_s2,line_s1,re.S|re.M)
    #每个热搜项
    for line_s2 in s2:
        #获取关键词
        key=re.findall(re_key,line_s2,re.S|re.M)
        print(key[0])
        #获取图片地址
        pic_s=re.findall(re_pic,line_s2,re.S|re.M)
        src=re.findall(re_pic_src,pic_s[0],re.S|re.M)
        print(src[0].replace('\\','')+'jpg')
        #获取子标题
        subtitle=re.findall(re_sub,line_s2,re.S|re.M)
        print(subtitle[0].replace('\\t','').replace('\\n','').replace('<\\/',''))
        #获取该热搜的链接
        link=re.findall(re_link,line_s2,re.S|re.M)
        link_src=re.findall(re_link_src,link[0],re.S|re.M)
        print(link_src[0].replace('\\',''))
        
        print('\n')
        
        
        
#################################################################################

爬取的结果        
        
远程办公
"https://wx4.sinaimg.cn/large/59853be1ly1gbjb12koefj206o06ogoi.jpg

"https://s.weibo.com/weibo?q=%23%E8%BF%9C%E7%A8%8B%E5%8A%9E%E5%85%AC%23"


下一站是幸福
"https://wx1.sinaimg.cn/large/0079PGXzly1gb409yn3poj30dw0dwq3r.jpg
@微博电视剧 推荐：《下一站是幸福》（原《资深少女的初恋》），讲述...
"https://s.weibo.com/weibo?q=%23%E4%B8%8B%E4%B8%80%E7%AB%99%E6%98%AF%E5%B9%B8%E7%A6%8F%23"


过多睡眠不利于当前健康调整
"https://wx3.sinaimg.cn/large/6a5ce645ly1gbj96c9fgrj205q05qglj.jpg
3日，国家卫生健康委召开新闻发布会，北京回龙观医院党委书记杨甫德表...
"https://s.weibo.com/weibo?q=%23%E8%BF%87%E5%A4%9A%E7%9D%A1%E7%9C%A0%E4%B8%8D%E5%88%A9%E4%BA%8E%E5%BD%93%E5%89%8D%E5%81%A5%E5%BA%B7%E8%B0%83%E6%95%B4%23"


李兰娟回应疫苗进展
"https://wx4.sinaimg.cn/large/9e5389bbly1gbjaa14qwsj20c80c8t9g.jpg
2月2日凌晨，中国工程院院士、国家卫健委高级别专家组成员李兰娟带领...
"https://s.weibo.com/weibo?q=%23%E6%9D%8E%E5%85%B0%E5%A8%9F%E5%9B%9E%E5%BA%94%E7%96%AB%E8%8B%97%E8%BF%9B%E5%B1%95%23"


抗疫行动
"https://wx2.sinaimg.cn/large/005C79Jbly1gbjozauqc6j30dw0dw0ti.jpg
疫情让人恐惧，也让我们团结一心！@好友一起#手写加油接力#  为身边的...
"https://s.weibo.com/weibo?q=%23%E6%8A%97%E7%96%AB%E8%A1%8C%E5%8A%A8%23"


2020最大心愿
"https://wx2.sinaimg.cn/large/a716fd45ly1gbiy5n6qqrj20dw0dwmzd.jpg
2020最大心愿：国泰民安！ 转发海报，一起许下2020年的愿望！
"https://s.weibo.com/weibo?q=%232020%E6%9C%80%E5%A4%A7%E5%BF%83%E6%84%BF%23"


武汉最新城市宣传片
"https://wx2.sinaimg.cn/large/7a273328ly1g7sxt0udwnj20ba0baabb.jpg

"https://s.weibo.com/weibo?q=%23%E6%AD%A6%E6%B1%89%E6%9C%80%E6%96%B0%E5%9F%8E%E5%B8%82%E5%AE%A3%E4%BC%A0%E7%89%87%23"


儿童和孕产妇是新型肺炎易感人群
"https://wx2.sinaimg.cn/large/60718250ly1gbj8qp16a8j20bl0bl0t1.jpg

"https://s.weibo.com/weibo?q=%23%E5%84%BF%E7%AB%A5%E5%92%8C%E5%AD%95%E4%BA%A7%E5%A6%87%E6%98%AF%E6%96%B0%E5%9E%8B%E8%82%BA%E7%82%8E%E6%98%93%E6%84%9F%E4%BA%BA%E7%BE%A4%23"


福尔摩斯式破解病毒传染迷局
"https://wx3.sinaimg.cn/large/9e5389bbly1gbjkfi69hvj20dw0dw3yx.jpg
日前，天津某百货大楼内部相继出现5例确诊病例，从起初的3个病例来看...
"https://s.weibo.com/weibo?q=%23%E7%A6%8F%E5%B0%94%E6%91%A9%E6%96%AF%E5%BC%8F%E7%A0%B4%E8%A7%A3%E7%97%85%E6%AF%92%E4%BC%A0%E6%9F%93%E8%BF%B7%E5%B1%80%23"


宝石gem经纪人回应
"https://wx2.sinaimg.cn/large/4b79be8bly1gbjcd3ja43j208o08o74u.jpg

"https://s.weibo.com/weibo?q=%23%E5%AE%9D%E7%9F%B3gem%E7%BB%8F%E7%BA%AA%E4%BA%BA%E5%9B%9E%E5%BA%94%23"


手写加油接力
"https://wx1.sinaimg.cn/large/005C79Jbly1gbig4h9v7dj30dw0dwgm0.jpg
@好友 接力，手写祝福，为奋战在所有一线的工作者们加油打气，武汉加...
"https://s.weibo.com/weibo?q=%23%E6%89%8B%E5%86%99%E5%8A%A0%E6%B2%B9%E6%8E%A5%E5%8A%9B%23"


宁波一次聚餐祈福25人确诊
"https://wx3.sinaimg.cn/large/6a5ce645ly1gbje76xyhkj20dw0dwwfd.jpg
2月3日，据宁波市政府新闻办召开新闻发布会通报：患者胡某，无湖北（...
"https://s.weibo.com/weibo?q=%23%E5%AE%81%E6%B3%A2%E4%B8%80%E6%AC%A1%E8%81%9A%E9%A4%90%E7%A5%88%E7%A6%8F25%E4%BA%BA%E7%A1%AE%E8%AF%8A%23"


北京发现41起聚集性病例
"https://wx2.sinaimg.cn/large/9e5389bbly1gbjbvb0z0wj20dw0dwgmx.jpg
今日，北京市新型冠状病毒感染的肺炎疫情防控工作新闻发布会介绍，截...
"https://s.weibo.com/weibo?q=%23%E5%8C%97%E4%BA%AC%E5%8F%91%E7%8E%B041%E8%B5%B7%E8%81%9A%E9%9B%86%E6%80%A7%E7%97%85%E4%BE%8B%23"


锦衣之下
"https://wx2.sinaimg.cn/large/006WpiUTly1g8pdxpnafnj30dw0dwdib.jpg
由艺能传媒、欢瑞世纪、芒果超媒、快乐阳光出品，总导演尹涛、导演刘...
"https://s.weibo.com/weibo?q=%23%E9%94%A6%E8%A1%A3%E4%B9%8B%E4%B8%8B%23"


确诊病例门把手测出病毒核酸
"https://wx4.sinaimg.cn/large/a716fd45ly1gbj1jn8ogfj206n06n3yq.jpg
日前，广州市疾控中心在疫情监测中，在一名确诊患者家中门把手上发现...
"https://s.weibo.com/weibo?q=%23%E7%A1%AE%E8%AF%8A%E7%97%85%E4%BE%8B%E9%97%A8%E6%8A%8A%E6%89%8B%E6%B5%8B%E5%87%BA%E7%97%85%E6%AF%92%E6%A0%B8%E9%85%B8%23"

邮件发送

这里直接按照菜鸟教程的Python邮件发送教程来，使用QQ邮箱作为SMTP作为邮件发送服务器。SMTP（Simple Mail Transfer Protocol）即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则，由它来控制信件的中转方式。python的smtplib提供了一种很方便的途径发送电子邮件。它对smtp协议进行了简单的封装。这里需要在QQ邮箱里的"设置->帐号管理->开启POS3/SMTP服务->获得授权码"，将授权码作为登录的密码，得到的代码如下：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
import smtplib
from email.mime.text import MIMEText
from email.utils import formataddr
 
my_sender='[email protected]'    # 发件人邮箱账号
my_pass = 'xxx'    # 发件人邮箱密码
my_user='[email protected]'    # 收件人邮箱账号
def mail():
    ret=True
    try:
        msg=MIMEText('邮件内容：测试','plain','utf-8')
        msg['From']=formataddr(["AlexChen",my_sender])  # 括号里的对应发件人邮箱昵称、发件人邮箱账号
        msg['To']=formataddr(["JianquChen",my_user])              # 括号里的对应收件人邮箱昵称、收件人邮箱账号
        msg['Subject']="邮件测试"                # 邮件的主题，也可以说是标题
 
        server=smtplib.SMTP_SSL("smtp.qq.com", 465)  # 发件人邮箱中的SMTP服务器，端口是25
        server.login(my_sender, my_pass)  # 
        server.sendmail(my_sender,[my_user,],msg.as_string())  
        server.quit()  # 关闭连接
    except Exception:  
        ret=False
    return ret
 
ret=mail()
if ret:
    print("邮件发送成功")
else:
    print("邮件发送失败")

更正：这爬的好像不是热搜，，，但这是不是重点。

爬取天气预报

直接使用<树莓派智能家居-天气预报和实时温湿度监控>的代码获取天气预报。如下：

import requests
import json
def getWeather(city,date=0):
    s=''
    rb=requests.get('http://wthrcdn.etouch.cn/weather_mini?city='+city)
    #print(rb.text)
    data=json.loads(rb.text)
    if(data['status']==1000):
        d=data['data']
        if(date==0):
            s+=d['city']+'今天'+d['forecast'][0]['type']+','
            s+=d['forecast'][0]['low'][2:]+'到'+d['forecast'][0]['high'][2:]+','
            s+=d['forecast'][0]['fengxiang']+d['forecast'][0]['fengli'][8:]+','
            s+='当前室外温度:'+d['wendu']+'度,'
            s+=d['ganmao']
        elif(date>0 and date<5):
            s+=d['city']
            if(date==1):
                s+='明天'
            elif(date==2):
                s+='后天'
            else:
                s+=d['forecast'][date]['date']
            s+=d['forecast'][date]['type']+','
            s+=d['forecast'][date]['low'][2:]+'到'+d['forecast'][date]['high'][2:]+','
            s+=d['forecast'][date]['fengxiang']+d['forecast'][date]['fengli'][8:]
        elif(date==-1):
            s+=d['city']+'昨天'+d['yesterday']['type']+','
            s+=d['yesterday']['low'][2:]+'到'+d['yesterday']['high'][2:]+','
            s+=d['yesterday']['fx']+d['yesterday']['fl'][8:]
    else:
        s='天气请求失败'
    return s
print(getWeather("钦州市",date=0))

综合程序

总的程序如下：

# -*- coding: UTF-8 -*-
import datetime
import time
import smtplib
from email.mime.text import MIMEText
from email.utils import formataddr
import json
import re
import requests


my_sender='[email protected]'    # 发件人邮箱账号
my_pass = 'xxx'              # 发件人邮箱密码
my_user='[email protected]'      # 收件人邮箱账号，



#定时时刻[小时,分钟]

my_times=[
    [13,57],
    [13,54]
    ]




def getWeather(city,date=0):
    s=''
    rb=requests.get('http://wthrcdn.etouch.cn/weather_mini?city='+city)
    #print(rb.text)
    data=json.loads(rb.text)
    if(data['status']==1000):
        d=data['data']
        if(date==0):
            s+=d['city']+'今天'+d['forecast'][0]['type']+','
            s+=d['forecast'][0]['low'][2:]+'到'+d['forecast'][0]['high'][2:]+','
            s+=d['forecast'][0]['fengxiang']+d['forecast'][0]['fengli'][8:]+','
            s+='当前室外温度:'+d['wendu']+'度,'
            s+=d['ganmao']
        elif(date>0 and date<5):
            s+=d['city']
            if(date==1):
                s+='明天'
            elif(date==2):
                s+='后天'
            else:
                s+=d['forecast'][date]['date']
            s+=d['forecast'][date]['type']+','
            s+=d['forecast'][date]['low'][2:]+'到'+d['forecast'][date]['high'][2:]+','
            s+=d['forecast'][date]['fengxiang']+d['forecast'][date]['fengli'][8:]
        elif(date==-1):
            s+=d['city']+'昨天'+d['yesterday']['type']+','
            s+=d['yesterday']['low'][2:]+'到'+d['yesterday']['high'][2:]+','
            s+=d['yesterday']['fx']+d['yesterday']['fl'][8:]
    else:
        s='天气请求失败'
    return s+'\n'


def getWeibo():
    date_url='https://d.weibo.com/231650_ctg1_-_all'

    user_agent = r'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'

    header = {
        'Content-Type':'application/x-www-form-urlencoded',
        'User-Agent':user_agent,
        'Connection': 'keep-alive',
        'Host':'d.weibo.com',
        'Referer':r'https://weibo.com/?category=1760',
        'Sec-Fetch-Mode':'navigate',
        'Sec-Fetch-Site':'same-origin',
        'Sec-Fetch-User':'?1',
        'Upgrade-Insecure-Requests':'1',
        'Cookie':r'SINAGLOBAL=3157249405177.425.1576929340602; SCF=Al6xXQQ55-6jcuFXUVP0A6SEVlMaKwwCLiZUNjT9niWFZphUNGW7iw5NY4L42KvBQbIpbHZIIsILhHH8bZ5OnbM.; SUHB=0WGdKi-XaWA8Uj; ALF=1611383135; SUB=_2AkMpZMs-f8NxqwJRmPoVxW3rb4VwzAHEieKfODrlJRMxHRl-yT9kqn0vtRB6AuTl0ValAGtvAToNrCinxEZouvLjQMeG; SUBP=0033WrSXqPxfM72-Ws9jqgMF55529P9D9W5va2LfoCEFCfOQu6BQpoCk; login_sid_t=8bc131d1a2f8aa8965871b50f73c6c2d; cross_origin_proto=SSL; _s_tentry=passport.weibo.com; UOR=www.pythontip.com,widget.weibo.com,www.baidu.com; Apache=5219702142720.495.1580745741891; ULV=1580745741899:5:1:1:5219702142720.495.1580745741891:1579837074450; YF-Page-G0=46fe8b26d816d699836422a078175e33|1580745781|1580745767'
    }
    r = requests.post(url=date_url,  headers=header)
    raw_text=r.text

    re_s1 = r""
    re_s2=r""
    re_pic=r""
    re_pic_src=r"src=(.*?)jpg"
    re_sub=r"(.*?)div>"
    re_link=r""
    re_link_src=r"href=(.*?) class="
    re_key=r"#(.*?)#"

    s1 = re.findall(re_s1,raw_text,re.S|re.M)
    texts=''

    for line_s1 in s1:
        s2=re.findall(re_s2,line_s1,re.S|re.M)
        #每个热搜项
        for line_s2 in s2:
            #获取关键词
            key=re.findall(re_key,line_s2,re.S|re.M)
            texts+='\n'+key[0]
            #print(key[0])
            #获取图片地址
            pic_s=re.findall(re_pic,line_s2,re.S|re.M)
            src=re.findall(re_pic_src,pic_s[0],re.S|re.M)
            #texts+='\n'+src[0]
            #print(src[0].replace('\\','')+'jpg')
            #获取子标题
            subtitle=re.findall(re_sub,line_s2,re.S|re.M)
            texts+='\n'+subtitle[0].replace('\\t','').replace('\\n','').replace('<\\/','')
            #print(subtitle[0].replace('\\t','').replace('\\n','').replace('<\\/',''))
            #获取该热搜的链接
            link=re.findall(re_link,line_s2,re.S|re.M)
            link_src=re.findall(re_link_src,link[0],re.S|re.M)
            texts+='\n'+link_src[0].replace('\\','')+'\n'
            #print(link_src[0].replace('\\',''))
            #print('\n')
    return texts







def SendEmail():
    text='今天的天气情况：'+getWeather('钦州市')
    try:
        text+='\n当前的微博热搜：'+getWeibo()
    except Exception:
        text+='\n获取微博热搜失败'

    ret=True
    try:
        msg=MIMEText(text,'plain','utf-8')#邮件内容
        msg['From']=formataddr(["AlexChen",my_sender])  # 括号里的对应发件人邮箱昵称、发件人邮箱账号
        msg['To']=formataddr(["JianquChen",my_user])              # 括号里的对应收件人邮箱昵称、收件人邮箱账号
        msg['Subject']="您的微博热搜到了，请查收！"                # 邮件的主题，也可以说是标题
 
        server=smtplib.SMTP_SSL("smtp.qq.com", 465)  # 发件人邮箱中的SMTP服务器，端口是25
        server.login(my_sender, my_pass)  # 括号中对应的是发件人邮箱账号、邮箱密码
        server.sendmail(my_sender,[my_user,],msg.as_string())  # 括号中对应的是发件人邮箱账号、收件人邮箱账号、发送邮件
        server.quit()  # 关闭连接
    except Exception:  # 如果 try 中的语句没有执行，则会执行下面的 ret=False
        ret=False
    return ret




if __name__=="__main__":
    while True:
        # 判断是否达到设定时间
        while True:
            now = datetime.datetime.now()
            for t in my_times:
                if now.hour==t[0] and now.minute==t[1]:
                    ret=SendEmail()
                    if(ret):
                        print('邮件发送成功')
                    else:
                        print('邮件发送失败')
                    time.sleep(60)
            time.sleep(20)

邮件结果：

最后将程序部署到服务器上就可以实现每天定时发送微博热搜和天气情况给你了。

编程随笔-ElasticSearch知识导图(1)：全景 weixin_33868027 数据库大数据 json
1.由ElasticSearch开始的思考官方介绍Elasticsearch(以下简称ES)是一个基于ApacheLucene(TM)的开源搜索引擎。但我最初了解ES却是从NoSQL数据库开始，在使用、研究了ES一段时间后，我发现这是一个优秀的分布式部署软件，不仅是一个全文搜索引擎、还是一个分布式存储系统、一个分布式数据库。在ES之前我们习惯使用关系数据库(RDBMS)来进行现实数据世界的
编程随笔-ElasticSearch知识导图(2)：分布式架构 weixin_34186950 大数据数据库数据结构与算法
1.集群结构在我们探究ES的分布式架构之前，我们使用一个简单的导图描述一下我们在设计分布式系统时会考虑的问题，如图1所示。带着图1中的问题我们来探究一下ES集群，ES集群是一个典型的主从结构，从某种意义上来说，符合现今大多数主流分布式存储、分布式计算系统的审美要求。下面我们逐步来了解集群中的这些东东。先用来自文献2的一张集群结构图开始我们的探究。1.1集群节点在ES集群中，一个ES
编程随笔-Java | 04.栈Stack、队列Queue和双端队列Deque xyx-Eshang 编程随笔-Java java c++数据结构
文章目录1.Stack-栈定义API示例代码2.Queue-单端队列定义API示例代码3.Deque-双端队列定义API示例代码1.Stack-栈定义Stackst=newStackst=newStackqueue=newLinkedListqueue=newLinkedListdq=newLinkedListdq=newLinkedList<>();//01.队头入队dq.offerFirst(
编程随笔-Java | 03.使用FileWriter向文件中写入内容 xyx-Eshang 编程随笔-Java java jvm 开发语言
文章目录1.FileWriter类构造方法常用API2.使用示例：创建文件并写入内容参考文章1.FileWriter类构造方法publicFileWriter(Filefile);publicFileWriter(Filefile,booleanappend);//当append设置为true，表示追加模式常用API//常规模式写入publicvoidwrite(Stringstr);public
编程随笔 - 包含颜色、百分比的直方图(Bar)绘制 SpikeKing python numpy matplotlib
欢迎关注我的CSDN：https://spike.blog.csdn.net/本文地址：https://blog.csdn.net/caroline_wendy/article/details/130068335Matplotlib的核心组件是Figure和Axes。Figure是一个容器，包含了所有的图形元素，如Axes，标题，图例等。Axes是一个子图，有自己的坐标系，可以绘制各种类型的图形，
Socket编程随笔 onlyHalfSoul
什么是SocketSocket是进程通讯的一种方式，即调用这个网络库的一些API函数实现分布在不同主机的相关进程之间的数据交换。Socket是一门技术，由于现在是面向对象的编程，一些计算机行业的大神通过抽象的理念，在现实中通过反复的理论或者实际的推导，提出了抽象的一些通信协议，基于tcp/ip协议，提出大致的构想，一些泛型的程序大牛在这个协议的基础上，将这些抽象化的理念接口化，针对协议提出的每个理
编程随笔-ElasticSearch知识导图(3)：映射简单是美美
1.啥是映射 ES中的映射(Mapping)实质上就是对文档对象结构的定义，也即对文档中各元素的描述。在ES中定义映射，就如同定义XML文档的XMLSchema。 ES中的映射定义了文档模式（就如同在关系数据库中定义了关系模式），文档模式确定了存在ES中的文档的格式，结构和字段的数据类型。通过查看某个索引的映射可以了解文档的结构，以便使用查询语言(QueryDSL)构建更符合我们要求的查询命令
面向复杂度编程随笔—其一 java设计思考
问题背景前几天，和同事聊了这么一个场景：交易系统，同时下单了商品A&商品B，其中A商品买了10件，B商品买了20件。正向订单已经签收，订单流转至完成态，此时正向订单里的两个商品A&B都可以分别申请售后（逆向订单）。但是为了保证不至于买了10件，退了11件这种情况发生。逆向订单创建的时候，需要知道发起逆向的时候，正向订单已经发起了几件商品的逆向，据此决定本次逆向最多可以退多少件。问题此时有两个方案：
面向复杂度编程随笔—其一 java设计思考
问题背景前几天，和同事聊了这么一个场景：交易系统，同时下单了商品A&商品B，其中A商品买了10件，B商品买了20件。正向订单已经签收，订单流转至完成态，此时正向订单里的两个商品A&B都可以分别申请售后（逆向订单）。但是为了保证不至于买了10件，退了11件这种情况发生。逆向订单创建的时候，需要知道发起逆向的时候，正向订单已经发起了几件商品的逆向，据此决定本次逆向最多可以退多少件。问题此时有两个方案：
核心编程随笔5——作业 weixin_34268610
Note0:Windows提供了一个作业(job)内核对象,它允许你将进程组合在一起并创建一个"沙箱"来限制进程能够做什么.最好将作业对象想象成一个进程容器.但是,即使作业中只包含一个进程,也是非常有用的,因为这样可以对进程施加平时不能施加的限制.Note1:以下的StartRestrictedProcess函数将一个进程放入一个作业中,以限制此进程具体能够做哪些事情,如下所示：voidStart
C/C++中的内置宏定义及跨平台编程随笔急什么_让子弹飞一会
ANSIC标准中有几个标准预定义宏（也是常用的）：__LINE__：在源代码中插入当前源代码行号；__FILE__：在源文件中插入当前源文件名；__DATE__：在源文件中插入当前的编译日期__TIME__：在源文件中插入当前编译时间；__STDC__：当要求程序严格遵循ANSIC标准时该标识被赋值为1；__cplusplus：当编写C++程序时该标识符被定义。其他一些微软的C++编译器内置的宏定
JAVA并发编程随笔【一】PriorityBlockingQueue优先级队列随风yy 【Java】
一、优先级队列PriorityBlockingQueue必须是实现Comparable接口，队列通过这个接口的compare方法确定对象的priority。当前和其他对象比较，如果compare方法返回负数，那么在队列里面的优先级就比较搞比较规则：当前对象和其他对象做比较，当前优先级大就返回-1，优先级小就返回1二、优先级队列是一个基于堆的无界并发安全的优先级队列。三、优先级队列不允许null值，
编程随笔（2018.03.05）我就是我2333 HOOPS c++MFC
想学习hoops的童鞋，给大家总结了几个好的学习网站：http://docs.techsoft3d.com/visualize/3df/latest/build/api_ref/3dgs/api_ref_index.htmlhttps://wenku.baidu.com/view/7b3f1cb365ce05087632134f.html?rec_flag=default&mark_pay_doc
Java核心编程随笔 zhengpiao2018 Java 编程语言
1、XML是一种描述数据的方式。可以使用任何一种程序设计语言处理XML数据，而JavaAPI对XML处理提供了很好的支持。2、HTML是一种描述网页结构的方式。除了用于在网页上放置Javaapplet的HTML扩展之外，两者没有任何共同之处。3、检查一个字符串既不是null也不为空串if(str!=null&&str.length()!=0)4、关键字final表示这个变量只能被赋值一次。一旦被赋
JAVA并发编程随笔【十】ConcurrentMap.putIfAbsent用法随风yy 【Java】
看如下的例子，我们从map中取指定key的值，如果key对应的值不存在则存入一个默认值，否则返回对应的值；这样在同步（单线程）环境下是没问题的，但是在多线程环境下就会出现问题，当if(!map.containsKey(key))判断的时候可能其他线程已经放入了对应的值，这样就可能导致取值不一致，造成线程不安全：importjava.util.HashMap;importjava.util.Map;
编程随笔-ElasticSearch知识导图(5)：聚合简单是美美
1.聚合模式聚合(Aggregations)是对数据库中数据域进行统计分析的手段，关系数据库中我们常会用到avg,sum,count，groupby这些聚合手段进行简单的统计与分析。在ES中也提供了同样的功能，根据使用模式，分为以下几种：数字指标(metrics)聚合：根据输出的是单值的还是多值的分为单值数字指标与多值数字指标，计算使用的域可直接从文本中抽取也可使用脚本生成。分组(bucket
编程随笔-ElasticSearch知识导图(6)：管理简单是美美
1.集群API “curl-iXGET"http://192.168.127.100:9200/_cluster/health?pretty=true"”这样的命令可能大家在日常工作中会经常使用，它用来显示当前集群的健康程度，在返回结果中，包含当前集群有关的一些关键信息（文献2提到了一个使用“wait_for_status”的小技巧）。 ES提供了类似上面命令的集群API用于获取集群即时状态与
编程随笔-ElasticSearch知识导图(1)：全景简单是美美
1.由ElasticSearch开始的思考官方介绍Elasticsearch(以下简称ES)是一个基于ApacheLucene(TM)的开源搜索引擎。但我最初了解ES却是从NoSQL数据库开始，在使用、研究了ES一段时间后，我发现这是一个优秀的分布式部署软件，不仅是一个全文搜索引擎、还是一个分布式存储系统、一个分布式数据库。在ES之前我们习惯使用关系数据库(RDBMS)来进行现实数据世界的
编程随笔-ElasticSearch知识导图(4)：搜索简单是美美
1.原理全文搜索是ES的核心功能。ES中的数据按数据特性可分为两类：确切值及全文文本。ES中如keyword,date这些类型的值都可视为确切值。而text类型的值则视为全文文本数据。为了对全文文本进行搜索，ES使用分析器(analyzer，根据不同自然语言、不同要求选择不同的分析器)将文本分析为单独的词(英文为terms或tokens，这里符合中国人的习惯，称为词),然后根据分词结果创建
编程随笔（一） justCode_
其实，确实不知道该取什么名字。就说说，最近的状态吧。最近一段时间，除了正常的工作以外（我是Android开发）。我把Android技术进行了提炼，开始渐渐形成自己的技术库。很多，项目中需要用到的技术，我甚至可以直接把我写的工具，拷贝进去，就能调用了。其实，就是对一些东西进行了简单的封装。说到这里，顺带提一下，我的一个观念：模式（方案/模板）。大多数的开发工作，其实都是相似的，或者用到了相似的技术，
Windows核心编程随笔 lsgxeva
Windows核心编程随笔来源https://www.cnblogs.com/ckjbug/p/11589106.html最近在学习Windows底层原理，准备写个系列文章分享给大家，MichaelLi（微软实习期间的Mentor，为人超好）在知乎回答过一些关于学习Windows原理的书籍推荐，大家可以拜读其中一本来入门。我是先从《Windows核心编程》开始了解一些Windows底层管理与硬件交
编程随笔-ElasticSearch知识导图(2)：分布式架构简单是美美
1.集群结构在我们探究ES的分布式架构之前，我们使用一个简单的导图描述一下我们在设计分布式系统时会考虑的问题，如图1所示。图1 带着图1中的问题我们来探究一下ES集群，ES集群是一个典型的主从结构，从某种意义上来说，符合现今大多数主流分布式存储、分布式计算系统的审美要求。下面我们逐步来了解集群中的这些东东。先用来自文献2的一张集群结构图开始我们的探究。图21.1集群节点在ES集群中，
编程随笔-java编程知识收纳-容器简单是美美
JDK容器 java中的容器使用是java程序员在编程开发中必不可少的技能，就算是刚入门的java程序员，也一定会用到ArrayList，Hashmap这样的容器。在《java编程思想》提供了一张JDK中容器的知识图谱，而自JDK1.5后也增加了不少新的容器类。花了一点时间，把JDK中的容器类以导图的形式描述出来，做为一个以后工作的备查记录。 JDK中的容器种类繁多，但常用的可能也就不到十种，
编程随笔-ElasticSearch知识导图(6)：管理简单是美美 elasticsearch ES
1.集群API “curl-iXGET"http://192.168.127.100:9200/_cluster/health?pretty=true"”这样的命令可能大家在日常工作中会经常使用，它用来显示当前集群的健康程度，在返回结果中，包含当前集群有关的一些关键信息（文献2提到了一个使用“wait_for_status”的小技巧）。 ES提供了类似上面命令的集群API用于获取集群即时状态与
编程随笔-ElasticSearch知识导图(5)：聚合简单是美美 elasticsearch 大数据聚合
1.聚合模式聚合(Aggregations)是对数据库中数据域进行统计分析的手段，关系数据库中我们常会用到avg,sum,count，groupby这些聚合手段进行简单的统计与分析。在ES中也提供了同样的功能，根据使用模式，分为以下几种：数字指标(metrics)聚合：根据输出的是单值的还是多值的分为单值数字指标与多值数字指标，计算使用的域可直接从文本中抽取也可使用脚本生成。分组(bucket
编程随笔-ElasticSearch知识导图(4)：搜索简单是美美 elasticsearch 视频图像信息数据库
1.原理全文搜索是ES的核心功能。ES中的数据按数据特性可分为两类：确切值及全文文本。ES中如keyword,date这些类型的值都可视为确切值。而text类型的值则视为全文文本数据。为了对全文文本进行搜索，ES使用分析器(analyzer，根据不同自然语言、不同要求选择不同的分析器)将文本分析为单独的词(英文为terms或tokens，这里符合中国人的习惯，称为词),然后根据分词结果创建
编程随笔-ElasticSearch知识导图(3)：映射简单是美美 elasticsearch es mapping
1.啥是映射 ES中的映射(Mapping)实质上就是对文档对象结构的定义，也即对文档中各元素的描述。在ES中定义映射，就如同定义XML文档的XMLSchema。 ES中的映射定义了文档模式（就如同在关系数据库中定义了关系模式），文档模式确定了存在ES中的文档的格式，结构和字段的数据类型。通过查看某个索引的映射可以了解文档的结构，以便使用查询语言(QueryDSL)构建更符合我们要求的查询命令
编程随笔-ElasticSearch知识导图(2)：分布式架构简单是美美 ElasticSearch 分布式架构
1.集群结构在我们探究ES的分布式架构之前，我们使用一个简单的导图描述一下我们在设计分布式系统时会考虑的问题，如图1所示。带着图1中的问题我们来探究一下ES集群，ES集群是一个典型的主从结构，从某种意义上来说，符合现今大多数主流分布式存储、分布式计算系统的审美要求。下面我们逐步来了解集群中的这些东东。先用来自文献2的一张集群结构图开始我们的探究。1.1集群节点在ES集群中，一个ES
编程随笔-ElasticSearch知识导图(1)：全景简单是美美 ElasticSearch 分布式架构 ES
1.由ElasticSearch开始的思考官方介绍Elasticsearch(以下简称ES)是一个基于ApacheLucene(TM)的开源搜索引擎。但我最初了解ES却是从NoSQL数据库开始，在使用、研究了ES一段时间后，我发现这是一个优秀的分布式部署软件，不仅是一个全文搜索引擎、还是一个分布式存储系统、一个分布式数据库。在ES之前我们习惯使用关系数据库(RDBMS)来进行现实数据世界的
编程随笔(知识收纳)-git常用命令示例简单是美美 git 命令
1.直接提交文件对于git在本地版本库中已有的文件，可以不用执行“gitadd”操作，直接将工作区的文件提交到版本库(非index区)$gitcommit-m"pages/mainContent.html"pages/mainContent.html[master78b06dc]pages/mainContent.html1filechanged,40insertions(+),31delet
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

邮件定时发送微博热搜

你可能感兴趣的:(编程随笔)