不务正业RD从产品经理转行到数据分析

PSM+DID 效果评估python demo 、线性分类模型+双重差分法

需求背景：

策略不适用随机分流，在某部分人群全量上线，需要同通过构建相似人群的方式，对策略进行评估。

评估方案：

1、使用PSM构建相似人群，确保实验组与对照组在AA期的评估指标趋势能够保持一致

2、通过DID对实验效果进行评估，确认策略对实验组的影响。

一、构建相似人群

1.1环境包导入


import warnings
warnings.filterwarnings('ignore')
# from pymatch.Matcher import Matcher
import pandas as pd
import numpy as np
%matplotlib inline
from scipy import stats
import matplotlib.pyplot as plt
import patsy
from statsmodels.genmod.generalized_linear_model import GLM
import statsmodels.api as sm
import seaborn as sns
import sys
import os
from jinja2 import Template
import prestodb
from pyhive import hive
from scipy import stats
import patsy
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib
#指定默认字体
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
#解决负号'-'显示为方块的问题
matplotlib.rcParams['axes.unicode_minus'] = False


def presto_read_sql_df(sql):
    conn=prestodb.dbapi.connect(
    host=os.environ['PRESTO_HOST'],
    port=os.environ['PRESTO_PORT'],
    user=os.environ['JUPYTER_HADOOP_USER'],
    password=os.environ['HADOOP_USER_PASSWORD'],
    catalog='hive')
    cur = conn.cursor()
    cur.execute(sql)
    query_result = cur.fetchall() 
    colnames = [part[0] for part in cur.description]
    raw = pd.DataFrame(query_result, columns=colnames,dtype=np.float64)
    return raw


def hive_read_sql_df(sql):
    conn = hive.connect(
        host=os.environ['PYHIVE_HOST'], 
        port=os.environ['PYHIVE_PORT'],
        username=os.environ['JUPYTER_HADOOP_USER'],
        password=os.environ['HADOOP_USER_PASSWORD'],
        auth='LDAP',
        configuration={'mapreduce.job.queuename': os.environ['JUPYTER_HADOOP_QUEUE'],
                       'hive.resultset.use.unique.column.names':'false'})
    raw = pd.read_sql_query(sql,conn)
    return raw

1.2数据获取


# 1.2.1通过SQL查询数据
# df = hive_read_sql_df("""
#     select
#         XXXX
#     from
#         XXXXX
#     where
#         XXXXX
# """)
# df.to_csv('file_name.csv',encoding='gbk',sep=',',index = False)


#1.2.2通过文件读取获得数据
df = pd.read_csv('file_name.csv',encoding='gbk')
y_date = df 


y_date.dtypes #check 数据的数据类型

1.3模型构建

# 设定匹配因子和分组标签

X_field=[
    'XXXX' ,'XXXX','XXXX' #分组标签名称
]
Y_field=['is_group']
field=X_field+Y_field
field

# 循环字段 ：根据需要选择，仅匹配一组，则不需要循环
city_list = { 
#                 'XXXX','XXXX','XXXX'

            }

city_psm_dri = None 



for x in city_list :
    city_name = x 
    print('='*20+'城市：'+city_name +'='*20)  

    query_str = "city_name=='"+city_name+"'"
    city_info = y_date.query(query_str)  

    #数据筛选，删除一些非必要的数据
    city_info = city_info.drop(columns=["city_name"]) #删除城市名称列 
    city_info = city_info.query("is_strategy_time=='0'") 
    city_info = city_info.query("XXX > 0")

    #归一化 非必须 
    
    city_info.online_days = (city_info.online_days-city_info.online_days.min())/(city_info.online_days.max()-city_info.online_days.min())
    
    
    
    data=city_info
    data=data.dropna()
    # 区分实验/对照组样本
    treated=data[(data['is_group']==1)]
    control=data[(data['is_group']==0)] 

    ttest_result_t=pd.DataFrame(stats.ttest_ind(treated,control))

    data_p = data

    # 构建一个线性模型
    print("-"*20+'模型定义'+"-"*20)
    y_f,x_f=patsy.dmatrices('{} ~ {}'.format(Y_field[0], '+'.join(X_field)), data=data_p, return_type='dataframe')
    formula = '{} ~ {}'.format(Y_field[0], '+'.join(X_field))
    print('Formula:    '+formula)
    i=0
    nmodels=100
    errors=0
    model_accuracy = []
    models = []
    while i < nmodels and errors < 5:
        sys.stdout.write('\r{}: {}\{}'.format("Fitting Models on Balanced Samples", i, nmodels)) #第几个模型
        # sample from majority to create balance dataset
        df = control.sample(len(treated)).append(treated).dropna()  #模型选择相同的对照组和控制组样本
        y_samp, X_samp = patsy.dmatrices(formula, data=df, return_type='dataframe')   #选出模型的自变量和因变量   
        glm = GLM(y_samp, X_samp, family=sm.families.Binomial())  #逻辑回归模型    
        try:
            res = glm.fit()
            preds = [1.0 if i >= .5 else 0.0 for i in res.predict(X_samp)]
            preds=pd.DataFrame(preds)
            preds.columns=y_samp.columns
            b=y_samp.reset_index(drop=True) 
            a=preds.reset_index(drop=True) 
            ab_score=((a.sort_index().sort_index(axis=1) == b.sort_index().sort_index(axis=1)).sum() * 1.0 / len(y_samp)).values[0] # 模型预测准确性得分
#             print('   model_accuracy:{}'.format(ab_score))
            model_accuracy.append(ab_score)
            models.append(res)
            i += 1
        except Exception as e:
            errors += 1 # to avoid infinite loop for misspecified matrix
            print('\nError: {}'.format(e))
    
    print("\nAverage Accuracy:", "{}%".
          format(round(np.mean(model_accuracy) * 100, 2)))# 所有模型的平均准确性
    
    print('Fitting 1 (Unbalanced) Model...')
    if errors >= 5: ##异常城市
        print("【异常警告：】"+city_name+'数据出现异常，该城市数据未记录\n')
        city_info.to_csv(city_name+'.csv',encoding='gbk',sep=',',index = False)
        continue 
    glm = GLM(y_f, x_f, family=sm.families.Binomial())
    res = glm.fit()
    # model_accuracy.append(self._scores_to_accuracy(res, x_f, y_f))
    preds = [1.0 if i >= .5 else 0.0 for i in res.predict(x_f)]
    preds=pd.DataFrame(preds)
    preds.columns=y_f.columns
    b=y_f.reset_index(drop=True) 
    a=preds.reset_index(drop=True) 
    ab_score=((a.sort_index().sort_index(axis=1) == b.sort_index().sort_index(axis=1)).sum() * 1.0 / len(y_f)).values[0]
    model_accuracy.append(ab_score)
    models.append(res)

    print("\nAccuracy", round(np.mean(model_accuracy[0]) * 100, 2))
    
    scores = np.zeros(len(x_f))
    for i in range(nmodels):
        m = models[i]
        scores += m.predict(x_f)
    data_p['scores'] = scores/nmodels
    
    # 绘图 
    plt.figure(figsize=(10,5))
    sns.distplot(data_p[data_p[Y_field[0]]==0].scores, label='Control')
    sns.distplot(data_p[data_p[Y_field[0]]==1].scores, label='Test')
    plt.legend(loc='upper right')
    plt.xlim((0, 1))
    plt.title("Propensity Scores Before Matching")
    plt.ylabel("Percentage (%)")
    plt.xlabel("Scores")
    threshold=0.00001
    method='min' # 使用最近样本匹配方法
    nmatches=1
    test_scores = data_p[data_p[Y_field[0]]==True][['scores']]
    ctrl_scores = data_p[data_p[Y_field[0]]==False][['scores']]
    result, match_ids = [], []
    for i in range(len(test_scores)):
        #print(i)
        if i % 10 == 0:
            sys.stdout.write('\r{}: {}'.format("Fitting Samples", i ))
        # uf.progress(i+1, len(test_scores), 'Matching Control to Test...')
        match_id = i
        score = test_scores.iloc[i]
        if method == 'random':
            bool_match = abs(ctrl_scores - score) <= threshold
            matches = ctrl_scores.loc[bool_match[bool_match.scores].index]
        elif method == 'min':
            matches = abs(ctrl_scores - score).sort_values('scores').head(nmatches)
        else:
            raise(AssertionError, "Invalid method parameter, use ('random', 'min')")
        if len(matches) == 0:
            continue
        # randomly choose nmatches indices, if len(matches) > nmatches
        select = nmatches if method != 'random' else np.random.choice(range(1, max_rand+1), 1)
        chosen = np.random.choice(matches.index, min(select, nmatches), replace=False)
    #     print(chosen)
        result.extend([test_scores.index[i]] + list(chosen))
        match_ids.extend([i] * (len(chosen)+1))
        ctrl_scores=ctrl_scores.drop(chosen,axis=0)
    matched_data =data_p.loc[result]
    matched_data['match_id'] = match_ids
    matched_data['record_id'] = matched_data.index
    print("\n匹配结果：")
    print(len(matched_data[matched_data['is_group']==0]['record_id'].unique()))
    print(len(matched_data[matched_data['is_group']==1]['record_id'].unique()))
    # m.plot_scores()
    plt.figure(figsize=(10,5))
    sns.distplot(matched_data[matched_data[Y_field[0]]==0].scores, label='Control')
    sns.distplot(matched_data[matched_data[Y_field[0]]==1].scores, label='Test')
    plt.legend(loc='upper right')
    plt.xlim((0, 1))
    plt.title("Propensity Scores After Matching")
    plt.ylabel("Percentage (%)")
    plt.xlabel("Scores")
    matched_data['city_name'] = city_name
    file_name = 'result'+city_name+'.csv'
    matched_data.to_csv(file_name,encoding='gbk',sep=',',index = False)
    if type(city_psm_dri) == type(None) :
        city_psm_dri = matched_data
    else :
        city_psm_dri = pd.concat([city_psm_dri,matched_data])
city_psm_dri.to_csv('result.csv',encoding='gbk',sep=',',index = False)

二、DID效果评估

2.1环境包导入

import statsmodels.formula.api as smf
import pandas as pd

import matplotlib.pyplot as plt
import matplotlib
#指定默认字体
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.family']='sans-serif'
#解决负号'-'显示为方块的问题
matplotlib.rcParams['axes.unicode_minus'] = False


import prestodb
import os
from pyhive import hive
def presto_read_sql_df(sql):
    conn=prestodb.dbapi.connect(
    host=os.environ['PRESTO_HOST'],
    port=os.environ['PRESTO_PORT'],
    user=os.environ['JUPYTER_HADOOP_USER'],
    password=os.environ['HADOOP_USER_PASSWORD'],
    catalog='hive')
    cur = conn.cursor()
    cur.execute(sql)
    query_result = cur.fetchall() 
    colnames = [part[0] for part in cur.description]
    raw = pd.DataFrame(query_result, columns=colnames,dtype=np.float64)
    return raw


def hive_read_sql_df(sql):
    conn = hive.connect(
        host=os.environ['PYHIVE_HOST'], 
        port=os.environ['PYHIVE_PORT'],
        username=os.environ['JUPYTER_HADOOP_USER'],
        password=os.environ['HADOOP_USER_PASSWORD'],
        auth='LDAP',
        configuration={'mapreduce.job.queuename': os.environ['JUPYTER_HADOOP_QUEUE'],
                       'hive.resultset.use.unique.column.names':'false'})
    raw = pd.read_sql_query(sql,conn)
    return raw

2.2数据读取与验证

df = pd.read_csv('20220617171533.csv',encoding='gbk')
print('shape:'+ str(df.shape))
df.dtypes
df.head().T 
df.describe()

2.3增量评估

city_list = { 
 'XXXX'
            }

data = df 
city_num=0
for city_name in city_list :
    city_num=city_num+1
    "city_name=='"+city_name+"'"
    city_info = data.query("city_name=='"+city_name+"'")
    print("="*20+str(city_num)+"="*20)
#     print(city_info.shape)

    value     = list([city_info.tsh][0])
    group     = list([city_info.is_group][0])
    strategy  = list([city_info.is_strategy_time][0])
    tg        = list([city_info.tg][0])
    
    aa = pd.DataFrame({'strategy':strategy,'group':group,'tg':tg,'value':value })
    X = aa[['strategy', 'group','tg']]
    y = aa['value']
#     print(X.shape)
#     print(y.shape)
    est = smf.ols(formula='value ~ strategy + group + tg ', data=aa).fit() 
    y_pred = est.predict(X)
    aa['value_pred'] = y_pred
    
    #策略增量 
    dat_tsh = est.params.tg / (est.params.strategy + est.params.group  + est.params.Intercept ) 
    p_value = est.pvalues.tg 
    if p_value < 0.05 :
        print(city_name+":△TSH = %.2f %%，效果显著 " % (dat_tsh*100))
        
    else :
        print(city_name+":△TSH = %.2f %%，效果不显著 " % (dat_tsh*100))
    
#     print(est.params)
#     print(est.pvalues)

2.4趋势绘图

def get_trend_plot(matched_long_new,city_name):
    yx_trend = matched_long_new.groupby(['is_group','mon']).tsh.mean().reset_index()

    fig, axes = plt.subplots(1, 1,figsize=(10,4), sharex = False, subplot_kw=dict(frameon=False))
    
    x = yx_trend.loc[yx_trend.is_group==1,'mon'].astype(str)
    y1 = yx_trend.loc[yx_trend.is_group==1,'tsh']
    y2 = yx_trend.loc[yx_trend.is_group==0,'tsh']
    axes.plot(x, y1,color='coral', linestyle='-', marker='o', label='实验组')
    axes.plot(x, y2,color='cornflowerblue', linestyle='--', marker='o', label='对照组')
    # 取time变量为0，即匹配期的最大日期，作为分界线
    axes.axvline(x=matched_long_new.loc[matched_long_new.is_strategy_time==0].mon.max(), color='red', linestyle='--')
    axes.set_xlabel(None)
    axes.set_ylabel('TSH',rotation=0,labelpad=20)
#     axes.set_xticklabels(labels=[i.replace('2021-','') for i in x],rotation = 40)
    axes.legend()
    axes.set_title('%s:XXXXX效果by月'%city_name)
    plt.show()


city_num=0
for city_name in city_list :
    city_num=city_num+1
    "city_name=='"+city_name+"'"
    city_info = data.query("city_name=='"+city_name+"'")
    get_trend_plot(city_info,city_name)
#     if city_num == 2 :
#         break

若在策略上线前，实验组对照组趋势非常相似，则认为psm匹配效果很好，策略增量置信度高

策略上线前，实验组对照组趋势GAP不稳定，则认为PSM人群不够相似，策略的增量置信度低，建议重新进行人群匹配。

结语：

1、psm选择指标时，需要确保指标对AB两组人群是根据样本自身行为有关的，与AB两组样本是无关的。

2、在构建相似人群时，需要注意人群是否本身存在一定的主观意愿的差异，即用户成为A人群和B人群是否是随机事件。如果存在主观的差异，尽管很多行为指标被psm拉齐，但人群仍然是不同质的，潜在的对策略的影响可能不同，从而导致结果虚高或者虚低。

例如A组是全量天猫商家，B组是全量淘宝商家，在全量B中选择A相似人群。
首先，用户成为A或着B，两组样本本身存在主管意愿的差异，已经具备了样本不同质，对策略的敏感度可能不同。

其次，如果相似指标中包含店铺评分指标，A组和B组虽然都有店铺评分，但A、B的评分体系并不相同，所以这类指标不适宜作为相似指标进行筛选。

（例子不是很合适，我也不能讲我自身的业务，但相信大家可以get到我想说的是什么

本人的相关文章都是相对入门的一些数据分析方法，不会过多的讲解原理，更多的讲解怎么帮助业务解决问题。先在工作中用起来。

如果对你的工作有帮助，帮你节约了一定的时间成本，慷慨的打赏起来吧，一元两元也是爱~

打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
题解 | #使用join查询找出没有分类的电影id以及名称# 愤怒的小青春 java
58同城java后端一面凉经主流的哈希算法有哪几种？帮闺蜜们找靠谱男票hc多多光彩积云是什么企业，查不到有用信息太抽象了！培训班装公司招聘阿里巴巴前端暑期实习——无语八面挂怎么写自我介绍|自我介绍保姆级教学灵犀互娱客户端一面面经(求过啊)24找运维实习，这简历可行吗拓竹科技测试开发面经（25届暑期实习）分享一波攒了整个秋招的NLP算法岗面经腾讯广告暑期实习面试1、JVM垃圾回收机制2、syncho
gitlab修改DNS解析配置文件中东大鹅 gitlab linux git
在Linux（CentOS7.9）云服务器上解压gitlab时提示需要Python的环境[root@rainyun-v1vct1josrc]#rpm-ivhgitlab-ce-10.8.4-ce.0.el7.x86_64.rpmwarning:gitlab-ce-10.8.4-ce.0.el7.x86_64.rpm:HeaderV4RSA/SHA1Signature,keyIDf27eab47:N
【算法题解】部分洛谷题解(下) 日月星辰cmc 算法分析与设计算法
前言本篇为我做过的洛谷题的部分题解，大多是我认为比较具有代表性的或者比较有意思的题目，包含我自己的思考过程和想法。[NOIP2001提高组]一元三次方程求解题目描述有形如：ax3+bx2+cx+d=0ax^3+bx^2+cx+d=0ax3+bx2+cx+d=0这样的一个一元三次方程。给出该方程中各项的系数（a,b,c,da,b,c,da,b,c,d均为实数），并约定该方程存在三个不同实根（根的范围
LeetCode - 3274. Check if Two Chessboard Squares Have the Same Color 阿蒙Armon LeetCode leetcode 算法职场和发展
LeetCode-3274.CheckifTwoChessboardSquaresHavetheSameColor在LeetCode的算法题库中，有许多有趣的题目将实际场景与编程逻辑相结合，LeetCode3274题CheckifTwoChessboardSquaresHavetheSameColor便是其中之一。这道题以国际象棋棋盘为背景，要求我们判断给定的两个方格颜色是否相同。通过解决这道题，
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1024 一元三次方程求解热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：
Python FastAPI 与传统 Web 框架的性能对比 Python编程之道 python fastapi 前端 ai
PythonFastAPI与传统Web框架的性能对比关键词：FastAPI、性能对比、Web框架、异步编程、Python、Django、Flask摘要：本文深入探讨了FastAPI与传统PythonWeb框架（如Django和Flask）在性能方面的差异。我们将从架构设计、请求处理模型、并发能力等多个维度进行对比分析，并通过基准测试数据展示实际性能差异。文章还将提供代码示例和性能优化建议，帮助开发
监控漏检频发？陌讯YOLOv7实时优化方案召回率提升25% 2501_92489016 目标跟踪人工智能计算机视觉算法目标检测视觉检测智慧城市
一、开篇痛点在安防监控领域，传统目标检测模型面临三重困境：实时性差：1080P视频流处理普遍低于20FPS（VGG16仅15FPS）漏检率高：密集场景下小目标召回率常低于60%（COCO-val实测数据）部署成本高：ResNet-101需8GB显存，难以边缘化部署某智慧园区项目显示：夜间误报率高达34%，运维成本激增300%二、技术解析：陌讯SlimYOLO架构创新针对上述痛点，陌讯视觉算法提出三
Python Django 数据库索引优化 Python编程之道 python django 数据库 ai
PythonDjango数据库索引优化关键词：DjangoORM、数据库索引、查询优化、性能调优、PostgreSQL、MySQL、执行计划摘要：本文深入探讨Django框架中的数据库索引优化策略。我们将从数据库索引的基本原理出发，详细分析DjangoORM如何生成SQL查询，以及如何通过合理的索引设计提升查询性能。文章包含索引类型选择、复合索引优化、Django模型字段索引配置、查询集优化技巧等
Python Scrapy爬取办公用品网站数据的策略 Python编程之道 python scrapy 开发语言 ai
1.引入与连接想象一下，你是一家办公用品公司的市场调研人员，需要了解竞争对手的产品价格、种类等信息。如果手动去各个办公用品网站收集这些数据，那将是一项极其繁琐且耗时的工作。而Python的Scrapy框架就像是一个不知疲倦的超级助手，能帮你快速、高效地从众多网站抓取所需数据。你可能已经对Python有了一定的了解，知道它是一门功能强大且应用广泛的编程语言。Scrapy则是Python中专门用于网络
使用Python Scrapy打造个性化爬虫
使用PythonScrapy打造个性化爬虫——知识金字塔构建1.引入与连接：从“手动复制”到“自动化采集”的跨越你是否遇到过这样的场景？想整理1000条知乎优质回答做数据分析，却要逐条复制；想追踪某电商平台的商品价格波动，却要每天手动刷新页面……这些重复劳动，正是“个性化爬虫”的用武之地！与已有知识的连接：你可能用过requests+BeautifulSoup写过简单爬虫，但面对大规模数据、复杂反
新手向:基于 Python 的简易视频剪辑工具
在数字媒体时代，视频创作已成为大众表达的重要形式，从个人vlog制作到企业宣传视频，视频内容的需求呈现爆发式增长。传统专业软件如AdobePremierePro虽功能强大，提供完整的非线性编辑系统，但存在学习曲线陡峭（新手通常需要数周系统学习）、资源占用高（最低配置要求8GB内存）、授权费用昂贵（订阅价约20美元/月）等痛点。相比之下，Python凭借其丰富的多媒体库生态系统（如OpenCV、Mo
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
Python 数据插值：NumPy 实现多种插值方法
Python数据插值：用NumPy解锁缺失数据的秘密拼图关键词数据插值、NumPy、线性插值、多项式插值、缺失值处理、数据平滑、数值分析摘要在数据分析和科学计算中，我们经常遇到离散或缺失的观测数据——比如气象站每小时记录的温度值有缺失，或者实验中只采集了稀疏的采样点。这时候，数据插值（Interpolation）就像“数据修复师”，能根据已知点推断出未知点的数值，让离散数据变成连续的“故事”。本文
琉璃叶昭全文免费阅读（和闺蜜一起穿进仙界救赎文小说）全文免费琉璃叶昭读无弹窗大结局_(琉璃叶昭和闺蜜一起穿进仙界救赎文小说免费琉璃叶昭读全文大结局)最新章节列表_笔趣阁（琉璃叶昭）花朵文库
琉璃叶昭全文免费阅读（和闺蜜一起穿进仙界救赎文小说）全文免费琉璃叶昭读无弹窗大结局_(琉璃叶昭和闺蜜一起穿进仙界救赎文小说免费琉璃叶昭读全文大结局)最新章节列表_笔趣阁（琉璃叶昭）主角配角：琉璃叶昭小说别名：和闺蜜穿越到仙侠文的第一千年。系统终于大发慈悲的告诉了我们，回归现实世界的方法。我的夫君天族太子，也在宴会上豪气的散发了百万功德。让参加宴会的众人乐开了花。为这位刚刚归位的仙子撑足了场面。听到
【Python LeetCode 专题】热题 100，重在思路一杯水果茶！人生苦短我用 Python python leetcode
哈希1.两数之和49.字母异位词分组128.最长连续序列双指针283.移动零11.盛最多水的容器15.三数之和42.接雨水滑动窗口3.无重复字符的最长子串438.找到字符串中所有字母异位词子串560.和为K的子数组239.滑动窗口最大值普通数组53.最大子数组和56.合并区间189.轮转数组238.除自身以外数组的乘积矩阵73.矩阵置零链表160.相交链表206.反转链表234.回文链表141.环
JAVA刷题记录: 专题十五 BFS解决FloodFill算法用屁屁笑宽度优先算法
733.图像渲染-力扣（LeetCode）classSolution{int[]dx={0,0,-1,1};int[]dy={1,-1,0,0};publicint[][]floodFill(int[][]image,intsr,intsc,intcolor){intprev=image[sr][sc];if(color==prev)returnimage;Queueq=newLinkedList
自己开发FT4222上位机软件 - USB转SPI EE工程师嵌入式系统 python 单片机模块测试
写作背景最近公司有个项目，让开发一个能够同时进行千兆网接收和SPI配置的上位机软件，开发语言不限，所以作者选择Python+PyQt作开发，做嵌入式固件开发的读者可能知道还需要一块USB转SPI的模块才能进行上下位机正常SPI读写，项目团队成员建议模块从淘宝网购买就好，作者经过调研对比，感觉从芯片质量到开发配套上来讲，FTDI的FT4222模块是最优选择。但令作者感到不快的是淘宝商家不提供模块
自己开发I2C Bootloader -上位机开发篇 EE工程师嵌入式系统 python stm32 单片机
上位机脚本开发在芯片原厂大部分工程师选择的脚本语言依然是Python,Python有哪些开发优势这里就不再讨论了，这里我们只陈述一下上位机的开发环境，作者的开发环境是VSCode+Anaconda。脚本内容也没有什么好说的，一看就懂，比较简单。唯一值得提醒的是本项目的上位机开发需要多注意*Write_DataBytes_To_Serial_Port(self,DataBytes):*函数的实现
Shell脚本-cut工具咖啡の猫 chrome 前端
一、前言在Linux/Unix系统中，cut是一个非常实用的文本处理命令，用于从文件或标准输入中提取特定列的内容。它特别适用于处理结构化文本数据，例如CSV文件、日志文件、配置文件等。无论是做数据分析、系统监控，还是编写自动化脚本，cut都是一个不可或缺的工具。本文将带你全面了解cut工具的使用方式，包括：✅cut的基本语法与常用参数✅如何按字符、字节、字段进行提取✅cut在Shell脚本中的实战
Grok网站的后端语言是php和Python2.7 言之。随笔随笔
老马的Grok模型https://grok.com/#subscribephp语法这里还出现了两个bug后端语言能看到是php和python2.7要说卷还是得看中国的程序员啊，天天就是新技术，赶不上别人就35岁毕业退休
14.优化算法之BFS解决FloodFill算法1 muyierfly 算法题算法宽度优先深度优先
0.FloodFill简介dfs：深度优先遍历（红色）bfs：宽度优先遍历1.图像渲染算法原理classSolution{int[]dx={0,0,1,-1};int[]dy={1,-1,0,0};publicint[][]floodFill(int[][]image,intsr,intsc,intcolor){intprev=image[sr][sc];//统计刚开始的颜⾊if(prev==co
BFS 解决 FloodFill 算法(C++) lim 鹏哥刷题算法宽度优先 c++
文章目录前言一、概念二、岛屿数量1.题目链接2.算法原理3.代码编写三、被围绕的区域1.题目链接2.算法原理3.代码编写总结前言一、概念BFS就是广度优先遍历，也就是层序遍历。FloodFill是指在数组中找出性质相同的连通块，并根据题目进行操作。二、岛屿数量1.题目链接200.岛屿数量2.算法原理遍历整个矩阵，每找到一块陆地，记录一次。我们怎末知道我们是否已经遍历过这个地方了呢？？方法1：如果遍
BFS-FloodFill 算法解决最短路问题多源解决拓扑排序 penguin_bark #BFS 算法宽度优先 leetcode
文章目录一、FloodFill算法[733.图像渲染](https://leetcode.cn/problems/flood-fill/description/)2.思路3.代码[200.岛屿数量](https://leetcode.cn/problems/number-of-islands/description/)2.思路3.代码[LCR105.岛屿的最大面积](https://leetcod
头盔识别误报率高？陌讯YOLOv7优化方案实测准确率达99%！
开篇痛点：算法失效的致命时刻在智慧交通领域，电动车头盔识别长期面临三大痛点：漏检危机：行人遮挡、雨天反光导致传统算法漏检率高达15%（某头部车企实测数据）误报泛滥：相似物体（背包、安全帽）误识别率超20%实时性缺陷：开源模型在1080P视频流中处理延时＞200ms，无法满足实时预警需求技术解析：陌讯算法三重创新架构graphTDA[双路输入]-->B[多尺度特征融合模块]B-->C[空间注意力机制
必看：购买黄金投资局中局曝光！伍戈碳中和云数据分析就是骗局！不成功不收费
被骗案例：聊天软件讲股票，又忽悠股民搞碳中和项目，云数据分析项目等才后来让我们自己投钱怕我们不相信还请反诉警员给上课，给我画大饼，说每月发6千元的工资，所以放松警惕上当了，投了钱，我投的少，还特别照顾我单独做，达到他们的标准，他们明知我没有钱，每天照顾在两次，赚了一百多万，让我提款必须交税5%，我没钱无法交税，一分也取不出来，而且还有时侯规定，我只能自已做让账户回到我能交的起税的金额，但你要交钱时
「感恩日语」2021-303篇，吸渣体质能学多少学多少
学习感悟，避免成为“吸渣”体质很重要，“环境”能改变人，学会甄别那些“书籍”、那些“文章”（论文）对自己成长有利，而非“奶头乐”系统算法之类推送的让自己无法自拔的内容，个人每天、每周、每月、每年、一生总时间是有限的，缩小到每天，计算一下每天浪费有多少，真正发挥价值时间效力有多少，简单做个记录，会发现很可怕。同时找到了为什么每天进步一点点的重要性，只跟昨天的自己，前天的自己比较一下，很重要，多做对自
【python】图片批量压缩脚本横桥码农 python python
#-*-coding:utf-8-*-'''图片批量压缩脚本将脚本放入待压缩文件夹下，并运行自动生成压缩文件夹compress'''fromPILimportImageimportosimportsysimportiosys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')defcompress_image(input_imag
python 中列表,元组和集合常用方法 [自由之路] python python windows 开发语言
列表列表中可以添加不同类型的元素,如:int类型和str类型deftest_list():"""测试列表的基本操作"""var9=range(10)_var9=list(var9)#将range对象转换为列表copy_var9=_var9.copy()#复制列表_var9.append(1)#添加一个元素到列表中count=_var9.count(1)#计算1出现的次数print(f"counto
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l