一个从大山到原野的孩子

Python3：《学习笔记与实战》之房源周报（1）连接hive

一，python3 连接hive 步骤

python3 连接hive 的环境安装

1、pip install six

2、pip install bit_array

3、pip install thriftpy ##注意: thrift (on Python 2.x) or thriftpy (on Python 3.x)

4、pip install thrift_sasl

5、pip install impyla

6、pip install sasl

查找sasl文件的路径

①.wheel address：https://www.lfd.uci.edu/~gohlke/pythonlibs/#sasl

②.打开①中的连接后，CTRL+F 输入sasl 找到对应的版本

③.打开anaconda的安装文件，修改 D:\Anaconda3\Lib\site-packages\thriftpy\parser 488行的代码。注销if url_scheme =='': 改为 if len(url_scheme)<= 1:

④.直接pip 这个文件就可以

from impala.dbapi import connect  #引入此包 与hive 建立连接
from impala.util import as_pandas  # 把hive查询结果 直接转化为pandas
import pandas as pd
import pymysql
import xlwt   #excel  操作包
import re

pd.set_option("display.width",5000)


def hive():
    cur = connect(host='192.168.0.0',port=10000,database='default').cursor()
    print('hive 连接成功')
    cur.execute("select * from dianpu_new where pub_date between '2019-03-31'and '2019-03-31'")
    hive_data = as_pandas(cur) 
    #print("hive_data",hive_data)
    cur.close()
    
    return hive_data

def dataframe_manage(hive_data):
    df = hive_data
    #columns_name  = [ column for column in df.columns.tolist()]  #列表解析表达式
    print("columns_name", columns_name )
    df.columns = [(column.replace('dianpu_new.','')) for column in df.columns.tolist()]
    print("df.columns",df.columns)
    df = df.drop(df[df['address']==None].index.tolist())
    df.dropna(how='any',axis=0)
    return df

    

if __name__ == '__main__':
    hive_data=hive()
    df = dataframe_manage(hive_data)

from impala.dbapi import connect
from impala.util import as_pandas
import pandas as pd
import pymysql
import xlwt
import re
import time
from time import ctime, sleep
import collections


pd.set_option("display.width",5000)

startTime = time.time()


def hive():
    cur = connect(host='192.168.0.0',port=10000,database='default').cursor()
    print('hive 连接成功')
    cur.execute("select * from dianpu_new where pub_date between '2019-03-31'and '2019-03-31'")
    hive_data = as_pandas(cur) 
    m,n= hive_data.shape
    #print("m,n",m,n)
    cur.close()
    
    return hive_data

def mysql():
    conn=pymysql.connect("192.168.0.0","data_user","first2018qaz","FBDdata",charset='utf8')
    sql = "SELECT * FROM house_info where date between '2019-03-31'and '2019-03-31'"
    sql_data = pd.read_sql(sql,conn)#高阶用法，pandas 直接读取mysql 数据库数据

    return  sql_data

def dataframe_manage(df):
    columns_name  = [ column for column in df.columns.tolist()] # df.columns.tolist() 可以把df的各列获取列名，转化为列表
    df.columns = [(column.replace('dianpu_new.','')) for column in df.columns.tolist()]#列表解析式替代每一列中指定值
    df = df.drop(df[df['address']==None].index.tolist())#去除address 有None的值
    df.dropna(how='any',axis=0)#删除异常值，即有任何一个为空 则删除整行
    return df

def address_menarge(df):
    address = df['address'].tolist()
    address_list = [str(i).split('-') for i in address]
    address1 = []
    address2 = []
    for i in  address_list:
        if i[0] == ''and i[1] != '':
                address1.append('1')
                address2.append(i[1])
        elif i[0] == 'None':
                address1.append('1')
                address2.append('1')
        elif i[1] == '' and i[0] !='':
                address1.append(i[0])
                address2.append('1')
        elif i[1] == '' and i[0] =='':
                address1.append('1')
                address2.append('1')

        else:
                address1.append(i[0])
                address2.append(i[1])
                

    df['address1'],df['address2'] = address1,address2
    df = df.drop(df[df['address1'].isin(['1','其他区'])].index.tolist())
    return df


def Web_Analysis(df,df_ffx):
    #--------各网络平台房源发布统计--------
    #from_web 1为58，2为安居客
    # wb 代表58 aj代表安居客 first代表菲斯特地产 ffx房发现
    df_wb = df.loc[df['from_web']==1]
    df_aj = df.loc[df['from_web']==2]
    df_first = df[df['agent_company'].isin(['菲斯特房地产','成都菲斯特房地产营销策划有限公司'])]

    
    wb_counts = df_wb.shape[0]#df.shape 是同时获取行列数。
    aj_counts = df_aj.shape[0]
    first_counts = df_first.shape[0]
    ffx_counts = df_ffx.shape[0]
    counts_list = [wb_counts,aj_counts,first_counts,ffx_counts]
    
    #.shape[0] 主要是去重 只显示统计数据，如果不要，会显示agent_name 及对应的数量
    wb_agent = df_wb['agent_name'].value_counts().shape[0]
    aj_agent = df_aj['agent_name'].value_counts().shape[0]
    first_agent = df_first['agent_name'].value_counts().shape[0]
    ffx_agent = df_ffx['agent_name'].value_counts().shape[0]
    agent_list = [wb_agent,aj_agent,first_agent,ffx_agent]
    
    avg = [round(wb_counts/wb_agent),round(aj_counts/aj_agent),round(first_counts/first_agent),round(ffx_counts/ffx_agent)]
    avg_sum = round(sum(counts_list)/sum(agent_list))
    
    data = collections.OrderedDict([('网站来源',['58同城','安居客','菲斯特','房发现平台','合计']),
            ('发布条数',[wb_counts,aj_counts,first_counts,ffx_counts,sum(counts_list)]),
            ('经纪人数',[wb_agent,aj_agent,first_agent,ffx_agent,sum(agent_list)]), 
            ('人均发布数',[round(wb_counts/wb_agent),round(aj_counts/aj_agent),round(first_counts/first_agent),\
                     round(ffx_counts/ffx_agent),avg_sum])])
    from_web = pd.DataFrame(data)
    return from_web


def Region_Analysis(df):
    #------区域排名--------------------------------------
    #高阶用法 把各条记录的行政区域 去重后，名称统计出来，按名称组成一个列表返回，
    #如果不要index,返回的是按名称的计数而不是名称。
    region_names= df['address1'].value_counts().index.tolist()#不同值出现的次数，并按降序返回对应名称
    region_counts = df['address1'].value_counts().tolist()#不同值 已按counts后的结果 降序排列好
    #print("region_names",region_names)
    #高阶用法 列表解析表达式循环每一个counts,求占比后 用format 格式化输出2位小数的占比。
    proportion = ['{:.2%}'.format(i/sum(region_counts)) for i in region_counts]
    rank = [i for i in range(1,len(region_names)+1)]
    data = collections.OrderedDict([
        ('排名',rank),  
        ('区域名称',region_names),
        ('发布条数',region_counts),
        ('占比',proportion)
    ])
    region_rank =pd.DataFrame(data)
    return region_rank


def Totalp_Analysis(df):
    #总价处理
    rank = [i for i in range(1,9)]
    bin = [0,50,100,200,300,400,500,1000, float("inf")]#区间划分  最大的区间通常是>= 所以用 inf
    '''
    cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)
    需要将数据值分段并排序到bins中时使用cut,此函数对于从连续变量转换为离散变量很有用。 
    例如，cut可以将年龄转换为年龄范围组。 支持bins到相同数量的箱柜或预先指定的bins阵列。
    x:进行划分的一维数组,或者是df的一列
    bins : 整数---将x划分为多少个等间距的区间；也可以是自定义指定的区间
    right : 是否包含右端点 默认包含右端点，不包含左端点
    labels : 是否用标记来代替返回的bins 如labels=['1','2','3','4','5','6','7','8'] 代替总价的8个区间
    retbins: 是否返回间距bins
    precision: 精度
    include_lowest:是否包含左端点
    参考链接：https://blog.csdn.net/sir_TI/article/details/83512418
    
    qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')
    基于分位数的离散化功能。 根据等级或基于样本分位数将变量分离为相等大小的桶。
    
    '''
    df_ttp =  pd.cut(df['total_price'],bin)
    price_counts =  pd.cut(df['total_price'],bin).value_counts().tolist()   
    price_cut = pd.cut(df['total_price'],bin).value_counts().index.tolist()
    price_names = ['总价: '+ str(i).replace(', ','-').strip('(').strip(']').replace('.0','').replace\
                   ('0-50','<=50').replace('40<=500','400-500').replace('1000-inf','>1000') for i in price_cut]
    proportion = ['{:.2%}'.format(i/sum(price_counts)) for i in price_counts]
    data = collections.OrderedDict([
        ('排名',rank),
        ('总价区间 单位:万',price_names),
        ('发布条数',price_counts),
        ('占比',proportion)
    ])
    totalp_rank = pd.DataFrame(data)
    return totalp_rank



def Price_Analysis(df):
    #单价处理
    rank = [i for i in range(1,9)]
    bin = [0,15000,20000,25000,30000,35000,40000,50000, float("inf")]#区间划分
    price_counts =  pd.cut(df['price'],bin).value_counts().tolist()
    price_cut = pd.cut(df['price'],bin).value_counts().index.tolist()
    #以下代码可以优化 设置labels参数，返回labels ,然后替换labels ,避免代码太长
    price_names = ['单价: '+ str(i).replace('(0.0, 15000.0]','<1.5万').replace('(15000.0, 20000.0]','1.5-2万')\
                   .replace('(20000.0, 25000.0]','2-2.5万').replace('(25000.0, 30000.0]','2.5-3万')\
                   .replace('(30000.0, 35000.0]','3-3.5万').replace('(35000.0, 40000.0]','3.5-4万')\
                   .replace('(40000.0, 50000.0]','4-5万').replace('(50000.0, inf','>5万') for i in price_cut]
    proportion = ['{:.2%}'.format(i/sum(price_counts)) for i in price_counts]
    data = collections.OrderedDict([
        ('排名',rank),
        ('单价区间',price_names),
        ('发布条数',price_counts),
        ('占比',proportion)
    ])
    price_rank = pd.DataFrame(data)
    return price_rank


def Acreage_Analysis(df):
    #面积处理
    rank = [i for i in range(1,6)]
    bin = [0,50,100,150,200, float("inf")]#区间划分
    acreage_counts =  pd.cut(df['acreage'],bin).value_counts().tolist()
    acreage_cut = pd.cut(df['acreage'],bin).value_counts().index.tolist()
    acreage_names = ['面积: '+ str(i).replace(', ','-').strip('(').strip(']').replace('.0','')\
                     .replace('0-50','50').replace('200-inf','>200') for i in acreage_cut]
    proportion = ['{:.2%}'.format(i/sum(acreage_counts)) for i in acreage_counts]
    data = collections.OrderedDict([
        ('排名',rank),
        ('面积区间',acreage_names),
        ('发布条数',acreage_counts),
        ('占比',proportion)
    ])
    acreage_rank = pd.DataFrame(data)
    return acreage_rank


def Top5totalp_Analysis(df):
    #前5地区总价排名
    bin = [0,50,100,200,300,400,500,1000, float("inf")]#区间划分
    top5_region = df['address1'].value_counts().index.tolist()[:5]#按行政区域统计，然后计数，直接去前5的区域名称
    counts_list = []
    '''
    enumerate(iterable, start) 如果不传入start 参数。默认从0开始。
    
    '''
    for k,v in enumerate(top5_region):
        Top = pd.cut(df[df['address1'] == top5_region[k]]['total_price'],bin).value_counts()
        df1 = pd.DataFrame(data={'bin':Top.index,'count':Top.values})
        df1.sort_values('bin',inplace=True)
        counts_list.append(df1['count'].tolist())
    
    
    data = collections.OrderedDict([('总价区间    单位:万',['总价1：<=50','总价2：50-100','总价3：100-200','总价4：200-300','总价5：300-400',\
                            '总价6：400-500','总价7：500-1000','总价8：>1000']),
            (top5_region[0],counts_list[0]),#高阶应用  列名动态索引 。对应的每行值是一个列表
            (top5_region[1],counts_list[1]),
            (top5_region[2],counts_list[2]),
            (top5_region[3],counts_list[3]),
            (top5_region[4],counts_list[4])
            ])
    Top5totalp_df = pd.DataFrame(data)
    return Top5totalp_df


def Top5price_Analysis(df):
    #前5地区单价排名
    bin = [0,15000,20000,25000,30000,35000,40000,50000,float("inf")]#区间划分
    top5_region = df['address1'].value_counts().index.tolist()[:5]
    counts_list = []
    for k,v in enumerate(top5_region):
        Top = pd.cut(df[df['address1'] == top5_region[k]]['price'],bin).value_counts()
        df1 = pd.DataFrame(data={'bin':Top.index,'count':Top.values})
        df1.sort_values('bin',inplace=True)
        counts_list.append(df1['count'].tolist())
    
    
    data = collections.OrderedDict([('单价区间',['单价1：<1.5万','单价2：1.5-2万','单价3：2-2.5万','单价4：2.5-3万','单价5：3-3.5万',
                     '单价6：3.5-4万','单价7：4-5万','单价8：>5万']),
            (top5_region[0],counts_list[0]),
            (top5_region[1],counts_list[1]),
            (top5_region[2],counts_list[2]),
            (top5_region[3],counts_list[3]),
            (top5_region[4],counts_list[4])
            ])
    Top5price_df = pd.DataFrame(data)
    return Top5price_df


def Top5acrege_Analysis(df):
    #前5地区面积排名
    bin = [0,50,100,150,200,float("inf")]#区间划分
    top5_region = df['address1'].value_counts().index.tolist()[:5]
    counts_list = []
    for k,v in enumerate(top5_region):
        Top = pd.cut(df[df['address1'] == top5_region[k]]['acreage'],bin).value_counts()
        df1 = pd.DataFrame(data={'bin':Top.index,'count':Top.values})
        df1.sort_values('bin',inplace=True)
        counts_list.append(df1['count'].tolist())
    
    
    data = collections.OrderedDict([('面积区间    单位：m²',['面积1：<50','面积2：50-100','面积3：100-150','面积4：150-200','面积5：>200']),
            (top5_region[0],counts_list[0]),
            (top5_region[1],counts_list[1]),
            (top5_region[2],counts_list[2]),
            (top5_region[3],counts_list[3]),
            (top5_region[4],counts_list[4])
            ])
    Top5acrege_df = pd.DataFrame(data)
    return Top5acrege_df
    


if __name__ == '__main__':
    hive_data =  hive()
    mysql_data = mysql()
    hive_df = dataframe_manage(hive_data)
    hive_df = address_menarge(hive_df)
    from_web = Web_Analysis(hive_df,mysql_data)
    region_rank = Region_Analysis(hive_df) 
    totalp_rank = Totalp_Analysis(hive_df)
    price_rank = Price_Analysis(hive_df)
    acreage_rank = Acreage_Analysis(hive_df)
    Top5totalp_df = Top5totalp_Analysis(hive_df)
    Top5price_df = Top5price_Analysis(hive_df)
    Top5acrege_df = Top5acrege_Analysis(hive_df)
    
    with pd.ExcelWriter( r'C:\\Users\\yuanye\\Desktop\\fang_yuan\\fang_tan.xlsx') as writer:
        from_web.to_excel(writer, sheet_name='网络来源',index=False)
        region_rank.to_excel(writer, sheet_name='区域排名',index=False)
        totalp_rank.to_excel(writer, sheet_name='总价排名',index=False)
        price_rank.to_excel(writer, sheet_name='单价排名',index=False)
        acreage_rank.to_excel(writer, sheet_name='面积排名',index=False)
        Top5totalp_df.to_excel(writer, sheet_name='总价区域',index=False)
        Top5price_df.to_excel(writer, sheet_name='单价区域',index=False)
        Top5acrege_df.to_excel(writer, sheet_name='面积区域',index=False)
    print("完成第一批统计")
    endTime = time.time()
    print ('Done, Time cost: %s ' % (endTime - startTime))

免费GIS工具箱：支持多种格式的模型预览及编辑，还能进行协同编辑 GISBox GISBox GIS 切片分发倾斜摄影 OBJ FBX OSGB
市面上不少GIS软件价格高昂，功能却不尽人意。但GISBox却不太一样，它的切片、分发功能完全免费，能预览、编辑多种格式模型，还支持协同编辑，性价比远超同类软件，如果你想进一步了解它，不妨看看这篇文章。01打破价格与功能的双重困境在地理信息系统（GIS）领域，大多数软件的高价一直是小型企业、科研团队以及个人开发者的一大阻碍。这些软件不仅采购成本高，后续的维护和升级费用也不低。与此同时，很多软件功能
OSGB编辑复杂又困难？试试这款免费GIS工具箱，高效实现场景编辑 GISBox GISBox vue.js webgl node.js edge 数据分析科技经验分享
在当今的地理信息科学（GIS）领域，数据的精确处理与直观展示无疑扮演着核心角色。无论是城市规划的精细布局、环境保护的科学决策，还是灾害预警的迅速响应，都离不开准确、实时的地理信息基石。然而，面对庞大的GIS数据，许多软件在处理、编辑和转换上都显得力不从心，尤其是对于倾斜摄影模型、地形和影像的编辑，更是成为了许多用户的棘手难题。1.GISBox简介GISBox作为一款免费的GIS工具箱，支持OSGB
Matplotlib如何创建交互式图表？ EdgarBertram matplotlib
Matplotlib是一个强大的Python绘图库，它可以用于生成高质量的静态图像。然而，Matplotlib同样支持创建交互式图表，这对于数据分析和可视化非常有用。交互式图表允许用户通过交互方式探索数据，例如缩放、平移或者查询数据点。下面我们将详细介绍如何使用Matplotlib创建交互式图表。一、安装与配置首先，确保你已经安装了Matplotlib库。你可以使用pip来安装：bash复制代码p
C++中函数模板与类模板的简单使用 CoderIsArt C++11 c++函数模板类模板
在C++中，模板是实现泛型编程的核心机制，允许开发者编写与类型无关的代码。以下是函数模板和类模板的详细介绍及实际示例。一、函数模板定义函数模板通过参数化类型实现泛型操作，只需编写一次代码即可处理多种数据类型，避免重复。语法template返回类型函数名(参数列表){...}typenameT表示类型占位符，编译时根据实参类型自动实例化。真实示例‌交换两个值（swap）templatevoidswa
hdc工具安装、常用命令及使用技巧 MardaWang HarmonyOS NEXT harmonyos 华为
介绍：hdc（OpenHarmonyDeviceConnector）是为开发人员提供的用于设备连接调试的命令行工具，该工具需支持部署在Windows/Linux/Mac等系统上与OpenHarmony设备（或模拟器）进行连接调试通信。简单来讲，hdc是OpenHarmony提供的用于开发人员调试硬件、应用的命令行工具，用在电脑与开发板之间的交互。hdc适用于OpenHarmony应用、硬件开发及测
连接mysql：Error: connect ECONNREFUSED ::1:3306 at TCPConnectWrap mysqlexpress
问题描述笔者把服务器上的node，从14升级到18再次使用express的连接池连接mysql的时候（mysql版本：2.18.1）出现连接不上的报错报错信息如下：Error:connectECONNREFUSED::1:3306atTCPConnectWrap.afterConnect[asoncomplete](node:net:1555:16)--------------------atPr
Gone v2 使用 Gone Viper 组件进行本地配置 dapeng-大鹏 Gone框架介绍 Gone框架配置管理 Viper配置组件多格式配置文件配置自动加载机制环境变量配置覆盖层级化配置结构 Go应用配置注入
发现gone-io/gone：一个优雅的Go依赖注入框架！它让您的代码更简洁、更易测试。框架轻量却功能强大，完美平衡了灵活性与易用性。⭐如果您喜欢这个项目，请给我们点个星！您的支持是我们前进的动力！欢迎贡献代码或提出建议，一起让gone变得更好！‍#golang#依赖注入#开源github.com/gone-io/gone本文原地址：https://github.com/gone-io/goner
DataGridView使用方法汇总 weixin_33933118 操作系统数据库 ui
DataGridView控件DataGridView是用于WindowsFroms2.0的新网格控件。它能够代替先前版本号中DataGrid控件，它易于使用并高度可定制，支持许多我们的用户须要的特性。关于本文档：本文档不准备面面俱到地介绍DataGridView，而是着眼于深入地介绍一些技术点的高级特性。本文档按逻辑分为5个章节，首先是结构和特性的概览，其次是内置的列/单元格类型的介绍，再次是数据
蒙特卡罗树搜索算法依赖游戏树，也就是游戏的状态空间和可选动作的构成。游戏树是游戏设计者为了实现对战或博弈的目的 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介20世纪末到21世纪初，计算机科学和互联网科技迅速发展。在这些新兴领域中，蒙特卡罗方法是一个显著的研究热点。蒙特卡罗方法源自物理学和数学领域，其目的是模拟物理系统的随机运动，从而解决很多数学、物理等领域的问题。蒙特卡loor方法被广泛应用于各类模拟、预测、优化、控制等领域。在计算机领域，蒙特卡罗方法也扮演了重要角色。现如今，计算性能已经足够强大，人们可以轻松地进
向量检索、检索增强生成（RAG）、大语言模型及相关系统架构——典型面试问题及简要答案快撑死的鱼算法工程师宝典（面试学习最新技术必备）语言模型系统架构面试
1.什么是向量检索？它与传统基于关键字的检索相比有什么不同？答案要点：向量检索是将文本、图像、音频等数据映射为向量，在高维向量空间中基于相似度或距离进行搜索。与传统基于关键字的检索（如倒排索引）相比，向量检索更关注“语义”或“特征”，能找出语义上相似但未必包含相同关键词的内容。向量检索非常适合多模态场景（例如“以图搜图”）或自然语言问答（同义词、上下文关联等）。2.什么是检索增强生成（RAG）？核
HarmonyOS Next 企业级分布式办公应用实战：构建高效协同的办公新生态 lyc233333 harmonyos 分布式华为
在数字化办公浪潮汹涌的当下，企业对于高效、便捷且协同性强的办公应用需求愈发迫切。华为鸿蒙HarmonyOSNext系统凭借其先进的分布式技术，为打造创新型企业级分布式办公应用提供了坚实的基础。本文将基于实际开发经验，深入剖析如何利用HarmonyOSNext构建企业级分布式办公应用，涵盖从需求分析到系统架构搭建，再到核心功能实现以及性能优化等关键环节。一、办公应用需求与系统架构搭建（一）企业级分布
探索Astra DB与LangChain的集成：从向量存储到对话历史 eahba 数据库 langchain python
技术背景介绍AstraDB是DataStax推出的一款无服务器的向量数据库，基于ApacheCassandra®构建，并通过易于使用的JSONAPI提供服务。AstraDB的独特之处在于其强大的向量存储能力，这在处理自然语言处理任务时尤为突出。LangChain与AstraDB的集成为开发者提供了强大的工具链，从数据存储到语义缓存，再到自查询检索，帮助简化复杂的数据操作。核心原理解析LangCha
如何评估一个RAG系统（RAGas评测框架）-下篇写程序的小火箭大语言模型人工智能语言模型 chatgpt langchain gpt
RAGas是一个用于评测RAG系统的评测框架，它支持与不同大语言模型的集成，并与langchain生态打通，能够很方便的构建评测系统。下面是RAGas的一些链接论文：https://arxiv.org/pdf/2309.15217官方文档：Ragashttps://github.com/explodinggradients/ragas官方文档及github对框架的使用介绍的比较详细，本文不会就该方
【AI大模型应用开发】【RAG评估】0. 综述：一文了解RAG评估方法、工具与指标同学小张大模型人工智能笔记经验分享 gpt agi AIGC
大家好，我是同学小张，日常分享AI知识和实战案例欢迎点赞+关注，持续学习，持续干货输出。+v:jasper_8017一起交流，一起进步。微信公众号也可搜【同学小张】本站文章一览：前面我们学习了RAG的基本框架并进行了实践，我们也知道使用它的目的是为了改善大模型在一些方面的不足：如训练数据不全、无垂直领域数据、容易出现幻觉等。那么如何评估RAG的效果呢？本文我们来了解一下。文章目录推荐前置阅读0.R
Java 环境配置与 JAR 文件问题解决全攻略不羁。。杂记丨每天亿点小知识 java jar 开发语言
目录一、Java环境配置指南1.Windows系统配置步骤1.1下载安装JDK1.2配置环境变量2.Linux/macOS系统配置2.1终端命令配置二、JAR文件问题诊断与修复1.检查JAR文件完整性1.1命令行验证1.2哈希值校验2.依赖库管理方案2.1Maven依赖配置示例2.2命令行指定依赖三、常见问题解决方案1.环境变量不生效处理1.1清除系统缓存1.2路径优先级调整2.旧版本残留处理2.
鸿蒙Next开发实战教程-使用WebSocket实现即时聊天幽蓝计划 harmonyos 鸿蒙
鸿蒙系统提供了WebSocket库，使用它可以很方面的实现即时聊天功能，今天就使用WebSocket来实现一个完整的聊天功能。首先创建一个WebSocket实例：letws=webSocket.createWebSocket()然后创建WebSocket连接，我找到一个简单的ws地址，它直接返回我们发送的消息：leturl='ws://124.222.224.186:8800'this.ws.co
HarmonyOS Next--实现炫酷下拉刷新与上拉加载 harmonyos-next
摘要：本文通过HarmonyOS的PullToRefresh组件，结合Canvas绘图技术，实现具有动态小球特效的下拉刷新与上拉加载功能。文章将详细解析动画绘制原理、手势交互逻辑以及性能优化要点。一、效果预览实现功能包含：弹性下拉刷新：带有透明度渐变的圆形聚合动画波浪加载动画：三个小球按序弹跳的加载效果数据动态加载：模拟异步数据请求与列表更新流畅交互体验：支持列表惯性滑动与边缘回弹二、核心实现原理
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
使用BLSTM自动评估句子级构音障碍的可理解性帅小柏声音的未来：语音识别文献解读深度学习人工智能分类
使用BLSTM自动评估句子级构音障碍的可理解性原文：AutomaticAssessmentofSentence-LevelDysarthriaIntelligibilityUsingBLSTM引言构音障碍简介构音障碍的定义与特征构音障碍是一种由神经原因引起的运动性言语障碍表现为肌肉无力、瘫痪或协调不良，导致言语清晰度下降可理解性的重要性可理解性是衡量言语障碍严重程度的重要指标自动评估可帮助语言病理
MDC-Mapped Diagnostic Context（映射诊断上下文） NEUMaple 微服务 spring boot java MDC
MDC，全称为MappedDiagnosticContext（映射诊断上下文），是SLF4J（SimpleLoggingFacadeforJava）提供的一种机制，用于在多线程应用中存储和管理与特定线程相关的上下文信息。这种机制特别适用于需要跨多个方法调用或服务边界传递诊断信息的场景，例如跟踪分布式系统中的请求流。MDC的主要用途日志关联：在分布式系统或多线程应用中，MDC可以用来携带一些上下文信
DeepSeek-R1核心技术深度解密：动态专家网络与多维注意力融合的智能架构实现全解析 Coderabo DeepSeek R1模型企业级应用架构 DeepSeek-R1
DeepSeek-R1智能架构核心技术揭秘：从动态路由到分布式训练的完整实现指南一、DeepSeek-R1架构设计原理1.1动态专家混合系统DeepSeek-R1采用改进型MoE（MixtureofExperts）架构，核心公式表达为：y=∑i=1nG(x
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
flutter-制作可缩放底部弹出抽屉评论区效果冲浪的鹏多多 Flutter flutter
文章目录1.介绍2.效果展示3.结构分析4.完整代码5.总结1.介绍在Flutter开发中，底部弹出抽屉是一种常见的交互方式，它可以为用户提供额外的操作选项或展示更多的内容。本文将详细介绍如何使用Flutter实现一个可缩放的底部弹出抽屉效果，用户点击特定区域后会弹出底部抽屉，抽屉的高度可以通过手指滑动进行调整。当手指滑动距离超过一定阈值时，抽屉会关闭；否则，抽屉会恢复到初始高度。2.效果展示3.
对MCP工作流的一些个人认知持续学习的老赵人工智能
最近在学习MCP系统，虽尚未深入掌握，但已对其工作原理有了初步认识，在此分享下学习收获。MCP是一套能实现客户端、多种服务与大模型协同工作的系统，能处理任务请求并及时反馈。其工作流程如下：一、获取并更新服务使用方法（一）收集整理使用方法MCP正常运行依赖于对各类服务使用方法的了解，这要靠已在系统注册且可识别的功能模块。一旦有新模块注册或旧模块更新，系统会自动检测并获取其使用方法信息。MCP订阅服务
Web端驱动的综合打印方案与场景 #六脉神剑 Web打印 myBuilder 产品运营
随着Web技术的快速发展，基于Web端的打印方案逐渐成为主流，它能够满足多样化的打印需求，并提供更便捷、高效的打印体验。以下是一些常见的Web端驱动综合打印方案与应用场景：一、方案概述浏览器直接打印原理:利用浏览器自带的打印功能，调用操作系统打印接口，直接打印网页内容。优点:简单易用，无需额外开发。缺点:打印样式控制有限，兼容性差，无法满足复杂打印需求。适用场景:打印简单的网页内容，例如文章、表格
B端安全网关的简单实现 #六脉神剑 java java 网络安全 spring boot
安全网关中的DMZ内网穿透是一种结合网络安全隔离与穿透技术的解决方案，主要用于实现外部网络对内网资源的安全访问。其核心逻辑如下：一、DMZ区的安全隔离作用网络分区机制‌：DMZ（非军事区）是安全网关设置的中间隔离区域，用于部署对外提供服务的设备（如Web服务器、邮件服务器），与内网核心数据区域物理隔离‌。访问控制‌：外网用户仅能访问DMZ区资源，无法直接触及内网敏感数据，即使DMZ区设备被攻破，内
【入门初级篇】报表基础操作与功能介绍 #六脉神剑低代码 myBuilder 产品运营
【入门初级篇】报表的基本操作与功能介绍视频要点（1）报表组件的创建（2）指标组件的使用：一级、二级指标操作演示（3）表格属性设置介绍（4）图表属性设置介绍（5）报表预览：绑定静态数据（6）介绍myBuilder内部模块：用报表低代码开发的示例介绍点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信：MyBuilder88
知汇云创myBuilder产品发布 #六脉神剑低代码
【入门初级篇】产品介绍v2·前言Hello，大家好，今天给大家介绍一下myBuilder渐进式低代码IDE软件。·产品定位与版本规划myBuilder是一款面向B端数字化领域的低代码开发工具、集成开发环境，具备高效、灵活的使用特点，设计的初心是让B端数字化变得更简单。myBuilder的主要开发套件以及基础功能，我们有专门的培训课程详细讲解，这里先不展开介绍，相信通过我们的教学视频讲解您会逐一发现
【入门初级篇】窗体的基本操作与功能介绍 #六脉神剑低代码
【入门初级篇】窗体的基本操作与功能介绍视频要点（1）窗体的使用场景介绍：模式对话框（2）窗体的创建与设计（3）窗体动态标题设置（4）向窗体添加组件以及相关操作介绍（5）窗体属性编辑介绍（6）窗体数据的使用：组件数据的绑定（7）窗体中3种预览效果介绍点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信：MyBuilder88
1，Kotlin代码案例：决属性与方法冲突的类和对象操作演示淮山2 kotlin
//使用Kotlin1.3.11编译器//不需要包声明（package语句）//定义类A1classA1{//定义静态变量BBB，类似C语言中的全局静态变量companionobject{varBBB:Int=0//初始化静态变量BBB为0}//定义实例变量AAA，包含整数和字符串类型，类似C语言中的结构体成员变量varAAA_int:Int=0//整数类型的实例变量，初始化值为0varAAA_s
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

Python3：《学习笔记与实战》之房源周报（1）连接hive

一，python3 连接hive 步骤

你可能感兴趣的:(python3学习笔记,集群学习笔记与总结,python3,连接hive,python3,pandas提取各列转化为列表)