于建民

探索性数据分析与可视化

　　世界如此大，我想去看看；数据如此丰富，怎么能看完。
　　面对未知，人类是富有探索精神的，可以不畏艰险，可以排除万难，正是这种探索精神使得人类不断进步不断创造一个又一个奇迹。对于纷繁复杂的数据世界，我们如何进行探索性分析呢？

探索性数据分析

　　之前的一些模型是假定数据服从某种分布，然后用样本去调整假设分布的参数，比如贝叶斯模型，GMM等。如果面临错综复杂的数据，我们想去直接看到数据最原始的特点，比如，某个属性是什么分布特点，某些属性的关系，哪些因素具有最大量的信息，某些不确定关系的研究等等。这个时候，假设模型的方法就不那么好使了，这时候就较为考验一个综合能力了。
　　所谓探索性数据分析，是在没有头绪的情况下，对数据进行的基本分析，可以从中挖出更具有含金量的信息，为进一步的研究指明方向。探索性数据分析相当于做了个全身体检，重点部位重点检查，后续发现的问题不归其管，自己去找专家去搞定。

与可视化的关系

　　探索性的数据分析，侧重于原始数据本身的展示，故此与数据可视化具有相当紧密的联系，并且图形展示更直观且有利于发现有价值的信息。
　　可视化能够帮助我们搞定以下几个问题：
　　1. 了解数据基本特征
　　2. 发现数据潜在的模式
　　3. 指导建模策略
　　4. 为工程提供参考信息和必要的更正

探索内容与实现

　　虽说是探索，但也得有点目标才好，不能啥都不知道就愣头愣脑地往上冲，那岂不是自我证明非二即傻。手段要灵活，快捷。
　　Python2.7+ubuntu14.0
　　我们采取一个先分后总的研究顺序来探索。
　　分别看看各个属性的数据特征，大体分布时什么样子的（即可能会服从什么样子的分布），哪些值的数据最多，数据的均值方差最大最小各是多少，是否自相关等等。
　　大体分布最直观的就是直方图了，这个最易于实现。

import matplotlib.pyplot as plt
data1 = [2,2,2,2,3,3,3,4,4,4,4,4,4]
data2 = [2.3,2.4,3.4,2,1,3.4,2,5.6]
plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title(r'$\mathrm{Histogram\ of\ IQ:}\ \mu=100,\ \sigma=15$')
plt.axis([1, 6, 0, 6]) # 横纵范围
plt.grid(True)
plt.show(plt.hist(data2, bins=4, facecolor='green'))#分成四份
# plt.subplot()用来分子图
plt.hist(data1, bins = 4, facecolor = 'green', alpha = 0.5)
plt.hist(data2, bins = 4, facecolor = 'blue', alpha = 0.5)
plt.show()

上面的代码得到的两个图如下：

图中的横纵坐标的名称和标题只是为了展示如何给图配置，而不是真实情况。
稍微进阶一下，将多个图放到同一个图中展示（添加标题之类的操作和单个图时是一样的）。

import matplotlib.pyplot as plt
data1 = [2,2,2,2,3,3,3,4,4,4,4,4,4]
data2 = [2.3,2.4,3.4,2,1,3.4,2,5.6]
fig = plt.figure()
ax1 = fig.add_subplot(2, 2, 1) # 2*2 的 第一个，及左上侧
ax1.hist(data1, bins=5, facecolor='green')#分成5份

ax2 = fig.add_subplot(222) # 2*2 的 第二个，及右上侧
ax2.hist(data2, bins=5, facecolor='green')#分成5份

ax3 = fig.add_subplot(212) # 2*1 的 第3个， 及下侧一整个
ax3.hist(data1, bins = 4, facecolor = 'green', alpha = 0.5)
ax3.hist(data2, bins = 4, facecolor = 'blue', alpha = 0.5)
plt.show()

　　而数据的均值、最大最小表现形式较好的则是 箱线图。

import pandas as pd
import matplotlib.pyplot as plt
# 本地读取数据 #
#df = pd.read_csv("your/file/direction/name.csv")
# 读取网络数据 #
data_url = "https://raw.githubusercontent.com/alstat/Analysis-with-Programming/master/2014/Python/Numerical-Descriptions-of-the-Data/data.csv"
df = pd.read_csv(data_url)
print(type(df))
print df.head() # 头
print df.tail() # 细节
print df.columns # 列名
print df.index # 行号
#print df.drop(df.columns[[1, 2]], axis = 1).head() # 舍弃列axis=1；舍弃行axis=0（默认）
print df.describe() # 统计特性，最大，最小，均值，方差
plt.show(df.boxplot()) # 箱线图绘制展示
#### 或者采用 模块 seaborn #### 这个也非常好用，颜色自动搭配
import seaborn as sns
import matplotlib.pyplot as plt
plt.show(sns.boxplot(data = df))
#plt.show(sns.distplot(df.ix[:,2], rug = True, bins = 15))

上面代码的两个图如下：

pandas自带的boxplot

seaborn的箱线图

　　是否自相关？对于时间序列，自相关是对某个属性值，时间T和T+1时刻的值存在线性关系。

# 自相关系数
import numpy as np
def autocorrelation(x,lags):
# 计算lags阶以内的自相关系数，返回lags个值，分别计算序列均值，标准差
# lags表示错开的时间间隔
  n = len(x)
  x = np.array(x)
  result = [np.correlate(x[i:]-x[i:].mean(),x[:n-i]-x[:n-i].mean())[0]\
    /(x[i:].std()*x[:n-i].std()*(n-i)) \
    for i in range(1,lags+1)]
  return result

z = autocorrelation(df.ix[:, 1], 1)
print(z)

# 绘制个原始数据的散点图 并将一阶到10阶的自相关系数也绘制到上面
import matplotlib.pyplot as plt
import numpy as np

def autocorrelation(x,lags):
# 计算lags阶以内的自相关系数，返回lags个值，分别计算序列均值，标准差
# lags表示错开的时间间隔
# Notice: 标题神马的不支持中文 #
  n = len(x)
  x = np.array(x)
  result = [np.correlate(x[i:]-x[i:].mean(),x[:n-i]-x[:n-i].mean())[0]\
    /(x[i:].std()*x[:n-i].std()*(n-i)) \
    for i in range(1,lags+1)]
  return result


fig = plt.figure()

axes1 = fig.add_axes([0.1, 0.1, 0.8, 0.8]) # main axes
axes2 = fig.add_axes([0.2, 0.5, 0.4, 0.3]) # inset axes

# main figure
x1 = np.linspace(1, len(df.ix[:, 1]), len(df.ix[:, 1]))
axes1.plot(x1, df.ix[:, 1], 'r')
axes1.set_xlabel(df.columns[1])
axes1.set_ylabel('value')
axes1.set_title('main')

# insert
x2 = np.linspace(1, 10, 10)
y2 = autocorrelation(df.ix[:, 1], 10)
y2 = np.array(y2)
axes2.plot(x2, y2, 'g')
axes2.set_xlabel('jieci')
axes2.set_ylabel('ar')
axes2.set_title('autoRelation of different jieci')
plt.show()

原始数据的折线图与10阶内的自相关值

　　密度与热度。密度表示分布情况，可以是单个属性，也可以是多个属性的联合分布。单个属性的密度可以用细密的直方图（将bins值调大）展示。多个属性可以用 气泡图来展示，也可以用heat map来表示。（三维heat map） 热点图图示化了离散数据（事件或事物）的 分布及其相互关系，常常以一张具备显著颜色差异图片的方式呈现最终结果，亮色一般代表事件发生频率较高或事物分布密度较大，暗色反之。很明显，heat map对数据的要求就是需要有坐标

#（1） 基于二维位置信息的热点图 #
import seaborn as sns
plt.show(sns.jointplot(df.ix[:,1], df.ix[:,2], kind = "kde"))
#df.ix[:,1]代表所有点在X轴的位置 #
#df.ix[:,2]代表所有点在Y轴的位置 #

```
#（2） 或者借助别人写的一个模块
from pyheatmap.heatmap import HeatMap
http://www.open-open.com/lib/view/open1348041833834.html
但是不怎么好使

#（3） 基于二维位置信息+密度值 的 平面热点图 #
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np
side = np.linspace(-2, 2, 15)
X, Y = np.meshgrid(side, side)
# X 和 Y 联合起来表示了网格的位置 #
# X 表示了网格中所有点的x轴值 #
print(type(X)) # narray 矩阵 #
Z = np.exp(-((X-1)**2 + Y**2))
# Z 表示了某个位置处的值 #
print(type(Z)) # Z是一个矩阵 #
plt.show(plt.pcolormesh(X, Y, Z, cmap=cm.RdBu))
# 没有cmap时，默认是黑白的 #

#（4） 用 plt.pcolor 绘制效果， 跟pcolormesh效果类似 #
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np
fig, ax = plt.subplots()
p = ax.pcolor(X/(2*np.pi), Y/(2*np.pi), Z, cmap=cm.RdBu, vmin=abs(Z).min(), vmax=abs(Z).max())
cb = fig.colorbar(p, ax=ax)
plt.show()

#（5）基于密度值（高度）的 等高线图 # 需要矩阵表示的高度 #
import matplotlib.pyplot as plt
cnt = plt.contour(Z, cmap=cm.RdBu, vmin=abs(Z).min(), vmax=abs(Z).max(), extent=[0, 1, 0, 1])
plt.show()

#(6) 基于二维位置信息+密度值 的 三维热点图
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import numpy as np
# suface图
fig = plt.figure(figsize=(14,6))
# `ax` is a 3D-aware axis instance because of the projection='3d' keyword argument to add_subplot
ax = fig.add_subplot(1, 2, 1, projection='3d')
p = ax.plot_surface(X, Y, Z, rstride=4, cstride=4, linewidth=0)
# surface_plot with color grading and color bar
ax = fig.add_subplot(1, 2, 2, projection='3d')
p = ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap=cm.coolwarm, linewidth=0, antialiased=False)
cb = fig.colorbar(p, shrink=0.5)
plt.show()

#（7）想将在各个平面上的投影也体现出来 #
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np

alpha = 0.7
phi_ext = 2 * np.pi * 0.5

def flux_qubit_potential(phi_m, phi_p):
    return 2 + alpha - 2 * np.cos(phi_p) * np.cos(phi_m) - alpha * np.cos(phi_ext - 2*phi_p)

fig = plt.figure(figsize=(8,6))
ax = fig.add_subplot(1,1,1, projection='3d')
phi_m = np.linspace(0, 2*np.pi, 100)
phi_p = np.linspace(0, 2*np.pi, 100)
X,Y = np.meshgrid(phi_p, phi_m)
Z = flux_qubit_potential(X, Y).T
ax.plot_surface(X, Y, Z, rstride=4, cstride=4, alpha=0.25)
cset = ax.contour(X, Y, Z, zdir='z', offset=-np.pi, cmap=cm.coolwarm)
cset = ax.contour(X, Y, Z, zdir='x', offset=-np.pi, cmap=cm.coolwarm)
cset = ax.contour(X, Y, Z, zdir='y', offset=3*np.pi, cmap=cm.coolwarm)
ax.set_xlim3d(-np.pi, 2*np.pi);
ax.set_ylim3d(0, 3*np.pi);
ax.set_zlim3d(-np.pi, 2*np.pi);
plt.show()

　　有人会问，空缺值怎么办，这就要看你自己怎么处理了。
　　有人会问，为什么不加上归一化的操作，没有说不行，但我们更倾向于发现原始数据的特点，所以操作最好是原始数据来操作。
　　 看看哪些属性对结果更重要一些。这里可选的方法就多了，有统计学的方法，比如Pearson相关系数（Spearman系数等）、卡方检验，有信息论的方，比如信息增益率、GainRatio等，有数据挖掘的方法，比如逻辑回归的属性系数、随机森林的属性重要性等。

#（1）Pearson线性相关系数
import numpy as np
# np.correlate 只是计算两个向量对应位置相乘，再求和 
# 样本协方差如下
cov = np.correlate(df.ix[:, 1] - df.ix[:, 1].mean(), df.ix[:, 2] - df.ix[:, 2].mean())/(len(df.ix[:, 1] - 1))
# 与下面的计算是一样的 
#cov = np.dot(df.ix[:, 1] - df.ix[:, 1].mean(), df.ix[:, 2] - df.ix[:, 2].mean())/(len(df.ix[:, 1] - 1))
# 样本方差如下
std1 = df.ix[:, 1].std()
std2 = df.ix[:, 2].std()
# 故两个属性的Pearson线性相关系数如下
Pearson = cov/(std1*std2)
print(Pearson)
# 相关系数的大小 与 线性相关性 的关系
#    0.8-1.0 极强相关
#    0.6-0.8 强相关
#    0.4-0.6 中等程度相关
#    0.2-0.4 弱相关
#    0.0-0.2 极弱相关或无相关

　　看看某些属性间是否也存在某些关系。

# 两个属性之间的 散点图 #
import matplotlib.pyplot as plt
plt.xlabel(df.columns[2])
plt.ylabel(df.columns[3])
plt.grid(True)
plt.show(plt.scatter(df.ix[:, 2], df.ix[:, 3]))
# 两个属性之间的 联合分布 # 用seaborn更方便一些 #
import matplotlib.pyplot as plt
import seaborn as sns
plt.show(sns.jointplot(df.ix[:,1], df.ix[:,2], kind = "kde"))
# 三个属性之间的关系 展示 # 可以用上面的三维展示方法，plot_surface，如上文中的介绍，此处不再赘述。

散点图与联合分布图

# 多个个体之间的关系，比如社交关系 的展示 #

　　再简单聚个类，不要小瞧聚类，很多时候会非常给力。当然聚类方法的选择和聚类个数需要好好试试。聚类可以看到数据大体的特点，还可以把某些属性跟所分的类联系到一起。

# python 聚类
#（1）K-Means聚类

#（2）基于密度的聚类

　　最富信息内容的提取，这也是个很重要的问题。如果有标签属性，可以通过前面的分析得出来。若是没有标签属性，那么可以利用降维技术，来提取出重要因素，数据经过有效降维后，剩下的是有用信息，更便于分析。
　　
　　
参考：
（1）http://blog.sciencenet.cn/blog-251664-800766.html
（2）http://www.jb51.net/article/62982.htm
（3）http://www.tuicool.com/articles/mYNvamI
（4）http://blog.sina.com.cn/s/blog_6252a9bf0101b257.html
（5）http://nbviewer.ipython.org/github/jrjohansson/scientific-python-lectures/blob/master/Lecture-4-Matplotlib.ipynb#pcolor
（6）http://www.cnblogs.com/taceywong/p/4570155.html
（7）http://san-yun.iteye.com/blog/1935786

别再只用 text 了！深度揭秘 Element UI el-input 的 type 属性宝藏 ✨ 小丁学Java vue2 和 element-ui ui vue.js 前端
这是一篇关于ElementUI(ElementUI,一套为开发者、设计师和产品经理准备的基于Vue2.0的桌面端组件库)el-input组件type属性的深度解析技术博客，它结合了ElementUI官方文档和MDN(MDNWebDocs,一个汇集众多网络开发者资源的开源网站)的原生类型。别再只用text了！深度揭秘ElementUIel-input的type属性宝藏大家好！作为Vue开发者，el-
使用CocoaPods做依赖管理(淘宝源更换为HTTPS)--转自唐巧技术博客 q364385155 cocopods 依赖管理 OC iOS
CocoaPods简介每种语言发展到一个阶段，就会出现相应的依赖管理工具，例如Java语言的Maven，nodejs的npm。随着iOS开发者的增多，业界也出现了为iOS程序提供依赖管理的工具，它的名字叫做：CocoaPods。CocoaPods项目的源码在Github上管理。该项目开始于2011年8月12日，经过多年发展，现在已经成为iOS开发事实上的依赖管理标准工具。开发iOS项目不可避免地要
前端技术博客汇总文档长路 ㅤ 文章目录汇总前端技术 HTML5 CSS3 JavaScript Vue.js
文章目录前言前端技术博客汇总链接基础知识点HTMLCSSJavaScript基础语法ES6语法扩展知识点Ajax&Fetch与跨域请求Canvas模块化WebpackNode.jsvite框架与实战VueVue.jsVue-routerVuexvue-cli(脚手架)微信小程序性能提升开源生态组件使用资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿
解决部分机型浏览器使用pdf.js 出现 undefined is not an object(evaluating ‘response.body.getReader‘) 报错问题 HHH 917 pdf javascript pdf 前端
问题undefinedisnotanobject(evaluating‘response.body.getReader’)参考小王子的笔记本的技术博客仔细分析源码后发现，PDFjs的getDocument方法不仅可以接收URL作为参数，还可以接收多种类型：而fetch方法返回的Response对象恰恰拥有arrayBuffer方法，可以将数据转为ArrayBuffer对象解决PDF.getDocu
Muduo 定时器小白书舍 c++网络
TimeQueue定时器图片转载自:muduo网络库源码解析(4):TimerQueue定时机制_李兆龙的技术博客_51CTO博客添加新的定时器TimerIdTimerQueue::addTimer(TimerCallbackcb,//用户自定义回调Timestampwhen,//定时器的超时时刻doubleinterval)//重复触发间隔,小于0则不重复触发{Timer*timer=newTi
贝叶斯网络与深度学习的结合：图像识别和分类 AI天才研究院 AI人工智能与大数据计算 AI大模型企业级应用开发实战自然语言处理人工智能语言模型编程实践开发语言架构设计
本文我将为您撰写一篇关于"贝叶斯网络与深度学习的结合：图像识别和分类"的技术博客文章。这篇文章将深入探讨贝叶斯网络和深度学习在图像识别和分类领域的结合应用。我会遵循您提供的要求和结构模板,确保文章内容全面、深入且易于理解。让我们开始吧。贝叶斯网络与深度学习的结合：图像识别和分类关键词：贝叶斯网络、深度学习、图像识别、图像分类、概率推理、卷积神经网络、不确定性建模文章目录贝叶斯网络与深度学习的结合：
十年磨一剑，笔耕不辍：我的创作之路与质量工程情怀 blues_C 创作纪念日
十年磨一剑，笔耕不辍：我的创作之路与质量工程情怀前言机缘：从实战沉淀到知识共享收获：从数字增长到精神富足日常：创作，已是生活的一部分憧憬：深耕质量，智创未来前言时光荏苒，转眼间我的技术博客也迎来了又一个重要的里程碑。回首这些年与代码、与测试、与技术文字为伴的日子，心中充满了感慨与感恩。感谢CSDN这个平台，也感谢每一位阅读、点赞、评论和支持我的读者朋友。正是这份互动与认可，让我在这条创作之路上乐此
PSQL 处理 BLOB 类型数据问题紫菜(Nori) 工作服务器数据库服务器
处理Blob问题获取BLOB字段内容，发生如下报错org.postgresql.util.PSQLException:大型对象无法被使用在自动确认事物交易模式需要设置为手动提交事务即可解决参考：PostgreSQL:Documentation:7.1:UsingLargeObjects写入流程如下参考：Java写入pgsqlblob类型_mob649e8159b30b的技术博客_51CTO博客By
Whistle 超详细技术博客：原理、配置、用法与进阶技巧全解北漂老男人抓包工具运维
Whistle超详细技术博客：原理、配置、用法与进阶技巧全解目录Whistle简介与应用场景Whistle安装与启动Whistle原理与架构Whistle规则语法详解常用配置与实战场景Whistle进阶用法与技巧常见问题与排查实用插件推荐总结与参考资料1.Whistle简介与应用场景Whistle是一款基于Node.js的跨平台Web调试代理工具，功能类似于Charles、Fiddler，但更轻量
java:实现投票系统（附带源码） Katie。 Java 实战项目 java 开发语言
1.项目背景详细介绍在现代信息化社会中，投票系统是民主决策、在线调查、用户反馈、选举活动等场景中不可或缺的核心组件。从最简单的“一人一票”在线问卷，到复杂的分布式选举、盲签名投票、区块链防篡改投票等，投票系统的设计安全性、可扩展性、并发性能与数据一致性都提出了高要求。本项目以纯Java技术栈实现一个基础的在线投票系统，适合作为技术博客教程或课堂案例，从前端展示、后端API、数据持久化、业务逻辑，到
为何在 FastAPI 中需要允许跨域访问（CORS）？(Grok3 回答) 晨欣 fastapi python
prompt:你是一个文笔流畅、专业性极强的技术博客博主，你将结合具体的例子和实际代码解释写一篇为何后端选择fastapi框架时，需要允许跨域访问。为何在FastAPI中需要允许跨域访问（CORS）？在现代Web开发中，前后端分离已经成为主流架构模式。前端通常运行在浏览器中（例如通过React、Vue.js或Angular构建的单页应用），而后端则通过API提供数据支持，比如使用Python的Fa
程序员如何打造个人品牌：技术博客与开源项目双轮驱动 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶开源 ai
程序员如何打造个人品牌：技术博客与开源项目双轮驱动关键词：程序员个人品牌、技术博客运营、开源项目开发、影响力构建、职业发展、内容创作、社区运营摘要：本文系统解析程序员通过技术博客与开源项目双轮驱动打造个人品牌的核心方法论。从底层逻辑阐明两者协同效应，构建包含内容创作框架、开源项目全生命周期管理、影响力量化模型的完整体系。通过实战案例演示博客搭建与开源项目落地流程，揭示如何通过持续输出优质内容与可复
Python 实现 ZeroMQ 的三种基本工作模式赛博Cookie ZeroMQ Python python 网络通信 zeromq 队列
技术博客：https://github.com/yongxinz/tech-blog同时，也欢迎关注我的微信公众号AlwaysBeta，更多精彩内容等你来。简介引用官方说法：ZMQ（以下ZeroMQ简称ZMQ）是一个简单好用的传输层，像框架一样的一个socketlibrary，他使得Socket编程更加简单、简洁和性能更高。是一个消息处理队列库，可在多个线程、内核和主机盒之间弹性伸缩。ZMQ的明确
源滚滚AI编程：我为什么选择Rust开发博客项目源滚滚AI编程 Rust AI编程 rust 开发语言
作者：源滚滚AI编程日期：2024年项目：个人技术博客系统前言作为一名专注于AI编程领域的技术博主，我在选择博客技术栈时经历了深入的思考和权衡。最终，我选择了Rust作为博客项目的主要开发语言。这个决定可能在很多人看来有些"反常规"——毕竟大多数博客都是用WordPress、Hugo、或者传统的Web框架构建的。但对我而言，这个选择有着深层次的技术和理念考量。本文将详细阐述我选择Rust开发博客的
RedHat 7配置bonding双网卡绑定 .Eyes linux 笔记
RedHat7配置bonding双网卡绑定redhat7虽然新增了teaming技术支持双网卡绑定，但bonding技术依然可以沿用，本文测试的是bond的绑定方式为了避免冲突，建议关闭NetworkManager：systemctlstopNetworkManager、systemctldisableNetworkManager本文原始出处：江健龙的技术博客http://jiangjianlon
Debezium系列之：debezium对mysql8数据库tinyint unsigned的支持快乐骑行^_^ debezium Debezium系列 mysql8数据库 tinyint unsigned的支持
Debezium系列之：debezium对mysql8数据库tinyintunsigned的支持一、需求背景二、相关技术博客三、实现方法四、创建表五、插入数据六、消费topic查看数据一、需求背景tinyint(1)unsigned转化为boolean类型MySQL8执行快照时不显示类型的长度SHOWCREATETABLE，这意味着此转换器不起作用。新选项length.checker可以解决这个问
前端网页代码高亮显示的7种常用插件 @佳瑞 java java html javascript css
对于喜欢写技术博客的同学来说，一定对代码高亮组件非常熟悉。一款优秀的JavaScript代码高亮插件，将会帮助你渲染任何一种编程语言，包括一些关键字的着色，以及每行代码的缩进等。今天我们要来分享一些高性能的JavaScript代码高亮插件，这些JavaScript代码高亮插件将非常有效地帮你实现在网页上的代码编辑和展示。1、SyntaxHighlighter–最优秀的JavaScript代码高亮插
再谈 dijkstra 算法和最短路径问题 dog250 算法
前置文章：dijkstra算法为什么高效有向图的负权值边与建模求单源最短路径的新方法前天晚上实现了一个基于dijkstra算法的求单源最短路径的新算法，整理了一篇文章。我非常不愿意把一些直观的问题太过于技术化，但多年的职业经历偏偏让一篇好好的文字写着写着就变成技术博客了，非常不适。我的新算法强调“只需要一次广度优先遍历”，文章求单源最短路径的新方法里的图解释得已经很明白了，但这和dijkstra算
基于 Golang 实现微信收藏数据操作的同步、获取与删除功能梦玄网络安全微信
引言在现代互联网应用中，如何高效地管理用户的收藏数据，已经成为一个重要的功能需求。微信作为一款广泛使用的即时通讯应用，提供了丰富的接口来管理用户的收藏内容。在这篇技术博客中，我们将深入探讨如何通过Golang实现与微信收藏功能相关的操作，包括收藏同步（Sync）、获取收藏项（GetFavItem）以及删除收藏项（Del）等操作。我们会分析这些操作的背后实现，重点讨论如何利用Protobuf实现数据
软件测试基础入门第一天：核心概念与测试流程拆解 study软测软件工程 python 单元测试功能测试
在软件行业高速发展的今天，软件质量直接影响用户体验和企业声誉，而软件测试正是保障质量的关键环节。本文将按照CSDN技术博客创作规范，为零基础学习者拆解软件测试第一天的核心学习内容，帮助大家快速搭建基础认知框架。一、什么是软件测试？——定义与本质软件测试是在规定条件下对程序进行操作，以发现程序错误、衡量软件质量，并对其是否能满足设计要求进行评估的过程。其本质是通过验证和确认，确保软件产品符合用户需求
C#实现无声视频的配音与字幕生成器 univerbright WinForms C#Windows窗体应用视频配字幕软件视频配音软件文字生成字幕文字生成配音
一、项目概述本人使用C#实现一个运行在Windows上的.NET8WinForms应用程序，能够将一段无声的演示或教学视频，通过用户输入文字，自动生成配音和字幕，最终合成为有声的MP4视频。该项目适用于技术博客展示、教学课件配音、文化资料管理项目、动态图文交互场景等。二、应用场景无声视频配音编辑需要文字说明的展示场景教学课件自动配音外语版本时序文字加评解三、技术路线项目主要由以下技术模块组成：字幕
CSDN博客写作教学（五）：从写作到个人IP的体系化构建（完结篇） Code_流苏实用软件与高效工具 CSDN博客写作教学技术IP 程序员成长博客教学
导语（第一篇）Markdown编辑器基础（第二篇）Markdown核心语法（第三篇）文章结构化思维（第四篇）标题优化与SEO实战通过前四篇教程，你已掌握技术写作的“术”——排版、标题、流量与数据。但真正的价值在于将技能升维为“道”：用技术博客为支点，撬动个人品牌与职业发展。本文将揭示如何将零散的文章整合为IP矩阵，从“写作者”进阶为“技术影响力领袖”，并提供可落地的工具与案例。名人说：不以物喜，不
2025.6.6总结天真小巫职场记录职场和发展
工作：今天晚上帮同事解决了自动化脚本如何上传的问题，很有成就感。毕竟，我从来没想到过自己一个工作不到一年的小白，竟然能帮别人解决问题。我学界面自动化也是前两个星期的事情，但我通过看同事的培训视频，博客，解决了IDEA上环境配置问题，最后将写得自动化代码进行调试，上传代码仓。整个过程也也不算太复杂。这也说明我自身的学习能力是ok的，但考试能力就有点……以后坚持在公司的网上上做知识打结，写技术博客，进
Attention Is All You Need：抛弃循环神经网络的时代来了！摘取一颗天上星️ rnn 人工智能深度学习 transformer
以下是一篇通俗易懂的技术博客，解析经典论文《AttentionIsAllYouNeed》的核心思想：AttentionIsAllYouNeed：抛弃循环神经网络的时代来了！——3分钟看懂Transformer如何颠覆AI2017年，谷歌一篇仅8页的论文引爆了AI领域。这篇标题傲娇的论文**《AttentionIsAllYouNeed》**提出了名为Transformer的模型，直接抛弃了统治NLP
Spring Boot 技术博客：构建现代Web应用的全栈指南 2301_81335708 前端后端 java
在这篇教程中，我们将深入探讨如何使用SpringBoot构建一个功能齐全的Web应用程序JPA（JavaPersistenceAPI）定义JPA是JavaEE的一个标准，用于对象关系映射（ORM）。它允许开发者使用Java对象来操作数据库，而不必直接编写SQL语句。应用场景JPA适用于需要与关系型数据库交互的Java应用程序，尤其是在需要简化数据访问层的开发时。原理剖析JPA通过注解和XML配置来
《AI大模型的开源与性能优化：DeepSeek R1的启示》从零开始学习人工智能人工智能开源性能优化
以下是一篇基于今日新闻的技术博客文章：在AI大模型领域，开源与性能优化一直是推动技术进步的关键因素。2025年5月28日，DeepSeek开源了其R1最新0528版本，这一事件不仅引发了行业关注，也为我们提供了深入探讨AI大模型技术优化的绝佳机会。一、DeepSeekR1开源：技术与性能的突破1.R1版本的性能表现根据DeepSeek官方披露，R1版本在性能测试中表现卓越，其性能接近OpenAI的
前端开发：优化空的占位 div 技巧 ✨ 小丁学Java vue2 和 element-ui div
技术博客：围绕空的占位div的使用与优化️✨大家好！今天我们来聊聊前端开发中一个常见的布局技巧——使用空的占位div来控制间距！虽然这种方法简单直接，但也存在一些问题，我们会逐步分析它的作用、优缺点，并提供更优雅的替代方案。文章会包含表格总结、Mermaid流程图、时序图以及思维导图，帮你全面理解这个话题！一、空的占位div是什么？在前端开发中，空的占位div通常是一个没有内容的div元素，通过设
源码解析（一）：GraphRAG 汪汪汪侠客源码解析 graphrag 大模型算法面试 rag
原文技术博客GraphRAG是一种结构化的、分层的检索增强生成(RAG)方法，它利用知识图谱来增强LLM的输出，用于推理私有数据集中的复杂信息。本文档对GraphRAG系统、其架构和关键组件进行了概述。GraphRAG通过从非结构化文本构建知识图谱并将其用于检索，增强了传统的RAG系统。与仅依赖向量相似度的标准RAG方法不同，GraphRAG提取实体和关系，执行社区检测，并生成不同层级的报告。这种
鸿蒙分辨率水星灭绝 harmonyos 华为
鸿蒙手机App界面开发，UI元素应该以什么哪种屏幕尺寸为基准？换言之，做鸿蒙手机APPUI设计时，应该以哪种屏PX转VP华为开发者问答|华为开发者联盟各单位换算API华为开发者问答|华为开发者联盟开源鸿蒙更改DPI如何在OpenHarmony应用侧获取屏幕DPI_鸿蒙社区的技术博客_51CTO博客鸿蒙中PPI计算华为开发者文章华为开发者问答|华为开发者联盟
理解函数式编程中的高阶函数 AI天才研究院 Python实战 Java实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介“理解函数式编程中的高阶函数”是一篇专业技术博客文章，我希望通过文章来分享一些关于函数式编程高阶函数的知识，帮助读者更加深刻地理解其概念、用法、原理及应用。以下是对本文文章的一个概要介绍：函数式编程(FP)是一种编程范式，它将计算机科学中所有的计算视为数学上的函数计算。它鼓励使用纯函数和不可变数据结构，并通过一系列函数组合这些函数形成复合函数，从而编写出简洁、可
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

探索性数据分析与可视化