晨恒父

狄利克雷分布、采样方法、主题模型

Gamma函数

公式
$\Gamma(x)=\int_0^{+\infty} e^{-t} t^{x-1}dt$
性质

$\Gamma(x+1)=x\Gamma(x)$
$\Gamma(n)=(n-1)!$

Beta函数

公式
$\Beta(m,n)=\int_0^1 x^{m-1}(1-x)^{n-1}dx$
性质

$\Beta(m,n)=\frac{\Gamma(m)\Gamma(n)}{\Gamma(m+n)}$

二项分布

假设在玩CS游戏，你拿着狙击枪，敌人出现你打中敌人的概率是P,打不中敌人的概率是1-P,那么敌人第一次出现你没打中，而第二次出现你打中的概率是(1-P)P。如果敌人出现了n词，而你打中了其k次，而不确定具体是哪k次，这样从n次中任取k次的次数是 $C_n^k$ ,而这不确定k次打中敌人的概率是 $C_n^kp^k(1-p)^{n-k}$ ，通过这个例子可以得知二项分布的概率：

$f(k;n,p)=C_n^kp^k(1-p)^{n-k}$

Beta分布

定义

$f(x;a,\beta)=\frac{x^{a-1}(1-x)^{\beta-1}}{\int_0^1 u^{a-1}(1-u)^{\beta -1} du}$
$=\frac{x^{a-1}(1-x)^{\beta -1}}{\Beta(a,\beta)}$
$=\frac{\Gamma(a+\beta)}{\Gamma(a)\Gamma(\beta)}x^{a-1}(1-x)^{\beta -1}$

期望

$E(p)=\int_0^1 \frac {p^a(1-p)^{\beta -1}dp}{\Gamma(a,\beta)}=\frac{\Beta(a+1,\beta)}{\Beta(a,\beta)}$
$=\frac{\Gamma(a+1)\Gamma(\beta)}{\Gamma(a+\beta+1)}\frac{\Gamma(a+\beta)}{\Gamma(a)\Gamma(\beta)}$
$=\frac{a}{a+\beta}$

相似分布

如果 $\vec p 服从分布 Dir(\vec t | \vec a)$ 则可证明,
$E(\vec p)=\big( \frac{a_1}{\sum_i a_i},\frac{a_2}{\sum_i a_i},\cdots \big)$
多项分布

设投掷n次骰子，这个骰子共有六种结果，且1点出现概率为 $p_1$ ,2点出现概率为 $p_2,\cdots$ 多项分布给出了在n次实验中，骰子1点出现 $x_1$ 次，2点出现 $x_2$ 次，3点出现 $x_3$ 次， $\cdots$ ,6点出现 $x_6$ 次，这个结果组合的概率为：
$\frac{n!}{x_1!x_2!\cdots x_k!}p_1^{x_1}p_2^{x_2}\cdots p_k^{x_k}$
亦可表示为：
$\frac{\Gamma(\sum_i x_i+1)}{\prod_i \Gamma(x_i+1)}\prod_i p_i^{x_i}$

狄利克雷分布

狄利克雷分布式beta分布在多项式情况下的情况，也就是多项分布的共轭先验分布，其概率密度如下：
$f(p_1,p_2,\cdots,p_{k-1}|a_1,a_2,\cdots,a_k)=\frac{1}{\Delta(\vec a)}\prod_{i=1}^kp^{a_i-1}$
其中的 $\Delta(\vec a)$ 计算公式如下：
$\Delta(\vec a) = \frac {\prod_{i=1}^k \Gamma(a_i)}{\Gamma(\sum_i a_i)}$

共轭先验分布

所谓共轭，知识我们选取一个函数作为似然函数的先验分布，使得后验分布函数和先验分布函数形式一致。比如Beta分布是二项分布的共轭先验概率分布，而狄更斯分布式多项式分布的共轭先验概率分布。

参数估计

对于典型的离散型随机变量分布：二项分布、多项分布；典型的连续性随机变量分布：正态分布。他们都可以看作参数分布，因为他们的函数形式被一小部分参数控制，比如正态分布的均值合方差，二项分布事件发生的概率等。因此，给定一堆观测数据集，我们需要有一个解决方案来确定这些参数值的大小，以便能够利用分布模型做密度估计，这就是参数估计。
对于参数估计，一直存在两个学派的不同解决方案。一是频率学派解决方案：通过某些优化准则来选定特定参数值；二是贝叶斯学派方案：假定参数服从一个先验分布，通过观测到的数据，使用被也是理论计算对应的后验分布。先验和后验的选择满足共轭，这些分布都是指数簇分布的例子。
简而言之，假设参数 $\theta$ 也是变量而非常量，而且在做实验前已经服从某个分布，然后现在做新实验去更新这个分布假设。
从二项分布到beta分布

二项分布的似然函数
$L(X=s,Y=f|p)=C_n^sp^s(1-p)^f$
先验分布beta分布
$P(p|a,\beta)=\frac{p^{a-1}(1-p)^{\beta -1}}{\Beta(a,\beta)}$
计算后验分布
$P(X=s,Y=f,p|a,\beta)=\frac{p^{s+a-1}(1-p)^{f+\beta -1}}{\Beta(s+a,f+\beta)}$
多项分布到Dirichlet分布

同上可以证明多项分布与Dirichlet分布共轭

马尔科夫蒙特卡洛

一、 Inverse CDF

cdf(累计分布函数)

$F(x)=\int_{-\infty}^xf(x)dx$

高斯的CDF图形

采样

求F(x)的反函数 $F^{-1}(y)$ ,进而进行采样
使用uniform(0,1)获取采样点s，进而获取简单计算 $t=F^{-1}(s)$
上式计算结果极为采样点

证明

均匀分布的CDF函数

$\leq a)=H(x)=x (0\leq x \leq 1)$

采样有以下性值

$P(x\leq s)=P(x\leq F(t))=F(t)$

总结

对概率密度函数 $f$ 进行采样可以使用以上方式进行，但是并非所有的CDF都容易求得或其逆容易求得因此使用了其它方法

二、 Reject Sampling

采样类比

目标分布 $\pi(x)$ ，分布 $q (x)$ 和常数 $M$ ，通过对 $q (x)$ 的采样实现对 $\pi(x)$ 采样，满足：

$q (x)$ 采样比较容易
$q (x)$ 的形状接近 $\pi(x)$ ，且 $\forall x,\pi(x)\leq Mq(x)$ ,即保证 $\leq \frac{\pi(x)}{Mq(x)}\leq 1$

采样过程

生成样本 $\backsim q(x)$ 和 $\backsim Uniform[0,1]$
若 $\leq \frac{\pi(x)}{Mq(x)}$ 则接受样本x
则接受样本服从 $\pi(x)$ 分布

证明

等价于

产生样本 $\backsim q(X)$ 和 $\backsim[0,1]$
$Y = M q (X) U$ ，若 $\leq \pi(X)$ ，则接受X
x的概率密度如下

$p_x(x)=q(x)$
y的概率密度

$F(y|x)=P(Y\leq y|x)=P(Mq(x)U \leq y|x)=P(U \leq \frac{y}{Mq(x)}|x)$

上式表示在X发生的情况下y发生的情况 $\leq \frac{y}{Mq(x)})=\frac{y}{Mq(x)}$
得到其概率密度函数如下：
$p_y(y|x)=\frac{1}{Mq(x)}$
联合密度函数

$p(x,y)=p_x(x)p_y(y|x).=\frac{1}{M}$
按接受-拒绝采样抽出的随机数d的概率

$F(d|accept)=P(X\leq d| Y \leq \pi(x))=\frac{P(X\leq d, Y\leq \pi(x))}{P(Y \leq \pi(x))}=\int_{-\infty}^d\pi(x)dx$

缺点

选择q(x)非常重要，当 $q (x)$ 与 $\pi(x)$ 相差较大时采样效率就会非常低

三、蒙特卡洛采样

细致平稳条件

$\pi(x^*)K(x^* \rightarrow x) = p(x)K(x \rightarrow x^*)$
使用的过程

以一维分布为例
initialise $x^0$
for i =0 to N-1
u ~ U(0,1)
$x^* \backsim q(x^*|x^{i})$
$a(x^*)=min(1,\frac{\pi(x^*)q(x|x^*)}{\pi(x)q(x^*|x)}) x^{i+1}=x^*$
$else 　x^{i+1}=x^i$
证明其满足detail balance

需要证明： $\pi(x)K(x\rightarrow x^*)=\pi(x^*)K(x^*\rightarrow x)$
$\rightarrow x^*)=q_(x^*|x)min(1,\frac{\pi(x^*)q(x^*|x)}{\pi(x)q(x^*|x)})$

原式转化为
$\pi(x)K(x\rightarrow x^*)=\pi(x)q(x^*|x)min(1,\frac{\pi(x^*)q(x^*|x)}{\pi(x)q(x^*|x)})$
$=min(\pi(x)q(x^*|x),\pi(x^*)q(x^*|x))$
$=\pi(x^*)q(x^*|x)min(1,\frac{\pi(x)q(x^*|x)}{\pi(x^*)q(x|x^*)})$
$=\pi(x^*)K(x^* \rightarrow x)$

四、Gibbs Sampling

过程

已知 $x^1,y^1,z^1$
$x^2 \backsim P(x|y^1,z^1)$
$y^2 \backsim P(y|x^2,z^1)$
$z^2 \backsim P(z|x^2,y^2)$
$x^3 \backsim P(z|x^2,y^2)$
证明Gibbis 与蒙特卡洛关系

当采样第i个样本时

$\pi(x_i^*| X_{-i})=q_i(x^*|x)$

需证明

$\pi(x^*)q_i(x|x^*)=\pi(x^*)q_i(x|x^*)$

对应的接收率为

$\frac{\pi(x^*)q(x|x^*)}{\pi(x)q(x^*|x)}=\frac{\pi(x^*)\pi(x_i|X^*_{-i})}{\pi(x)\pi(x_i^*|X_{-i})}$

采样时 $X^*_{-i}=X_{-i}$ 因此有以下公式
$\frac{\pi(x_i^*|X^*_{-i})\pi(x_i|X^*_{-i})}{\pi(x_i|X_{-i})\pi(x_i^*|X_{-i})}=1$
总结

吉布斯采样可以直接在 $\pi(x_i|X_{-i})$ 上依次进行采样

主题模型

LDA
1. LDA是一种无监督的贝叶斯模型
2. 是一种主题模型，它可以将文档集中的每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法，在训练时不需要手工标注的训练集，需要的仅仅是文档集以及指定主题的数量K即可。此外LDA的另一个优点则是，对于每个主题均可找出一些词语来描述它。
3. 是一种典型的词袋模型，即它认为一篇文档是由一组词构成的一个集合，词与词之间没有顺序以及先后的顺序，一篇文档可以包含多个主题，文档中每一个词都由其中的一个主题生成。
生成词过程

例：
1. $\overrightarrow a \rightarrow \overrightarrow \theta_m \rightarrow z_{m,n}$ ,这个过程表示在生成m篇文档时，先抽取一个doc-topic骰子 $\overrightarrow \theta_m$ ,然后投掷这个筛子生成文档第n个词topic编号 $z_{m,n}$ r
2. $\overrightarrow \beta \rightarrow \overrightarrow \varphi_k \rightarrow w_{m,n}$ ,这个过程表示如下动作生成第m篇文档中的第n个词：在K个topic-word筛子 $\overrightarrow \varphi_k$ 中,选择编号为 $k=z_{m,n}$ 这个筛子进行投掷，生成单词 $w_{m,n}$
LDA模型理解

LDA生成模型中，M篇文档会对应于M个独立的Dirchlet-Multionmial共轭分布。K个主题会生成K个独立的Dirichlet-Multionmial共轭结构。下面将分析LDA是如何被分解为M+K个Dirichlet-Multionmial共轭结构

第一个物理过程

此过程主要时需要获取 $\overrightarrow \theta_m$ ,我们知道 $P(\overrightarrow \theta_m | \overrightarrow z_m,\overrightarrow a ) \propto P(\overrightarrow \theta_m|\overrightarrow a)P(\overrightarrow z_m| \overrightarrow \theta_m)$ 因此我们可以对后面的数据进行优化，操作如下：
$P(\overrightarrow z_m | \overrightarrow a ) = \int _{\overrightarrow \theta_m}P(\overrightarrow z_m |\overrightarrow \theta_m )P(\overrightarrow \theta_m|\overrightarrow a )d_{\overrightarrow \theta_m}=\frac{\Delta(\overrightarrow n_m+\overrightarrow a)}{\Delta(\overrightarrow a)}$
同时 $\overrightarrow \theta_m \backsim Dir(\overrightarrow \theta_m|\overrightarrow n_m+\overrightarrow a)$ 且对整个词库而言满足以下公式：
$P(\overrightarrow z | \overrightarrow \alpha)=\prod_{m=1}^MP(\overrightarrow z_m | \overrightarrow \alpha)=\prod_{m=1}^M \frac{\Delta(\overrightarrow n_m+\overrightarrow a)}{\Delta(\overrightarrow a)}$
注： $\overrightarrow n_m$ 表示第m个文档中对应主题所形成的分布，即 $[n_1,n_2,\cdots,n_k]_m$
第二个物理过程

此过程主要获取 $\overrightarrow \varphi_k$ ,我们知道 $P(\overrightarrow \varphi_k | \overrightarrow w_{(k)},\overrightarrow \beta ) \propto P(\overrightarrow \varphi_k|\overrightarrow \beta)P(\overrightarrow w_{(k)}| \overrightarrow \varphi_k)$ ,因此我们需要对后面的数据进行优化，操作如下：
$P(\overrightarrow w_{(k)}|\overrightarrow \beta)=\frac{\Delta(\overrightarrow n_k + \overrightarrow \beta)}{\Delta(\overrightarrow \beta)}$
同时 $\overrightarrow \varphi_k \backsim Dir(\overrightarrow \varphi_k|\overrightarrow n_k+\overrightarrow \beta)$ 对整个语料而言：
$P(\overrightarrow w | \overrightarrow z ,\overrightarrow \beta)= \prod_{k=1}^K\frac{\Delta(\overrightarrow n_k + \overrightarrow \beta)}{\Delta(\overrightarrow \beta)}$
注： $\overrightarrow n_k$ 表示第k个主题中word形成的分布，即 $[n_1,n_2,\cdots,n_N]_k$
综合有整个词库中主题、词的联合分布如下：

$P(\overrightarrow w ,\overrightarrow z | \overrightarrow \alpha ,\overrightarrow \beta)=\prod_{k=1}^K\frac{\Delta(\overrightarrow n_k + \overrightarrow \beta)}{\Delta(\overrightarrow \beta)}\prod_{m=1}^M \frac{\Delta(\overrightarrow n_m+\overrightarrow a)}{\Delta(\overrightarrow a)}$

使用Gibbs Sampling法求解 $P(\overrightarrow z| \overrightarrow w)$

Gibbs采样需要进行用到 $P(z_i=k,w_i=t|\overrightarrow z_{-i},\overrightarrow w_{-i})$ ,因此需要以下推导：
有了联合分布 $p(\overrightarrow w, \overrightarrow z)$ ，则Gibbs Sampling就可以发挥作用了,语料库 $\overrightarrow z$ 中的第i个词对应的topic我们记为 $z_i$ ，其中 $i = (m, n)$ 表示第m个文本的第n个词，其采样的分布如下：
$P(z_i=k,w_i=t|\overrightarrow z_{-i},\overrightarrow w_{-i})$
由于 $z_i =k,w_i=t$ 只涉及到第m篇文档第k个topic，所以只会涉及到两个Dirichlet-Multinomial共轭结构：
1. $\overrightarrow a \rightarrow \overrightarrow \theta_m \rightarrow \overrightarrow z_m$
2. $\overrightarrow \beta \rightarrow \overrightarrow \varphi_k \rightarrow \overrightarrow w_{(k)}$
减少了词的后验分布变为如下公式：

$P(\overrightarrow \theta_m|\overrightarrow z_{-i},\overrightarrow w_{-i}) = Dir(\overrightarrow \theta_m | \overrightarrow n_{m,-i}+\overrightarrow \alpha)$
$P(\overrightarrow \varphi_k|\overrightarrow z_{-i},\overrightarrow w_{-i}) = Dir(\overrightarrow \varphi_k | \overrightarrow n_{k,-i}+\overrightarrow \beta)$

则可以推导出：
$P(z_i=k|\overrightarrow z_{-i},\overrightarrow w)\propto \int p(z_i=k,w_i=t,\overrightarrow \theta_m,\overrightarrow \varphi_k| \overrightarrow z_{-i},\overrightarrow w_{-i})d_{\overrightarrow \theta_m} d_{\overrightarrow \varphi_k}=\frac{n_{m,-i}^k+a_k}{\sum_{k=1}^K(n_{m,-i}^k+a_k)} \frac{n_{k,-i}^t+\beta_t}{\sum_{t-1}^V(n_{k,-i}^t+\beta_t)}$
采样过程

我们的目标如下：
1. 估计模型中的参数 $\overrightarrow \varphi_1,\cdots,\overrightarrow \varphi_K$ 和 $\overrightarrow \theta_1,\cdots,\overrightarrow \theta_M$
2. 对于新来的一篇文档d_{new},我们能够计算这篇文档的topic分布 $\overrightarrow \theta_{new}$
第一步需要训练LDA以估计参数 $\overrightarrow \varphi_1,\cdots,\overrightarrow \varphi_K$ 和 $\overrightarrow \theta_1,\cdots,\overrightarrow \theta_M$
1. 随机初始化：对语料中每篇文档中的每个词 $w$ ，随机的赋一个topci编号为 $z$
2. 重新扫描语料库，对每个词w,按照Gibbs Sampling公式重新采样它的topic，在语料库中重新更新；
3. 重复以上语料库的重新采样过程直到Gibbs Sampling收敛
4. 统计语料库的topic-word共现频率矩阵，该矩阵就是LDA的模型了
第二步为估计新文档的topic分布，此时我们认为Gibbs Sampling公式中的 $\hat \varphi_{kt}$ 部分时稳定不变的，是由训练语料得到的模型提供的，所以采样过程中我们只需要估计该文档的topic部分的 $\overrightarrow \theta_{new}$
1. 随机初始化：对当前文档中的每个词w,随机的赋值一个topic编号z
2. 重新扫描当前文档，按照Gibbs Sampling公式，对每个词w,重新采样它的topic
3. 重复以上过程直到Gibbs Sampling收敛
4. 统计文档中的topic分布，该分配就是 $\overrightarrow \theta_{new}$
使用sklearn实现一个LDA算法

获取数据

 from sklearn.datasets import fetch_20newsgroups
 dataset = fetch_20newsgroups(shuffle=True,random_state=1,remove=('headers','footers','quotes'))
 n_samples = 2000
 data_samples = dataset.data[:n_samples]

文本处理

 import nltk
 import string
 from nltk.corpus import stopwords
 from nltk.stem.porter import PorterStemmer

 def textPrecessing(text):
     #小写
     text = text.lower()
     #去除特殊标点
     for c in string.punctuation:
         text = text.replace(c,' ')
     #分词
     wordList = nltk.word_tokenize(text)
     #去除停用词
     filtered = [w for w in wordList if w not in stopwords.words('english')]
     #保留名词与特定POS
     refiltered = nltk.pos_tag(filtered)
     filtered = [w for w,pos in refiltered if pos.startswith('NN')]
     #词干化
     ps = PorterStemmer()
     filtered = [ps.stem(w) for w in filtered]
     return ' '.join(filtered)

 docLst = []
 for desc in data_samples:
     docLst.append(textPrecessing(desc))

将数据存入文档

 with open('./data.txt','w') as f:
     for line in docLst:
         f.write(line+'\n')

词频统计

 from sklearn.feature_extraction.text import CountVectorizer
 from sklearn.externals import joblib
 tf_vectorizer = CountVectorizer(max_df=0.95,min_df=2,max_features=500,stop_words='english')
 tf = tf_vectorizer.fit_transform(docLst)
 joblib.dump(tf_vectorizer,'.\model.pck')

LDA训练

 from sklearn.decomposition import LatentDirichletAllocation
 n_topics = 30
 lda = LatentDirichletAllocation(n_topics=n_topics,max_iter=50,learning_method='batch')
 lda.fit(tf)

结果展示

def print_top_words(model,feature_names,n_top_words):
    for topic_idx,topic in enumerate(model.components_):
        print('Topic #%d'%topic_idx)
        print(' '.join([feature_names[i] for i in topic.argsort()[: -n_top_words -1:-1]]))
        
    print(model.components_)

n_top_words=20
tf_feature_names = tf_vectorizer.get_feature_names()
print_top_words(lda,tf_feature_names,n_top_words)

你可能感兴趣的:(狄利克雷分布、采样方法、主题模型)

5、旋转与自适应布局：iOS应用开发的关键 c7d8e9 8 SDK入门 iOS开发自适应布局旋转处理
旋转与自适应布局：iOS应用开发的关键1.旋转和自适应布局的重要性iPhone和iPad是令人惊叹的工程杰作。苹果的工程师们找到了各种方法，将最大功能压缩进一个小巧的包装里。其中一个例子就是这些设备可以以纵向（高而窄）或横向（短而宽）模式使用，而且这种方向可以在运行时通过简单旋转设备来改变。你可以在iOS的网页浏览器MobileSafari中看到这种被称为自动旋转的行为示例。像许多iOS应用程序一
Qt设置窗口置顶（避免窗口隐藏）空名Noname qt
转自个人博客方法一说在前面：本方法比较通用，但经过我的使用，发现其存在问题，而下面方法二正常使用存在问题：在窗口置顶后，会自动隐藏，即便在设置窗口置顶后手动对窗口使用show()或setVisible(true)等方法显示出来，也会出现窗口闪烁的现象，极不自然。对你的主窗口QMainWindow或者主控件QWidget使用以下方法，都是Qt自带的。窗口置顶也是一个标志，先获取窗口已有的所有标志，再
鸿蒙线程池全揭秘：让你的应用快、稳、省资源 harmonyos
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
Java-Scanner类 Lowjin_ Java 开发语言 java
Scanner是Java中一个实用的文本扫描工具类（位于java.util包），主要用于从输入流（如键盘、文件或字符串）中解析基本数据类型和字符串。它通过正则表达式将输入分解为标记（tokens），并提供了多种方法来读取和转换这些标记。1.Scanner的核心功能功能说明读取输入从键盘、文件、字符串等来源读取数据。按类型解析自动将输入的文本转换为int、double、String等类型。分隔符控制
unity如何让一个物体拥有按钮功能 Lowjin_ unity unity 游戏引擎
在Unity中，要让一个物体（例如一个3D模型、UI元素或其他对象）变成一个按钮，你需要为它添加交互功能。这通常意味着让物体能够响应点击事件，像UI按钮那样触发某些行为。对于3D物体，可以通过射线检测（Raycast）来处理点击交互，而对于UI元素，则直接使用Unity的UIButton组件。这里提供几种常见的方式来让物体变成按钮：方法1：让一个3D物体（例如模型）变成按钮如果你有一个3D物体，并
假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢？ Lowjin_ leetCode算法练习算法 c++学习笔记
示例1：输入：n=2输出：2解释：有两种方法可以爬到楼顶。1.1阶+1阶2.2阶示例2：输入：n=3输出：3解释：有三种方法可以爬到楼顶。1.1阶+1阶+1阶2.1阶+2阶3.2阶+1阶提示：1<=n<=45本题大家如果没有接触过的话，会感觉比较难，多举几个例子，就可以发现其规律。爬到第一层楼梯有一种方法，爬到二层楼梯有两种方法。那么第一层楼梯再跨两步就到第三层，第二层楼梯再跨一步就到第三层。所以
【鸿蒙开发】响应式设计 harmonyos-next
前言响应式设计（ResponsiveWebDesign，简称RWD）在Web网站设计领域是一种网页设计方法论，旨在让网站在不同设备和屏幕尺寸上都能提供良好的阅读和交互体验，而无需为每一个新设备或屏幕尺寸创建单独的版本。这种设计方法的核心在于页面布局和内容可以根据用户所使用的设备特性（如屏幕尺寸、分辨率、方向等）进行灵活调整。实现断点响应式布局中最常使用的特征是窗口宽度及窗口高宽比，可以将窗口宽度及
反射&枚举&以及lambda表达式观音山保我别报错 java 开发语言
反射,Java代码中,让一个对象,认识到自己,也叫做"自省"自己清楚的认识自己谁是最认识对象的??程序员程序员是非常清楚,某个对象是属于哪个类的这个对象里面有哪些属性(属性的名字,类型,private/public,其他的修饰符注解之类的)这个对象里有哪些方法(方法的名字,参数列表,private/public)这个类的父类是谁这个类实现了接口有哪些这些东西程序员只需要看看代码,就知道这些事情了程
投标文件制作中多级标题自动设置 ℃-柠檬职场和发展其他
针对大型项目的投标文件制作，标书中可能会涉及到很多的内容，需要做标题分级和分类，格式调整需要耗费大量的时间和精力，近期由于投标工作需要，自己整理了一稿标书制作过程中的多级标题的自动设置及格式调整的方法，分享给需要的朋友。样式表我同步上传到我自己的博客资源中了，有需要的朋友可以直接下载使用。（PS：我自己用的是2013版的Office）一、定义新的多级列表新建一个空白Word文档，在“开始”中找到列
【Golang】用gorm实现分页的功能在成都搬砖的鸭鸭 Golang golang 开发语言后端 1024程序员节
目录1、背景2、go库下载3、初始化数据【1】建表【2】插入数据【3】查看数据4、代码示例【1】gorm结构体定义【2】分页结构体定义【3】封装分页方法【4】封装获取数据库连接方法【5】查询列表接口【6】启动http服务【7】调用获取列表接口5、总结1、背景在提供列表接口时一般要用到分页，对于存储在某些数据库中的数据进行分页起来非常的方便，下文给出一个通过gorm进行分页并通过http返回数据的例
（转载）20个JavaScript重点知识点（11）this机制 lzhdim javascript 前端 vue.js 开发语言 ecmascript
this是JavaScript中最容易让人困惑的概念之一。它的指向取决于函数的调用方式而非定义位置，且在不同场景下表现不同。一、this的本质this是一个动态绑定的执行上下文对象，指向当前函数运行时的“所有者”。它的值在函数被调用时确定，而非定义时。理解this的关键在于分析函数是如何被调用的。二、绑定规则1.默认绑定(独立函数调用)当函数作为独立函数调用时(非方法、构造函数等)，非严格模式下t
工厂模式深度解析：工厂方法 vs 抽象工厂 hixiaoyang 设计模式
1.核心概念对比1.1工厂方法模式（FactoryMethod）工厂方法模式定义一个创建对象的接口，但让子类决定实例化哪一个类。工厂方法使一个类的实例化延迟到其子类。关键结论：工厂方法是"单个产品等级结构"的创建解决方案，通过子类化实现具体创建逻辑1.2抽象工厂模式（AbstractFactory）抽象工厂模式提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。关键结论：抽象工厂是
数组中重复的数字-数据结构 hixiaoyang python 开发语言
问题描述在一个长度为n的数组里，所有数字都在0~n-1的范围内。数组中某些数字是重复的，但不知道有几个数字重复了，也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。关键要求：时间复杂度O(n)，空间复杂度O(1)解题思路方法一：哈希表法（不符合空间要求但容易理解）使用哈希表存储已经遍历过的数字，当遇到重复数字时返回。时间复杂度：O(n)空间复杂度：O(n)方法二：原地交换法（最优解）利用
后端技术：利用 MySQL 实现数据加密大厂资深架构师 Spring Boot 开发实战 mysql 数据库 ai
后端技术：利用MySQL实现数据加密关键词：MySQL数据加密、AES加密、数据库安全、数据保护、加密算法、密钥管理、SQL注入防御摘要：本文深入探讨如何在MySQL数据库中实现数据加密，保护敏感信息免受未授权访问。我们将从加密的基本原理出发，详细讲解MySQL支持的多种加密方式，包括AES、SHA等算法的实现方法。文章包含完整的代码示例和最佳实践，帮助开发者在实际项目中应用数据加密技术，同时讨论
Flutter 中封装 Dio 网络请求的详细步骤 Larry_zhang双栖 flutter
在Flutter中，通过封装Dio网络请求，可以将请求、响应处理和错误处理的逻辑集中在一起，减少代码重复并提升代码的可维护性。我们将在RequestClient类中创建一个通用的请求方法，支持GET和POST请求，并结合EasyLoading和Lottie动画，实现更好的用户体验。步骤1：创建RequestConfig基础配置类首先定义请求的基本配置。RequestConfig类负责存放API的b
【innovus基础】- 最基本的timing工具自动修复方法
一个小白向的timing修复方法就是，完全交给工具有gui界面和命令2种方式：1、gui操作ECO>>optdesign>>勾选fanout修复一轮后，发现hold完全没问题，但setup仍有少量问题。重新再修复一轮。下图中的glitchvio指的是毛刺持续时间或幅度超出允许范围的时序违例。可能造成亚稳态导致逻辑错误等问题。发现一次没有修好，现在只剩下setup的问题，我们可以在gui界面使用in
GORM深度解析：模型定义与数据库迁移最佳实践 Golang编程笔记数据库 oracle ai
GORM深度解析：模型定义与数据库迁移最佳实践关键词：GORM、模型定义、数据库迁移、最佳实践、Go语言摘要：本文深入探讨了GORM这一强大的Go语言ORM库，详细介绍了模型定义的方法和技巧，以及数据库迁移的最佳实践。通过通俗易懂的语言和丰富的实例，帮助读者理解GORM的核心概念，掌握如何利用GORM高效地进行数据库操作。背景介绍目的和范围在Go语言开发中，与数据库进行交互是一项常见的任务。GOR
[M数学] lc2829. k-avoiding 数组的最小总和(推公式+贪心模拟+好题) Ypuyu LeetCode 算法
文章目录1.题目来源2.题目解析1.题目来源链接：2829.k-avoiding数组的最小总和参考：灵神题解前置题：xxx题单：待补充2.题目解析2025年03月27日00:01:32方法一：贪心模拟依据两数之和的思想，从i=1开始填，总共需要填n个数。如果当前的i不可用，那就一直i++，找到一个可用的i如果k0{form[i]{i++}ifk>i{m[k-i]=true}res+=ii++n--
创客匠人老蒋六力模型：创始人 IP 打造的底层逻辑与实践路径创小匠 tcp/ip 网络协议网络
创始人IP如何从0到1破局？创客匠人CEO老蒋提出的“六力模型”，为知识变现领域提供了系统化方法论。该模型将IP打造拆解为六个递进阶段，揭示了从“个人品牌”到“商业资产”的进化逻辑。一、定义力：构建IP的认知锚点IP的本质是“用户共识的塑造”。老蒋以神话故事为例，盘古开天辟地通过定义“宇宙起源”形成集体认知，这与现代创始人IP的“品类定义”逻辑一致。美特斯邦威周成建在直播中强调“国货转型”定位，正
创客匠人老蒋：创始人 IP 打造的五大核心命题与破局之道创小匠 tcp/ip 网络协议网络
在知识付费行业进入深水区的当下，创始人IP如何从“流量符号”进化为“商业引擎”？创客匠人CEO老蒋在“全球创始人IP领袖高峰论坛”中，围绕“IP、趋势、战略、创新、增长”五大关键词，揭示了IP打造的系统性方法论。一、认知破局：IP是商业战略而非营销手段老蒋以美特斯邦威周成建直播为例，指出创始人IP的本质是“企业战略的人格化表达”。数据显示，IP化创始人的企业估值平均比非IP化企业高30%-50%，
鸿蒙线程池全揭秘：让你的应用快、稳、省资源前端世界 harmonyos harmonyos 华为
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
有序充电系统点亮零碳园区未来
在零碳园区，大规模电动汽车充电需求与分布式光伏发电曲线天然错位。若放任无序充电，午间光伏大发时充电需求低迷，而傍晚用电高峰时大量车辆集中充电，不仅加剧电网负担、推高用能成本，更造成宝贵绿电的浪费。有序充电系统正是破解这一矛盾的智能钥匙.落地场景：充电桩变身能源路由器光储充智能微网：光伏、储能、充电桩通过系统协同作战：光伏优先供能，储能平抑波动，有序充电作为柔性负荷动态调节，构建高度自洽的清洁供能单
Python中的count()方法溪流.ii python 数据库
文章目录Python中的count()方法基本语法在不同数据类型中的使用1.列表(List)中的count()2.元组(Tuple)中的count()3.字符串(String)中的count()高级用法1.指定搜索范围2.统计复杂元素注意事项Python中的count()方法前言：count()是Python中用于序列类型（如列表、元组、字符串等）的内置方法，用于统计某个元素在序列中出现的次数。基
PCIE中TLP的路由 newyork major PCIE PCIE
是指TLP通过Switch或者PCIe桥片时采用哪条路径，最终到达EP或者RC的方法。三种路由方式基于地址(Address)的路由memrd/wr,IOrd/wr使用TLP中的Address字段进行路由选径基于ID的路由cfgrd/wr、“Vendor_DefinedMessages”报文、Cpl和CplD报文根据BDF进行路由隐式路由(Implicit)Message报文包括“INTxInter
Android筑基——Service的启动过程之同进程启动（基于api21） willwaywang6 #Android 架构学习 android Service 启动
目录1.前言2.正文2.1ContextWrapper.startService()方法2.2ContextImpl.startService()方法2.3ContextImpl.startServiceCommon()方法2.3.1ActivityManagerNative.getDefault()方法2.4ActivityManagerProxy.startService()方法2.5Acti
浅谈HttpClient weixin_34092455 网络
为什么80%的码农都做不了架构师？>>>HttpClient简介HttpClient是ApacheJakartaCommon下的子项目，可以用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。HttpClient支持的功能如下：支持Http0.9、Http1.0和Http1.1协议。实现了Http全部的方法（GET,POST,PUT,HEA
C/C++快速回顾 Immok 其他
C/C++的库参考大全：http://www.cplusplus.com/reference/C语言：C语言的入口方法：main(intargc,constchar*argv[])intargc指控制台传入的参数个数，argv是传入的值宏定义：#definePi3.14//在编译阶段替换宏方法：#defineMAX(a,b)\a>b?a:bC中的switch需要写break;,否则会一直往下执行，
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
15.OCR训练 Echo`` Halcon系统化学习 ocr 人工智能深度学习算法计算机视觉机器学习
目录1.OCR训练2.助手训练13.助手训练24.算子训练5.OCR训练联合编程6.练习1.OCR训练*OCR训练*1.分类器文件*.omc*2.halcon官方的*1.局限性只能识别数字和字母*2.样式比较单一*3.样本数量较少*...**3.训练方法*1.助手训练*1.打开OCR助手*2.选择图片*3.选择训练区域*4.分割*5.字体*6.训练文件*7.新*8.学习*9.加入训练样本*10.保
14.OCR字符识别 Echo`` Halcon系统化学习 ocr 计算机视觉算法人工智能前端
目录1.识别方法1.OCR识别2.OCR识别方法1-助手识别3.OCR识别方法2-算子分割识别4.文本分割识别2.文本分割1.借用助手设置参数文本分割+混合识别2.借用助手设置参数文本分割场景23.不同字符场景1.倾斜字符1.识别方法1.OCR识别*OCR*1.概念*光学字符识别**2.识别的是什么*1.图片里面的文字符号**3.怎么识别*1.基于halcon的OCR识别**4.halconOCR
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他