新兴AI民工

机器学习读书笔记：半监督学习

文章目录

半监督学习
生成式方法
半监督SVM
基于分歧的方法
图半监督学习
半监督聚类

半监督学习

在真实应用场景中，训练样本集的数目通常会很大。但是都是未标记数据，特别是在一些跨领域行业中，比如医疗，工业。对样本的分析都需要专业人才，甚至高精尖的人才来确定标记。而这些人肯定是不可能给你长时间的打标记的。那么半监督学习就是想利用小部分的标记数据，再加上大量未标记样本来进行推理和判断。之前描述的监督学习和无监督学习都无法满足要求，因此，一个新的思路就是——半监督学习。

半监督学习还分成几种形式：

利用小样本先训练出一个模型，然后模型通过某种策略在其他的训练样本中挑出某些少量数据，再通过专家知识对这些数据进行标记；然后再通过这些标记去更新模型。不断的迭代这个过程，称之为**“主动学习”**。

如果实在没有办法获得新的标记数据了，还是可以通过另外的方法进行半监督学习，我们假设所有的样本都符合某种聚类，也就是说“相似的样本会有相似的输出”，或者说是符合某种分布。根据未标记样本的用途，还可以细分一下：

如果未标记样本就是需要预测的样本，成为直推学习。
如果未标记样本不是需要预测的样本，成为纯半监督学习。

书上给了一张图说明了这几个学习方式的区别：

在主动学习中，学习过程是需要挑选出一些样本进行标记，但是下面两种是不需要在学习过程中挑选新样本的，也就是不需要重复利用专家知识就可以达到较好的效果。

生成式方法

半监督学习中的一个重要假设就是所有的数据都是基于同一个模型。那么在生成式方法中，是计算样本属性和标记的联合概率 $P (x, y)$ ，从这个公式中，可以把 $y$ 当成一个缺失的样本属性，就可以引用之前聚类中讲到的的EM算法进行推导：

生成式模型有多种，书中给出的是高斯混合模型（高斯模型在上面那个传送门中也有提到）的例子，还有贝叶斯概率模型等其他的模型。

在高斯混合模型中，样本 $x$ 出现的概率是：
$p(x)=\sum_{i=1}^N\alpha_ip(x|\mu_i,\Sigma_i)$
表示的是样本 $x$ 从不同的高斯分量来的概率之和。
根据生成式模型的方式，样本 $x$ 的标记 $y = f (x)$ 应该是模型下后验概率最大的那一类，也就是通过模型计算出来概率最大的类别是哪个( $j$ 表示类别号)：
$f(x)=\arg \max_{y\in Y}p(y=j|x)$
对上一步的公式进行推导， $\Theta$ 表示每一个高斯分量，分量数目和类别数目相同：
$f(x)=\arg \max_{y\in Y}\sum_{i=1}^Np(y=j,\Theta=i|x)$
这个推导是因为上一步的概率可以换成每个分量的概率之和。
继续上一步：
$f(x)=\arg \max_{y\in Y}\sum_{i=1}^Np(y=j|\Theta=i,x)p(\Theta=i|x)$
我自己的理解是通过贝叶斯公式将后验概率换成了先验概率， $p(y=j|\Theta=i,x)$ 表示样本中是 $i$ 个分量出来，并且类别为 $j$ 的概率。 $p(\Theta=i|x)$ 为样本中高斯分量 $i$ 的概率，可以通过:
$p(\Theta=i|x)=\frac{\alpha_ip(x|\mu_i,\Sigma_i)}{\sum_{i=1}^N\alpha_ip(x|\mu_i,\Sigma_i)}$
进行计算。
上面的公式中， $p(y=j|\Theta=i,x)$ 部分是样本 $x$ 属于类别 $y$ 的概率，需要通过标记过的样本来计算，如果样本量很小，就很有可能无法准确的描述整体状态；但是可以通过后面一截 $p(\Theta=i|x)$ 来提升，因为这一截的计算方法是不需要有标记的，从上面的公式可以看出来。从而达到少量标记样本+大量未标记样本来提升准确率的目的。
可以用极大似然估计+EM迭代算法来计算模型中的三个参数 $\mu,\Sigma,\alpha$ 。

半监督SVM

半监督SMV(S3VM: Semi-Supervised Support Vector Machine)是针对经典SVM算法的改进版。其中最经典的改进版为TSVM(Transductive Support Vector Machine)。TSVM的思路是在去试着给未标记样本一个伪标记，然后基于真实标记+伪标记的训练样本进行SVM超平面的划分。超平面划分好了，标记也就确定了。但是这个直接去给伪标记是不可能的，因为未标记的样本是大量的，如果对这些样本进行穷举标记，然后对每个穷举的可能性进行SVM划分，计算量就太大了，也不太现实，所以需要有一个更高效的方法来指导性的给出伪标记，并作出超平面的划分。

首先，必须有一个优化目标，有了优化目标，才知道哪次的伪标记做的不好，也才知道往哪个方向去进行改进。在经典的SVM中，优化目标为 $\frac{1}{||w||_2^2}$ ，可以参考博客：

那么在TSVM中，优化目标变成了：
$\min_{w,b,\hat y,\xi}\frac{1}{||w||_2^2}+C_l\sum_{i=1}^l\xi_i+C_u\sum_{i=l+1}^m\xi_i$
其中 $l$ 为标记样本的数目， $u$ 为未标记的样本数目。 $\xi$ 为一个松弛向量，每个样本对应一个分量，每个分量的计算和标准SVM算法中的方式一样: $y_i(x^Tx_i+b)-1$ 。 $C_l, C_u$ 是用于控制标记/未标记两部分的一个权重。

随着每次伪标记的给出，动态的调整向量 $\xi，C_l, C_u$ 。
优化目标出来之后，就是怎么去计算的问题了，书中写的TSVM得过程为：

对上面的过程做一个解释：

首先用少量的标记样本计算出一个SVM模型： $SVM_l$ 。
用 $SVM_l$ 去预测所有的未标记样本，会得到未标记样本的类别，这就是伪标记。
因为这个模型的错误率肯定会比较高，比较训练数目太小，所以先调整 $C_u<Cu<<Cl$
算法的停止条件是 $C_u\ge C_l$ ，也就是未标记的样本权重慢慢调整的和标记样本一样了，说明已经达到了标记的重要程度，可以结束了。
那么SVM优化目标中的除 $w$ 之外的参数全部确定了，就可以计算得到超平面 $w$ 了， $\xi$ 是基于 $w$ 进行计算的。
重点在于怎么进行调整，调整的方法是找出两个伪标记为异类，也就是两个样本的伪标记不同( $\hat {y_i} \hat y_j < 0$ ，二分类问题)，并且很可能发生错误的标记，那也就是 $\xi_i>0, \xi_j>0,\xi_i+\xi_j\ge2$ ，至于是为什么这个就是发生错误的概率比较高，还没太想明白，老是被距离和各种转换搞晕。
从伪标记样本中挑出两个之后，把两个样本的标记互换(既然错误的概率最大，那么就换过来)，也就是上面的第7行和第8行。
重新计算 $w,b,\xi$ ，也就是超平面，理论上此时的超平面应该更加准确。
把第一轮中确定的 $C_u, C_l$ 的所有满足 $\xi_i>0, \xi_j>0,\xi_i+\xi_j\ge2$ 的样本都互换完并且划分完超平面后，调整 $C_u$ 的值， $C_u=min\lbrace 2C_u, C_l\rbrace$
改进版：如果基于标记样本训练出来的SVM对未标记样本的分类明显比较偏，比如某种类别的比较多(针对二分类问题)，那么可以把 $C_u$ 拆成两部分: $C_u^+$ 和 $C_u^-$ ，在初始化的时候只初始化 $C_u^-$ ，令 $C_u^+=\frac{u_-}{u_+}C_u^-$ ，其中 $u_-$ 为伪标记为反类的数目， $u_+$ 为伪标记为正类的数目。
还有一堆其他的计算过程的方法，不看了。

基于分歧的方法

对于一个训练样本来说，可以根据业务属性分成若干个视图(View)。视图就是一个属性集，书上举出的例子就是可以用一些属性去描述一部电影，这些属性可以分成是图像的描述、声音的描述、字幕、网上评论等等属性集；每个属性集包含若干个属性，比如图像可以包括色彩，帧数等等很多。根据属性集的划分，一个样本可以描述成 $(< x_{i}, x_{j} >, y)$ ， $x_i$ 为第 $i$ 个属性集的属性向量。

视图“相容性”：就是说针对每个视图或者属性集进行推断，推断结果的定义域是一样的，结果的类别都只能是 $(1, 2, 3, 4, 5, 6)$ ，不能有别的类别。

如果每个属性集都是独立的，那么就有下面的协同训练过程：

对每个属性集都分配一个学习算法，每一个视图的学习算法都使用已标记的样本进行训练获得模型。
每个分类器对剩余样本进行推断，并将每个分类器认为概率最高的伪标记样本作为新的训练样本给其他分类器作为训练样本使用。
循环第二步，直到每个分类器都不再发生变化。
这个过程就是相当于利用其他分类器的结果进行协同训练。
这个概率最高可以称作为分类置信度，贝叶斯网络的话就是计算出来的后验概率，SVM的话是间隔大小。

图半监督学习

这个过程看的半懂不懂，试着记录一下。

有标记样本集 $D_l=\lbrace (x_1,y_1),(x_2,y_2)\dots (x_l,y_l)\rbrace$ 和未标记样本集 $D_u=\lbrace (x_1,y_1),(x_2,y_2)\dots (x_u,y_u)\rbrace$ 。算法是使用这两个集合来构建一个图G=。图相关内容可参考博客：

其中，顶点集合V就是 $l + u$ 个样本，共 $m$ 个顶点；边集合E由下面的公式定义：
$(W)_{ij}=\begin{cases}exp(\frac{-||x_i-x_j||_2^2}{2\sigma^2}), if i \neq j \\ 0 \end{cases}$
如果 $i = j$ 为0；而 $\sigma$ 是一个需要指定的参数：高斯函数带宽参数。计算出来的值就是顶点与顶点之间变得权重：“强度”。
假设一个推断函数 $f$ 是表示从图 $G - > R (实数域)$ 的一个映射。定义了一个这个推断函数 $f$ 的能量函数 $E (f)$ :
$E(f)=\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m{(W)_{ij}(f(x_i)-f(x_j))^2}$
我自己对这个函数的理解是：每个样本之间的推断之间的值得差值，来乘以对应图或者矩阵中的 $W$ 值，然后再来求和。从形式上看，第一项 $W$ 是计算了两个样本之间的相似度，第二项 $f(x_i)-f(x_j))^2$ 是计算了这两个样本之间推断值得相似度。理论上一个好的推断函数，在同一个分布样本上的差异应该是很小的。所以就看令 $E (f)$ 最小的情况。
然后根据一堆看不太懂的推导过程，直接看结论，可以得到：
$f_u=(I-P_{uu})^{-1}P_{ul}f_l$
其中 $I$ 是单位矩阵。

$P_{uu}=D_{uu}^{-1}W_{uu}$

$P_{uu}=D_{uu}^{-1}W_{uu}$

其中 $D=diag(d_1,d_2 \dots d_{l+u})$ ， $d_i=\sum_{j=1}^{l+u}{(W)_{ij}}$ ，也就是矩阵 $W$ 中第 $i$ 行的元素之和。

然后把D, W两个矩阵进行分块：
$D=\begin{Bmatrix} d_{11} & \dots d_{1l} & \dots & d_{1m} \\ d_{21} & \dots d_{2l} & \dots & d_{2m} \\ \dots \\ d_{l1} & \dots d_{ll} & \dots & d_{lm} \\ \dots d_{m1} & \dots d_{ml} & \dots & d_{mm} \\ \end{Bmatrix}$
那么针对第 $l$ 行 $l$ 列对矩阵进行分块：
$D=\begin{Bmatrix} D_{ll} & D_{lu} \\ D_{ul} & D_{uu}\end{Bmatrix}$
把矩阵分成了四块， $W$ 矩阵是一个道理。
从上面的公式可以看出，如果把 $f_l$ 就定义成样本 $D_l$ 的输出，也就是标记的话，就可以直接计算得到 $f_u$ 了。

对上面的二分类问题做点改动就是多分类问题的过程：

比二分类问题中的过程多了几个东西：

F矩阵，这个矩阵就是用于推断所有未知标记样本的，需要通过一个传播算法来进行计算，通过多轮迭代达到收敛后使用。

F为一个 $l + u$ 行， $∣ Y ∣ (类别数)$ 列的矩阵
如果F确定了，那么每个样本 $x_i$ 就可以直接去相应的一行取出来进行计算，通过 $y_i=argmax_{1yi=argmax1<j<∣Y∣(F)ij$

那么问题就是确定传播算法，传播算法的计算公式为：
$F(t+1)=\alpha SF(t) + (1-\alpha)Y$

其中 $Y_{ij}=\begin{cases}1, if(1Yij={1,if(1<i<l)(yi=j)0,otherwise$
迭代中的最初的 $F (0) = Y$

半监督聚类

聚类本身就是不需要标记信息的，为什么有个半监督聚类呢，就是说如果有一些辅助的标记信息，是可以来指导聚类过程的，相当于有一些约束条件。

有两种指导信息：

和上面的一样，有一些样本是标记了类别的，每个类别是可以看成是一个聚类簇。
说明哪些样本一定是一个簇的，或者说明哪些样本一定不是一个簇的。

书中针对第二种指导条件，改造了K均值算法，第二种还是给出了那些样本一定不是一个簇的。这种情况下的话比较简单，直接用这些样本做初始的质心即可。

《即兴的智慧》读书笔记（五）（86-102页）河南张俊红
第七个练习面对事实“面对现实”意味着我们要慢慢品味他人提供的食物吸收，并加上自己的见解。面对现实是必要的元素，他对日常生活也有指导作用。即兴演员不会去纠结那些不切实际的想法，他们会面对现实，然后努力将崎岖变成坦途，把坏事变成好事。希望他人改变，也是逃避事实的一种方式，我们会期待他人做出改变，必须接受人与人之间的差异，即兴演员懂得与不同风格的人合作的价值，并能够控制改变他人的冲动。第八个练习别忘了目
《三十岁，一切刚刚开始》读书笔记Day02/25 设绘喵爱读书April
第一章：三十岁轨迹1-2三十岁，真正的人生才刚刚开始•人和人不能用生理年龄来区分，更不能十年、十年地来划分。•见过很多二十多岁却从不学习的年轻人，也见过六十多岁还在路上奔波的长者，前者已经老了，后者依旧年轻。所以，人到底什么时候才算变老了呢？答案是，不学习的时候，不进步的时候。•有两种方式可以让人减缓衰老：第一，寻找一个伟大的目标，用一生完成。第二，做一件持续升值的事情，直到永远。•这两种减缓衰老
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
美嫺读书笔记美嫺
家长希望孩子快人一步，固有提前训练，欲揠苗助长。其实，从能力发展的过程来看，不必让孩子提前"预习"，顺其自然是最好的法则之一。人类有许多与生俱来的能力，每个年龄阶段自然就会掌握那个技能，就如走路一样。支配儿童心理发展的因素有两个:一个是成熟，另一个是学习。美国著名儿童心理学家格塞尔著名的——双胞胎爬梯实验表明:儿童的心理主要是一个自然成熟的过程，孩子的成长是受到生理和心理成熟机制制约的，教育并不能
通俗易懂：什么是决策树？淦暴尼算法 python 决策树算法机器学习
1.引言：决策树就像“选择题”你是否曾经在生活中做过“选择题”？比如：今天要不要带伞？晚饭吃什么？该不该买那件心仪已久的商品？其实，我们的大脑经常会像“决策树”一样，通过一连串问题和判断，逐步缩小选择范围，最终做出决定。**决策树（DecisionTree）**就是这样一种模拟人类决策过程的机器学习模型。它通过“提问-分支-决策”的方式，把复杂问题拆解成一系列简单的判断，广泛应用于分类（如判断邮件
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
1.14读书笔记《义务教育英语课程标准（2022年版）解读》望亭陆曙良
第二阶段义务教育英语课程改革的主要问题有哪些？1.《课程标准（2011）》的课程目标与《高中课程标准（2017）》不一致。《课程标准（2011）》提出的英语课程总目标是培养学生的综合语言运用能力，《高中课程标准（2017）》提出的英语课程目标是培养学生的学科核心素养。2.部分教学理念与当前世界课程改革理念对接不够。在当前共建人类命运共同体的时代理念下，《课程标准（2011）》缺少前瞻性，学科育人价
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
Protein FID：AI蛋白质结构生成模型评估新指标
一、引言：蛋白质生成模型面临的评估挑战近年来，AI驱动的蛋白质结构生成模型取得了令人瞩目的进展，但如何有效评估这些模型的质量却一直是一个悬而未决的问题。虽然实验验证仍然是金标准，但计算机模拟评估对于快速开发和比较机器学习模型至关重要。然而，尽管最先进的模型在当前评估指标上表现卓越，但它们在实际设计应用中的成功率仍然相对有限。例如，有研究报告显示生成结构的实验成功率仅为3%，而计算机模拟评分却远高于
《小狗钱钱2》读书笔记慧妍0010
文|慧妍图片发自App如果说《小狗钱钱》第一部侧重培养孩子的财商，那么第二部则侧重培养孩子的品格。《小狗钱钱2》提出了“甜甜圈理论”，即：甜甜圈外面的圈象征了金钱和一切可以消费的东西，而里面那个无形的圆孔就代表了人的内心，象征了我们无法看到却又必须具备的品格。没有金钱只有内心，生活都无法保证，幸福从何而来？只有金钱，失了内心的人，拥有的却不是真幸福。如何培养优秀的品格，书中给出了7条准则。每一条准
读书笔记06‖《时间管理，如何充分利用你的24小时》 Gemini_565d
54分钟，你没有听错，我读完了这本妙趣横生的书！总共128页，平均每分钟2页的阅读速度，我能行，你可以做到！作者用幽默诙谐的语言向我们讲述了时间管理的有效方法，字数不多，风格独特，没有废话！实际上并不单单指你24小时的内容！且来看看这本不占用你时间，但给你提出时间管理的技巧！01.主要结构与内容1.篇章结构上半部分:如何利用时间？下半部分:是否正在使用时间发挥最大效用？2.主要概念（1）意识是时间
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
读书笔记：德鲁克《管理的实践》17 李唐星辰
1、【企业对员工的要求】这个版块中提到：企业期望员工不只是被动接受劳动力工作，而必须主动承担达成经营绩效的责任。……要求越高，表现越好，是人的特性，因此员工能发挥多大的生产力，很大部分取决于企业对他们的要求有多高。星辰感悟：人的潜力是无限的。说这句话的时候，不仅肯定了自己，也肯定了所有奋斗的人。很多时候，认知会限制我们的想法。这跟小马过河是一个道理。松鼠小觉得小溪就是一条河，但是对于马儿来说根本不
《陪伴成长》读书笔记(一) 姬磨小学李会巧
今天，我读了《陪伴成长》中的“家庭教育不能盲从”这一章节，感受颇深。的确，在这个重视教育的年代，怎么样才能把自己的孩子教育成功呢？我们的孩子到底需要什么样的教育呢？当今社会，很多人都在渴望自己的孩子成为优秀，但他们很多人都忽视了优秀人才成长的基础；众多人都在关心孩子的教育，但他们很多人都把目光投向了分数；众多人都在以孩子成绩为荣，但他们很多人都淡忘了心理健康与道德修养；众多人都在给予爱，但他们很多
D065+8组煎果子+《高效能人士的7个习惯》读书笔记煎果子
习惯一：积极主动时下盛行的社会观点认为，环境与条件对我们起着决定性的作用。我们不否认条件作用的影响巨大，但并不等于承认它凌驾于一切之上，甚至可以决定我们的命运。在外界的刺激与最后的回应之间，人拥有选择的自由，这也是人与动物之间最大的不同。史蒂芬•柯维指出，看一个人的时间和精力集中于哪些事物，就可以大致判断出他是否积极主动。作者将我们关注的问题分成两类：关注圈和影响圈。关注圈，是指我们关注的问题，包
人的行为读书笔记，2-7 夕颜剑主
第二章人的行为科学在认识论层次的一些问题第七节历史的范畴和专门的研究方法1.历史的研究范畴与历史家如何进行真正的历史工作历史的范畴是研究所有关于人的行为的经验资料。历史学家收集、批判、筛选所有可以取得的文件，以这种证据为基础，着手进行真正的历史工作。2.错误的历史研究方法有人说，历史的任务是揭露一些事件实际上是如何发生的，不允许有所遐想，亦不许有价值判断（也即，对于一切价值判断保持中立）。他们认为
《我和你》读书笔记（六）相信，遇见心理咨询师卜彬
如何才能在一个生命的里面让早被掩埋的联系能量复活呢？如何才能让一个一直生活在任性之中的人觉到自由呢？自由同命运如影随形，任性与灾难也是如影随形。但自由同命运有誓约，任性与灾难、灵魂魔魅与世界鬼魇，则不过是一团和气地住在一起，而且很小心不想伤害和气，哪有什么结合可言，也谈不上有摩擦，完全无意义可言——直到在某一刻，眼神一不小心对上了，终于意识到原来并没有得到救赎！自由人是那种并非由于任性而有所想要的
【读书笔记】《做高效能父母》之接纳：关系是一切管教的基础端端妈
一、没有人比我更爱孩子，但我真的接纳他吗？三个孩子的宝妈，由于居住环境的改变，发现原本听话的3个孩子，每个人都发生了变化，都在变得不听话了，于是妈妈开始反省自己的过失，给我们分享了正面管教的四个有效管教标准和6A课程。正面管教的四个有效管教标准1.是否和善与坚定并行？2.是否有助于孩子感受到归属感和价值感？3.是否长期有效？4.是否能教给孩子有价值的社会技能和人生技能，培养孩子的良好品格？6A课程
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
机器学习专栏（62）：手把手实现工业级ResNet-34及调优全攻略
目录一、ResNet革命性突破解析1.1残差学习核心思想1.2ResNet-34结构详解二、工业级Keras实现详解2.1数据预处理流水线2.2完整模型实现三、模型训练调优策略3.1学习率动态调整3.2混合精度训练四、性能优化技巧4.1分布式训练配置4.2TensorRT推理加速五、实战应用案例5.1医疗影像分类5.2工业质检系统六、模型可视化分析6.1特征热力图6.2参数量分析七、常见问题解决方
读书笔记一年顶十年怎样才能常遇贵人一幻花韵马
学:改圈子，你才更有可能实现突破。走出去，你才更有可能遇到贵人。如果你想常遇贵人，那就一定不要宅着，不要封闭地活着，而要走出去，去认识更多优秀的人。思:贵人在什么地方？贵人对你有什么意义，他能带给怎样的价值？如何认识更多的贵人并得到贵人的帮助？行:我要主动走出去，往有贵人的圈子发展，改变自己的人际关系，想办法多遇贵人。
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st