aibbtcom

收藏！836分钟的谷歌机器学习教程，10分钟带你看完！

人工智能博客（公众号ID:aibbtcom）整理，如有侵权请联系删除。0 引言

为了尊重原意，部分名词不进行翻译。
为了更通俗易懂的解释概念，使用低维度的情况来解释。

1 机器学习概念

1.1 主要术语

标签预测的事物，即 y = ax + b 中的 y 变量，如房价、动物种类、是否垃圾邮件等。

特征输入变量，即 y = ax + b 中的 x 变量，x 可以是一个，也可以是多个，用 {x1, x2, ..., xn} 组成的向量来表示。比如电子邮件的文本字词、邮箱地址、发送时间等

样本具体某一个示例，比如一封邮件。有标签样本：邮件(x) + 是否垃圾邮件(y)无标签样本：邮件(x)

模型模型定义了特征与标签之间的关系。简单的理解为 y = ax + b 中的 a和 b。训练：输入(0, 1) , (1, 3) , (2, 5) 求出 a = 2， b = 1预测：输入 x = 10，推断出 y = 10*2 +1 = 13

回归预测连续值，如：

加利福尼亚州一栋房产的价值是多少？
用户点击此广告的概率是多少？

分类预测离散值，如：

某个指定电子邮件是垃圾邮件还是非垃圾邮件？
这是一张狗、猫还是仓鼠图片？
这是 Jinkey（公众号 jinkey-love）写的文章还是其他人写的文章？

损失预测值和目标值的差距。一种常见的损失函数就是我们的义务教育阶段都学过的"两点间的直线距离"，其中 x1=x2：

1.2 降低损失

大家都玩过猜数字游戏，主持人出一个 1-100 内的数字，其他人轮流猜测，玩家 A 提出一个数字，主持人只会说大了还是小了。这个过程靠猜测不停地逼近真实值（也就是不停地缩小损失的过程）

Gradient Descent其中一个常见的降低损失的方法就是梯度下降(Gradient Descent)，用高中知识就可以理解了。假如损失函数 loss = x^2 + 2x + 1 的梯度函数就是 loss' = 2x + 2

假如一开始输入x 等于 -3, -2, -1, 1, 2, 3是，y’即梯度分别等于 -4, -2, 0, 2, 4，所以如果输入的样本是(-2, ?) 则梯度下降的方向就是从 -2 -> -1移动，如果输入的样本是 (2, ?)就是从 -2 -> -1 来降低损失函数的值，慢慢移动到 -1 得到了损失函数的极小值。

看到这里你是否觉得直接通过高中的知识求导得到极小值就可以了？但如果变量不止一个，如果上述垃圾邮件样本包含的特征：文本内容包含“贷款”的数量、邮箱地址、发送时间等等，损失函数就可能是三维甚至多维的，存在一个或多个“局部最低小”，并且导数或偏导数不能求出的情况下，只能通过“有技巧地猜数字”来逼近真实值：梯度下降方法有随机梯度下降 SGD 和小批量梯度下降 mini-batch SGD。至于具体差异，本文不展开说明，谷歌的教程也是为了速成。一般采用 mini-batch SGD 会更加高效。

你可能会问不知道算法怎么写代码？在谷歌的 Tensorflow 框架里面，梯度下降就是一行代码而已, 所以初学者有个初步概念即可：

tf.train.GradientDescentOptimizer()

Learning Rate上面所说

从 -2 -> -1 来降低损失函数的值

这里引入了学习率的概念-2到-1移动说明学习率是1。如果从-2移动到-1.8，学习率则是0.2。

学习率太大容易跳过最小值（or 极小值），如蓝线所示，学习率太小导致学习时间很长。

学习率 Playground：https://developers.google.com/machine-learning/crash-course/fitter/graph

1.3 过拟合

损失很低，但仍然是糟糕的模型，因为过度拟合了训练集数据，导致在测试集或训练集等新样本上效果很差。

1.4 拆分数据

训练集和测试集 (Training and Test Sets)

训练集 - 用于训练模型的子集。
测试集 - 用于测试训练后模型的子集。

训练集和测试集 Playground:https://developers.google.cn/machine-learning/crash-course/training-and-test-sets/playground-exercise

某些情况下为了防止不小心在训练过程引入对测试集的拟合，引入验证集（就是把数据分成三份）

1.5 特征工程

所有类型的数据，最终都要转换为数字的形式，计算机才能学习。使用的特征要注意：

在数据集中出现大约 5 次以上，比如不能用数据的唯一 id 作为特征
具有清晰明确的含义
不包含超出范围的异常断点或“神奇”的值，比如电影评分为 -1 或 NaN
特征的定义不应随时间发生变化，比如地点：北京是固定的，但不要用地点：219

特征组合 Playground:https://developers.google.cn/machine-learning/crash-course/feature-crosses/playground-exercises

1.5.1 数据类型

数值数据

离散数据（直接用或者先离散化）0、1、2连续数据 0.001、0.2、1.0、2.2

文本数据

作为分类标签{'Netherlands', 'Belgium', 'Luxembourg'}转换为 {0， 1， 2}

作为自然语言学习A = “Jinkey 是中国人”B = “Jinkey 是中国的学生”A + B 的词列表：（Jinkey, 是, 中国, 人, 的, 学生）如果具有某个词就用1表示、不具有就用0表示，这样就把 A 表示成：A = （1, 1, 1, 1, 0, 0）B = （1, 1, 1, 0, 1, 1）

图像数据

彩色图片是分开 RGBA 四通道的值作为图片特征，灰度图把灰度作为图片特征，黑白图黑色的像素为1白色为0。

1.5.2 数据清洗

缩放特征值有一个特征 A (字段)的值是500000，有一个特征B（字段）的值是0.1，这时候需要根据所有样本的 A 特征的最大值和最小值把特征值缩放到[0, 1]之间：

缩放值 = （真实值 - 平均值）/ 标准差

处理极端值

对每个值取对数
对大于某个值的特征值进行截断，比如（1， 2， 3， 666， 2，3）-> （1， 2， 3， 3， 2，3）

分箱其实就是把数值离散化成一个个区间，然后用某个符号来标识比如纬度37.4可以转换成两种形式：

6（第6个区间）
[0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0] （作为一个11维张量，37.4属于第6个区间，所以为1）

这种方式也成为 one-hot 编码（具有一个特征为1，否则为0）

特征组合特征组合是指通过将两个或多个输入特征相乘来对特征空间中的非线性规律进行编码的合成特征。[A X B]：将两个特征的值相乘形成的特征组合。[A x B x C x D x E]：将五个特征的值相乘形成的特征组合。[A x A]：对单个特征的值求平方形成的特征组合。

其他

遗漏值。例如，有人忘记为某个房屋的年龄输入值。
重复样本。例如，服务器错误地将同一条记录上传了两次。
不良标签。例如，有人错误地将一颗橡树的图片标记为枫树。
不良特征值。例如，有人输入了多余的位数，或者温度计被遗落在太阳底下。

1.5.3 正则化

L2 正则

为什么要正则化？惩罚复杂的模型（过拟合的模型）

机器学习训练目标是损失函数最小化，如果复杂模型也算是一种损失，那么可以把模型复杂度加入到损失函数的公式里面。

如何衡量一个模型的复杂程度？各变量权重的平方和（L2正则）

效果：

使权重值接近于 0（但并非正好为 0）
使权重的平均值接近于 0，且呈正态（钟形曲线或高斯曲线）分布

Lambda正则系数在正则项前加系数 Lambda，其对权重的影响如图：

lambda 值过高 -> 模型会非常简单 -> 欠拟合lambda 值过低 -> 模型会非常复杂 -> 过拟合

L1 正则

为什么有 L2 正则还要 L1 正则L2 正则化可以使权重变小，但是并不能使它们正好为 0.0，这样高维度特征矢量会消耗大量的内存

L1 正则项是绝对值

正则化 Playground:L2 https://developers.google.cn/machine-learning/crash-course/regularization-for-simplicity/playground-exercise-overcrossingL1 https://developers.google.cn/machine-learning/crash-course/regularization-for-sparsity/playground-exercise

1.6 逻辑回归 (Logistic Regression)

怎么分析一个句子属于褒义还是贬义？把从句子推倒出（褒义词数量，贬义词数量）二维向量做为特征 X，把人工标记的特征标为 Y，就进行逻辑回归。

比如我们有一系列人工标记的样本：

通过一个神奇的公式，机器学习到一些规律，比如机器学习到罩杯是 C 的女生是美女的概率为0.5; 腿长为 1m 的女生被判断为美女的概率是 0.5。

当输入一个新的样本，系统就能根据学习到的模型1 / (1+exp(w0+w1*x1+w2*x2+...+wm*xm))，算出新加入的女生属于美女的概率是多少，比如说算出来是0.6的概率，那么如果定义阈值为 0.5，那么0.6>0.5，所以就认为她是个美女。

0.5 称为分类阈值 classification threshold，为了将逻辑回归值（是美女的概率）映射到二元类别（是美女/不是美女），您必须指定分类阈值。

逻辑回归的损失函数

和线性回归采用平方损失不同，逻辑回归的损失函数是对数损失函数Log Loss，定义如下入门的你，你大可不必记住这个公司，因为在 tensorflow 里面要使用这个损失函数，只需要一行代码：

loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=model_output, labels=y_target))

混淆矩阵 Confusion Matrix

对于二分类，我们使用混淆矩阵来表示所有可能的分类结果。

以《狼来了》的故事为例：

精确率 Precision

在被识别为正类别的样本中，确实为正类别的比例是多少？

召回率 Recall

在所有正类别样本中，被正确识别为正类别的比例是多少？

精确率和召回率往往是此消彼长的情况。也就是说，提高精确率通常会降低召回率值

ROC 曲线Receiver Operating Characteristic Curve, 用于绘制采用不同分类阈值时的 TPR 与 FPR。

AUC 面积ROC 曲线下面积，Area under the ROC Curve。

1.7 神经网络

为什么有逻辑回归等传统机器学习方法还要神经网络？处理非线性问题（y = ax + b 这种叫做线性模型）

彩色小球代表神经元

神经网络 Playground:https://developers.google.cn/machine-learning/crash-course/introduction-to-neural-networks/playground-exercises

1.7.1 激活函数

把y = ax + b的结果作为自变量输入激活函数： f(ax+b) 来作为神经元的输出值

1.7.2 训练神经网络

方法：反向传播

具体过程你可以拿起笔，自己按照本文作者（公众号jinkey-love）之前翻译的文章来推演一遍：《用笔一步步演示人工神经网络的反向传播算法——Jinkey 翻译》

可能出现的异常：

上图是之前网络很流行的图，说每天进步一点点，一年就会有很大收获；每天退步一点点，一年就会落后很多。这里就可以引出梯度消失和梯度爆炸的概念。

梯度消失

在深度网络中，计算这些梯度时，可能涉及许多小项的乘积。

当较低层的梯度逐渐消失到 0 时，这些层的训练速度会非常缓慢，甚至不再训练。

梯度爆炸

网络中的权重过大，则较低层的梯度会涉及许多大项的乘积。

在这种情况下，梯度就会爆炸：梯度过大导致难以收敛。

批标准化可以降低学习速率，因而有助于防止梯度爆炸。

随机失活 Dropout

在梯度下降法的每一步中随机丢弃一些网络单元。丢弃得越多，正则化效果就越强：

0.0 = 无丢弃正则化
1.0 = 丢弃所有内容。模型学不到任何规律
0.0 和 1.0 之间的值更有用

1.7.3 多类别神经网络

1.7.4 嵌套 (Embedding)

高维空间向低维空间的转换，用于计算两个实体的相似度。比如电影类别有科幻、成人、卡通那么，《小猪佩奇》就可以转换成one-hoting编码（0，0，1）《星球大战》就可以转换成one-hoting编码（1，1，0）《喜爱夜蒲》就可以转换成one-hoting编码（0，1，0）

《小猪佩奇》和《星球大战》的距离3，《星球大战》和《喜爱夜蒲》的距离为1，所以当一个用户看了电影《星球大战》，可以给他推荐《喜爱夜蒲》而不是《小猪佩奇》。

2 机器学习工程

2.1 生产环境机器学习系统

尽可能重复使用常规机器学习系统组件。
Google CloudML 解决方案包括 Dataflow 和 TF Serving
可以在 Spark、Hadoop 等其他平台中找到组件
了解机器学习系统的一些范例及其要求，找到自己需要哪些组件？

2.2 训练方法

静态模型 - 离线训练

易于构建和测试 - 使用批量训练和测试，对其进行迭代，直到达到良好效果。
仍然需要对输入进行监控
模型容易过时

动态模型 - 在线训练

随着时间推移不断为训练数据注入新数据，定期同步更新版本。
使用渐进式验证，而不是批量训练和测试
需要监控、模型回滚和数据隔离功能
会根据变化作出相应调整，避免了过时问题

2.3 预测方法

离线预测

使用 MapReduce 或类似方法批量进行所有可能的预测。记录到表格中，然后提供给缓存/查询表。

优点

不需要过多担心推理成本。
可以使用批量方法。
可以在推送之前对数据预测执行后期验证。

缺点

只能对我们知晓的数据进行预测，不适用于存在长尾的情况。
更新可能延迟数小时或数天。

在线预测

使用服务器根据需要进行预测。

优点

可在新项目加入时对其进行预测，非常适合存在长尾的情况。
计算量非常大，对延迟较为敏感，可能会限制模型的复杂度。

缺点

监控需求更多。

2.4 数据依赖关系

可靠性

信号是否始终可用？信号来源是否不可靠？

比如

信号是否来自因负载过重而崩溃的服务器？
信号是否来自每年 8 月去度假的人群？

版本控制

计算此数据的系统是否发生过变化？

比如

多久一次？
您如何知道系统发生变化的时间？

必要性

特征的实用性是否能证明值得添加此特征？

3 机器学习系统在现实世界里的应用

3.1 癌症预测

特征：病人年龄、性别、医疗状况、医院名称、生命体征、检验结果预测：是否会患有癌症

以上设定存在什么问题？

模型中包含的一个特征是医院名称，比如"癌症中心"等专门治疗癌症的机构，已经暗含了在医生的诊断结论，这叫做标签泄露**。当模型尝试取代医生去判断新样本时（还未就医），模型无法得知该信息，导致预测的结果非常糟糕。

3.2 文学

特征：文学语句预测：作者的政治派别

以上设定存在什么问题？

当我们创建测试训练和验证拆分内容时，我们是通过逐句拆分样本来实现的。也就是说，同一个作者的语句会一部分会被编入训练集，一部分会编入测试集，这导致训练的模型可以了解某个作者在语言使用方面的特质，而不仅仅是了解他使用的隐喻手法。所以应该在作者的层面，这个作者的所有语句要么都作为训练集，要么都作为测试集。

3.3 机器学习准则

确保第一个模型简单易用
着重确保数据管道的正确性
使用简单且可观察的指标进行训练和评估
拥有并监控您的输入特征
将您的模型配置视为代码：进行审核并记录在案
记下所有实验的结果，尤其是“失败”的结果

编程练习

Pandas 简介https://colab.research.google.com/notebooks/mlcc/intro_to_pandas.ipynb?hl=zh-cn

使用 TensorFlow 的起始步骤https://colab.research.google.com/notebooks/mlcc/first_steps_with_tensor_flow.ipynb?hl=zh-cn

合成特征和离群值https://colab.research.google.com/notebooks/mlcc/synthetic_features_and_outliers.ipynb?hl=zh-cn

验证：编程练习https://colab.research.google.com/notebooks/mlcc/validation.ipynb?hl=zh-cn

特征集：编程练习https://colab.research.google.com/notebooks/mlcc/feature_sets.ipynb?hl=zh-cn

特征组合编程练习https://colab.research.google.com/notebooks/mlcc/feature_crosses.ipynb?hl=zh-cn

逻辑回归编程练习https://colab.research.google.com/notebooks/mlcc/logistic_regression.ipynb?hl=zh-cn

稀疏性和 L1 正则化：编程练习https://colab.research.google.com/notebooks/mlcc/sparsity_and_l1_regularization.ipynb?hl=zh-cn

神经网络简介：编程练习https://colab.research.google.com/notebooks/mlcc/intro_to_neural_nets.ipynb?hl=zh-cn

提高神经网络性能：编程练习https://colab.research.google.com/notebooks/mlcc/improving_neural_net_performance.ipynb?hl=zh-cn

MNIST 数字分类编程练习https://colab.research.google.com/notebooks/mlcc/multi-class_classification_of_handwritten_digits.ipynb?hl=zh-cn

嵌套编程练习https://colab.research.google.com/notebooks/mlcc/intro_to_sparse_data_and_embeddings.ipynb?hl=zh-cn

艾伯特（http://www.aibbt.com/）让未来触手可及！

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本