影之李小白

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow（第2版）》学习笔记

文章目录

- - 书籍信息
  - 技术和工具
  - - Scikit-Learn
    - TensorFlow
    - Keras
    - Jupyter notebook
  - 资源
  - - 书籍配套资料
    - 流行的开放数据存储库
    - 元门户站点(它们会列出开放的数据存储库)
    - 其他一些列出许多流行的开放数据存储库的页面
    - 其他
  - 机器学习项目清单
  - - 主要有8个步骤
    - 框出问题并看整体
    - 获取数据
    - 研究数据
    - 准备数据
    - 列出有前途的模型
    - 微调系统
    - 演示你的解决方案
    - 启动
  - 机器学习概览
  - - 什么是机器学习
    - 为什么使用机器学习
    - 机器学习的应用示例
    - 机器学习系统的类型
    - 机器学习的主要挑战
    - 测试与验证
  - 端到端的机器学习项目
  - - 观察大局
    - 获取数据
    - 从数据探索和可视化中获得洞见
    - 机器学习算法的数据准备
    - 选择和训练模型
    - 微调模型
    - 启动、监控和维护你的系统
  - 分类
  - - 训练二元分类器
    - 性能测量
    - 多类分类器
    - 误差分析
    - 多标签分类
    - 多输出分类
  - 训练模型
  - - 线性回归
    - 梯度下降
    - 多项式回归
    - 学习曲线
    - 正则化线性模型
    - 逻辑回归
  - 支持向量机
  - - 线性SVM分类
    - 非线性SVM分类
    - SVM回归
    - 工作原理
  - 决策树
  - - 训练和可视化决策树
    - 做出预测
    - 估计类概率
    - CART训练算法
    - 计算复杂度
    - 基尼不纯度或熵
    - 正则化超参数
    - 回归
    - 不稳定性
  - 集成学习和随机森林
  - - 投票分类器
    - bagging和pasting
    - 随机补丁和随机子空间
    - 随机森林
    - 提升法
    - 堆叠法
  - 降维
  - - 维度的诅咒
    - 降维的主要方法
    - 主成分分析 PCA
    - 内核PCA
    - 局部线性嵌入 LLE
    - 其他降维技术
  - 无监督学习技术
  - - 聚类
    - 高斯混合模型
  - Keras人工神经网络简介
  - - 从生物神经元到人工神经元
    - 使用Keras实现MLP
    - 微调神经网络超参数
  - 训练深度神经网络
  - - 梯度消失与梯度爆炸问题
    - 重用预训练层
    - 更快的优化器
    - 通过正则化避免过拟合
    - 总结和实用指南
    - - 默认的DNN配置
      - 用于自归一化网络的DNN配置
  - 使用TensorFlow自定义模型和训练
  - - TensorFlow快速浏览
    - 像NumPy一样使用TensorFlow
    - 定制模型和训练算法
    - TensorFlow函数和图
  - 使用TensorFlow加载和预处理数据
  - - 数据API
    - TFRecord格式
    - 预处理输入特征
    - TF Transform
  - 使用卷积神经网络的深度计算机视觉
  - - 视觉皮层的架构
    - 卷积层
    - 池化层
    - CNN架构
    - 使用Keras实现ResNet-34 CNN
    - 使用Keras的预训练模型
    - 迁移学习的预训练模型
    - 分类和定位
    - 物体检测
    - 语义分割
  - 使用RNN和CNN处理序列
  - - 循环神经元和层
    - 训练RNN
    - 预测时间序列
    - 处理长序列
  - 使用RNN和注意力机制进行自然语言处理
  - - 使用字符RNN生成莎士比亚文本
    - 情感分析
    - 神经机器翻译的编码器-解码器网络
    - 注意力机制
    - 最近语言模型的创新
  - 使用自动编码器和GAN的表征学习和生成学习
  - - 有效的数据表征
    - 使用不完整的线性自动编码器执行PCA
    - 堆叠式自动编码器
    - 卷积自动编码器
    - 循环自动编码器
    - 去噪自动编码器
    - 稀疏自动编码器
    - 变分自动编码器
    - 生成式对抗网络
  - 强化学习
  - - 学习优化奖励
    - 策略搜索
    - OpenAI Gym介绍
    - 神经网络策略
    - 评估动作:信用分配问题
    - 策略梯度
    - 马尔可夫决策过程
    - 时序差分学习
    - Q学习
    - 实现深度Q学习
    - 深度Q学习的变体
    - TF-Agents库
    - 一些流行的RL算法概述
  - 大规模训练和部署TensorFlow模型
  - - 为TensorFlow模型提供服务
    - 将模型部署到移动端或嵌入式设备
    - 使用GPU加速计算
    - 跨多个设备的训练模型

书籍信息

书名：机器学习实战：基于Scikit-Learn、Keras和TensorFlow（第2版）
作者：奥雷利安·杰龙
资料：https://download.csdn.net/download/zhiyuan411/87008603，密码：book

技术和工具

Scikit-Learn

Scikit-Learn 非常易于使用，它有效地实现了许多机器学习算法，因此成为学习机器学习的重要切入点。Scikit-Learn由David Cournapeau于2007年创建，现在由法国计算机科学和自动化研究所的一个研究小组领导。

TensorFlow

TensorFlow 是用于分布式数值计算的更复杂的库。通过将计算分布在数百个GPU(图形处理单元)服务器上，它可以有效地训练和运行大型神经网络。TensorFlow(TF)是由Google创建的，并支持许多大型机器学习应用程序。它于2015年11月开源，2.0版本于2019年11月发布。

Keras

Keras 是高层深度学习API，使训练和运行神经网络变得非常简单。它可以在TensorFlow、Theano或微软Cognitive Toolkit(以前称为CNTK)之上运行。TensorFlow附带了该API自己的实现，称为 tf.keras，支持某些高级TensorFlow功能(例如有效加载数据的能力)。

Jupyter notebook

Jupyter Notebook 是基于网页的用于交互计算的应用程序。其可被应用于全过程计算：开发、文档编写、运行代码和展示结果。

安装和使用参考：https://zhuanlan.zhihu.com/p/33105153

资源

书籍配套资料

在 https://github.com/ageron/handson-ml2 上在线获得的代码示例。
O’Reilly的在线学习平台允许你按需访问现场培训课程、深入的学习路径、交互式编程环境，以及O’Reilly和200多家其他出版商提供的大量文本和视频资源。访问： http://oreilly.com

流行的开放数据存储库

UC Irvine Machine Learning Repository(http://archive.ics.uci.edu/ml/)
Kaggle datasets(https://www.kaggle.com/datasets)
Amazon’s AWS datasets(http://aws.amazon.com/fr/datasets/)

元门户站点(它们会列出开放的数据存储库)

Data Portals(http://dataportals.org/)
OpenDataMonitor(http://opendatamonitor.eu/)
Quandl(http://quandl.com/)

其他一些列出许多流行的开放数据存储库的页面

Wikipedia’s list of Machine Learning datasets(https://goo.gl/SJHN2k)
Quora.com(http://goo.gl/zDR78y)
The datasets subreddit(https://www.reddit.com/r/datasets)

其他

http://kaggle.com/ 的竞赛网站
TensorFlow数据集项目：https://homl.info/tfds

机器学习项目清单

主要有8个步骤

框出问题并看整体。
获取数据。
研究数据以获得深刻见解。
准备数据以便更好地将潜在的数据模式提供给机器学习算法。
探索许多不同的模型，并列出最佳模型。
微调你的模型，并将它们组合成一个很好的解决方案。
演示你的解决方案。
启动、监视和维护你的系统。

框出问题并看整体

用业务术语定义目标。
你的解决方案将如何使用?
当前有什么解决方案/解决方法(如果有)?
你应该如何阐述这个问题(有监督/无监督，在线/离线等)?
应该如何衡量性能?
性能指标是否符合业务目标?
达到业务目标所需的最低性能是多少?
有没有一些相似的问题?你可以重用经验或工具吗?
有没有相关有经验的人?
你会如何手动解决问题?
列出你(或其他人)到目前为止所做的假设。
如果可能，请验证假设。

获取数据

列出所需的数据以及你需要多少数据。
查找并记录可从何处获取该数据。
检查将占用多少空间。
检查法律义务，并在必要时获得授权。
获取访问授权。
创建一个工作空间(具有足够的存储空间)。
获取数据。
将数据转换为可以轻松操作的格式(无须更改数据本身)。
确保敏感信息被删除或受保护(例如匿名)。
检查数据的大小和类型(时间序列、样本、地理等)。
抽样一个测试集，将其放在一边，再也不要看它(无数据监听!)。
注意：尽可能地自动化，以便你可以轻松地获取新数据。

研究数据

创建数据副本来进行研究(必要时将其采样到可以管理的大小)。
创建 Jupyter notebook 以记录你的数据研究。
研究每个属性及其特征:名称、类型(分类、整数/浮点型、有界/无界、文本、结构化等)、缺失值的百分比、噪声和噪声类型(随机、异常值、舍入误差等)、任务的实用性、分布类型(高斯分布、均匀分布、对数分布等)
对于有监督学习任务，请确定目标属性。
可视化数据。
研究属性之间的相关性。
研究如何手动解决问题。
确定你可能希望使用的转变。
确定有用的额外数据。
记录所学的知识。
注意：请尝试从现场专家那里获取有关这些步骤的见解。

准备数据

数据清理：修复或删除异常值(可选)、填写缺失值(例如，零、均值、中位数)或删除其行(或列)。
特征选择(可选)：删除没有为任务提供有用信息的属性。
特征工程(如果适用)：离散化连续特征、分解特征(例如分类、日期/时间等)、添加有希望的特征转换(例如log(x)、sqrt(x)、x2等)、将特征聚合为有希望的新特征。
特征缩放：标准化或归一化特征。
注意：在数据副本上工作(保持原始数据集完整)；为你应用的所有数据转换编写函数（原因有5个：下次获取新的数据集时，你可以轻松准备数据；可以在未来的项目中应用这些转换；清理并准备测试集；解决方案上线后清理并准备新的数据实例；使你可以轻松地将准备选择视为超参数）

列出有前途的模型

使用标准参数训练来自不同类别(例如线性、朴素贝叶斯、SVM、随机森林、神经网络等)的许多快速和粗糙的模型。
衡量并比较其性能。对于每个模型，使用N折交叉验证，在N折上计算性能度量的均值和标准差。
分析每种算法的最重要的变量。
分析模型所犯错误的类型。人类将使用什么数据来避免这些错误?
快速进行特征选择和特征工程。
在前面5个步骤中执行一两个以上的快速迭代。
筛选出前三到五个最有希望的模型，优先选择会产生不同类型错误的模型。
注意：如果数据量巨大，则可能需要采样为较小的训练集，以便可以在合理的时间内训练许多不同的模型(请注意，这会对诸如大型神经网络或随机森林之类的复杂模型造成不利影响)；尽可能自动化地执行这些步骤。

微调系统

使用交叉验证微调超参数：将你的数据转换选择视为超参数，尤其是当你对它们不确定时(例如，如果不确定是否用零或中位数替换缺失值，或者只是删除行)；除非要研究的超参数值很少，否则应优先选择随机搜索而不是网格搜索，如果训练时间很长，你可能更喜欢贝叶斯优化方法(如Jasper Snoek等人所述使用高斯过程先验)。
尝试使用集成方法。组合最好的模型通常会比单独运行有更好的性能。
一旦对最终模型有信心，就可以在测试集中测量其性能，以估计泛化误差。
注意：你将需要在此步骤中使用尽可能多的数据，尤其是在微调结束时；与往常一样，尽可能做到自动化；在测量了泛化误差之后，请不要对模型进行调整，否则你会开始过拟合测试集。

演示你的解决方案

记录你所做的事情。
创建一个不错的演示文稿。确保先突出大的蓝图。
说明你的解决方案为何可以实现业务目标。
别忘了介绍你一路上注意到的有趣观点。描述什么有效，什么无效；列出你的假设和系统的局限性。
确保通过精美的可视化效果或易于记忆的陈述来传达你的主要发现(例如，“中等收入是房价的第一大预测指标”)。

启动

使你的解决方案准备投入生产环境(插入生产数据输入、编写单元测试等)。
编写监控代码，以定期检查系统的实时性能，并在系统故障时触发警报。当心缓慢的退化：随着数据的发展，模型往往会“腐烂”；评估性能可能需要人工流水线(例如通过众包服务)；监视你的输入的质量(例如，传感器出现故障，发送了随机
值，或者另一个团队的输出变得过时)，这对于在线学习系统尤其重要。
定期根据新数据重新训练模型(尽可能自动进行)。

机器学习概览

什么是机器学习

机器学习是一个研究领域，让计算机无须进行明确编程就具备学习能力。（亚瑟·萨缪尔(Arthur Samuel)，1959）

一个计算机程序利用经验E来学习任务T，性能是P，如果针对任务T的性能P随着经验E不断增长，则称为机器学习。（汤姆·米切尔(Tom Mitchell)，1997）

为什么使用机器学习

有解决方案，但解决方案需要进行大量人工微调或需要遵循大量规则；
传统方法难以解决的复杂问题；
环境有波动；
洞察复杂问题和大量数据。

机器学习的应用示例

分析生产线上的产品图像来对产品进行自动分类：这是图像分类问题。
通过脑部扫描发现肿瘤：这是语义分割，图像中的每个像素都需要被分类。
自动分类新闻：这是自然语言处理，更具体地是文本分类。
论坛中自动标记恶评：这也是文本分类，使用自然语言处理工具。
自动对长文章做总结：这是自然语言处理的一个分支，叫作文本总结。
创建一个聊天机器人或者个人助理：这涉及自然语言处理的很多分支，包括自然语言理解和问答模块。
基于很多性能指标来预测公司下一年的收入：这是一个回归问题(如预测值)，需要使用回归模型进行处理。
让应用对语音命令做出反应：这是语音识别，要求能处理音频采样。
检测信用卡欺诈：这是异常检测。
基于客户的购买记录来对客户进行分类，对每一类客户设计不同的市场策略：这是聚类问题。
用清晰而有洞察力的图表来表示复杂的高维数据集：这是数据可视化，经常涉及降维技术。
基于以前的购买记录给客户推荐可能感兴趣的产品：这是推荐系统，一个办法是将以前的购买记录(和客户的其他信息)输入人工神经网络，从而输出客户最可能购买的产品。
为游戏建造智能机器人：这通常通过强化学习来解决。

机器学习系统的类型

有监督学习：k-近邻算法、线性回归、逻辑回归、支持向量机(SVM)、决策树和随机森林、神经网络。
无监督学习：聚类算法、k-均值算法、DBSCAN、分层聚类分析(HCA)、异常检测和新颖性检测、单类SVM、孤立森林、可视化和降维、主成分分析(PCA)、核主成分分析、局部线性嵌入(LLE)、t-分布随机近邻嵌入(t-SNE)、关联规则学习、Apriori、Eclat。
半监督学习
强化学习
批量学习和在线学习
基于实例的学习与基于模型的学习

机器学习的主要挑战

训练数据的数量不足
训练数据不具代表性
低质量数据
无关特征
过拟合训练数据
欠拟合训练数据

测试与验证

超参数调整和模型选择
数据不匹配

端到端的机器学习项目

观察大局

框架问题
选择性能指标
检查假设

获取数据

创建工作区
下载数据
快速查看数据结构
创建测试集

从数据探索和可视化中获得洞见

将数据可视化
寻找相关性
试验不同属性的组合

机器学习算法的数据准备

数据清理
处理文本和分类属性
自定义转换器
特征缩放
转换流水线

选择和训练模型

训练和评估训练集
使用交叉验证来更好地进行评估

微调模型

网格搜索
随机搜索
集成方法
分析最佳模型及其误差
通过测试集评估系统

启动、监控和维护你的系统

训练模型

线性回归

标准方程
计算复杂度

梯度下降

批量梯度下降
随机梯度下降
小批量梯度下降

多项式回归

学习曲线

正则化线性模型

岭回归
Lasso回归
弹性网络
提前停止

逻辑回归

估计概率
训练和成本函数
决策边界
Softmax回归

支持向量机

线性SVM分类

非线性SVM分类

多项式内核
相似特征
高斯RBF内核
计算复杂度

SVM回归

工作原理

决策函数和预测
训练目标
二次规划
对偶问题
内核化SVM
在线SVM

决策树

训练和可视化决策树

做出预测

估计类概率

CART训练算法

计算复杂度

基尼不纯度或熵

正则化超参数

回归

不稳定性

集成学习和随机森林

投票分类器

bagging和pasting

Scikit-Learn中的bagging和pasting
包外评估

随机补丁和随机子空间

随机森林

极端随机树
特征重要性

提升法

AdaBoost
梯度提升

堆叠法

降维

维度的诅咒

降维的主要方法

投影
流形学习

主成分分析 PCA

保留差异性
主要成分
向下投影到d维度
使用Scikit-Learn
可解释方差比
选择正确的维度
PCA压缩
随机PCA
增量PCA

内核PCA

选择内核并调整超参数

局部线性嵌入 LLE

其他降维技术

随机投影
多维缩放(MDS)
Isomap
t分布随机近邻嵌入(t-SNE)
线性判别分析(LDA)

无监督学习技术

聚类

K-Means
中心点初始化方法
加速的K-Means和小批量K-Means
寻找最佳聚类数
K-Means的局限
使用聚类进行图像分割
使用聚类进行预处理
使用聚类进行半监督学习
其他聚类算法：聚集聚类、BIRCH、均值漂移、相似性传播、谱聚类

高斯混合模型

使用高斯混合进行异常检测
选择聚类数
贝叶斯高斯混合模型
其他用于异常检测和新颖性检测的算法：Scikit-Learn、PCA、Fast-MCD、隔离森林、局部离群因子 LOF、单类SVM。

Keras人工神经网络简介

从生物神经元到人工神经元

生物神经元
神经元的逻辑计算
感知器
多层感知器和反向传播
回归MLP
分类MLP

使用Keras实现MLP

安装TensorFlow 2
使用顺序API构建图像分类器：使用Keras加载数据集、使用顺序API创建模型、编译模型、训练和评估模型、使用模型进行预测
使用顺序API构建回归MLP
使用函数式API构建复杂模型
使用子类API构建动态模型
保存和还原模型
使用回调函数
使用TensorBoard进行可视化

微调神经网络超参数

隐藏层数量
每个隐藏层的神经元数量
学习率、批量大小和其他超参数：学习率、优化器、批量大小、激活函数、迭代次数

训练深度神经网络

梯度消失与梯度爆炸问题

Glorot和He初始化
非饱和激活函数
批量归一化
梯度裁剪

重用预训练层

用Keras进行迁移学习
无监督预训练
辅助任务的预训练

更快的优化器

动量优化
Nesterov加速梯度
AdaGrad
RMSProp
Adam和Nadam优化
学习率调度

通过正则化避免过拟合

l1和l2正则化
dropout
蒙特卡罗(MC)Dropout
最大范数正则化

总结和实用指南

默认的DNN配置

用于自归一化网络的DNN配置

使用TensorFlow自定义模型和训练

TensorFlow快速浏览

像NumPy一样使用TensorFlow

张量和操作
张量和NumPy
类型转换
变量
其他数据结构：稀疏张量、张量数组、不规则张量、字符串张量、集合、队列

定制模型和训练算法

自定义损失函数
保存和加载包含自定义组件的模型
自定义激活函数、初始化、正则化和约束
自定义指标
自定义层
自定义模型
基于模型内部的损失和指标
使用自动微分计算梯度
自定义训练循环

TensorFlow函数和图

自动图和跟踪
TF函数规则

使用TensorFlow加载和预处理数据

数据API

链式转换
乱序数据
预处理数据
合并在一起
预取
和tf.keras一起使用数据集

TFRecord格式

压缩的TFRecord文件
协议缓冲区简介
TensorFlow协议
加载和解析Example
使用SequenceExample Protobuf处理列表的列表

预处理输入特征

使用独热向量编码分类特征
使用嵌入编码分类特征
Keras预处理层

TF Transform

使用卷积神经网络的深度计算机视觉

视觉皮层的架构

卷积层

滤波器
堆叠多个特征图
TensorFlow实现
内存需求

池化层

CNN架构

LeNet-5
AlexNet
GoogLeNet
VGGNet
ResNet
Xception
SENet

使用Keras实现ResNet-34 CNN

使用Keras的预训练模型

迁移学习的预训练模型

分类和定位

物体检测

全卷积网络1
YOLO

语义分割

使用RNN和CNN处理序列

循环神经元和层

训练RNN

预测时间序列

基准指标
实现一个简单的RNN
深度RNN
预测未来几个时间步长

处理长序列

应对不稳定梯度问题
解决短期记忆问题

使用RNN和注意力机制进行自然语言处理

使用字符RNN生成莎士比亚文本

创建训练数据集
如何拆分顺序数据集
将顺序数据集切成多个窗口
创建和训练Char-RNN模型
使用Char-RNN模型
生成假莎士比亚文本
有状态RNN

情感分析

掩码屏蔽
重用预训练的嵌入

神经机器翻译的编码器-解码器网络

双向RNN
集束搜索

注意力机制

视觉注意力
Transformer架构：位置嵌入、多头注意力

最近语言模型的创新

使用自动编码器和GAN的表征学习和生成学习

有效的数据表征

使用不完整的线性自动编码器执行PCA

堆叠式自动编码器

使用Keras实现堆叠式自动编码器
可视化重构
可视化数据集
使用堆叠式自动编码器的无监督预训练
绑定权重
一次训练一个自动编码器

卷积自动编码器

循环自动编码器

去噪自动编码器

稀疏自动编码器

变分自动编码器

生成式对抗网络

GAN的训练难点
深度卷积GAN
GAN的逐步增长
StyleGAN

强化学习

学习优化奖励

策略搜索

OpenAI Gym介绍

神经网络策略

评估动作:信用分配问题

策略梯度

马尔可夫决策过程

时序差分学习

Q学习

探索策略
近似Q学习和深度Q学习

实现深度Q学习

深度Q学习的变体

固定的Q值目标
双DQN
优先经验重播
竞争DQN

TF-Agents库

安装TF-Agents
TF-Agents环境
环境规范
环境包装器和Atari预处理
训练架构
创建深度Q网络
创建DQN智能体
创建重播缓冲区和相应的观察者
创建训练指标
创建收集驱动者
创建数据集
创建训练循环

一些流行的RL算法概述

Actor-Critic算法
Asynchronous Advantage Actor-Critic(A3C)
Advantage Actor-Critic(A2C)
Soft Actor-Critic(SAC)
Proximal Policy Optimization(PPO)
Curiosity-based exploration

大规模训练和部署TensorFlow模型

为TensorFlow模型提供服务

使用TensorFlow Serving
在GCP AI平台上创建预测服务
使用预测服务

将模型部署到移动端或嵌入式设备

使用GPU加速计算

拥有你自己的GPU
使用配备GPU的虚拟机
Colaboratory
管理GPU内存
在设备上放置操作和变量
跨多个设备并行执行

跨多个设备的训练模型

模型并行
数据并行
使用分布式策略API进行大规模训练
在TensorFlow集群上训练模型
在Google Cloud AI平台上运行大型训练作业
AI平台上的黑箱超参数调整

【Unity 监狱内部环境资产包】Jails Interior 提供了完整的监狱内部结构，包括牢房、走廊、审讯室、看守室等，并配备了大量高质量的家具、铁栏、门窗和其他装饰，快速搭建沉浸式的监狱场景 Unity游戏资源学习屋 Unity插件
JailsInterior是一款专为Unity设计的监狱内部环境资产包，适用于犯罪题材、恐怖游戏、警察模拟、逃脱解谜等类型的游戏。该插件提供了完整的监狱内部结构，包括牢房、走廊、审讯室、看守室等，并配备了大量高质量的家具、铁栏、门窗和其他装饰，帮助开发者快速搭建沉浸式的监狱场景。详细介绍1.逼真的监狱内部环境提供完整的监狱场景，包括牢房、走廊、审讯室、警卫室等，能够用于各类犯罪、逃脱、警察题材的游
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
接入DeepSeek后，智慧园区安全调度系统的全面提升 Guheyunyi 安全数据分析 python 智慧城市人工智能信息可视化
随着人工智能技术的快速发展，智慧园区的安全管理正逐步向智能化、自动化方向迈进。DeepSeek作为先进的人工智能解决方案，为智慧园区安全调度系统注入了强大的技术动力。通过接入DeepSeek，智慧园区安全调度系统在多个方面实现了显著提升，进一步增强了园区的安全性、管理效率和用户体验。1.智能化监控：从被动到主动传统的监控系统主要依赖人工查看视频画面，容易出现漏检或误判。接入DeepSeek后，智慧
（九万字）面向2025年BOSS直聘人工智能算法工程师高频面试题解析快撑死的鱼人工智能回归 python pytorch
面向2025年BOSS直聘人工智能算法工程师高频面试题解析1.机器学习（ML）理论解析机器学习是让计算机从数据中学习规律的一套方法论，包含监督学习、无监督学习和强化学习等范式。在监督学习中，给定带标签的数据，算法尝试学习从输入到输出的映射关系；无监督学习则在缺乏标签的情况下挖掘数据内在结构；强化学习则让智能体通过与环境交互、依据奖赏反馈来改进策略(Q-learning-Wikipedia)。机器学
人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）基尼系数基于熵机器学习入门
在决策树应用一文中，在构建决策分类树应用决策算法时，介绍了基尼系数（GiniIndex）和基于熵（Entropy）两种算法。本文通过实例来更加深入的介绍一下这两个算法。仍然以简单的数据为例：id喜欢颜色是否有喉结身高性别1绿否165女2蓝是170男3粉否172女4绿是175男基尼系数分别对喜欢颜色是否有喉结求基尼系数如下：喜欢的颜色id喜欢颜色性别1绿女2蓝男3粉女4绿男对于姓别女分类而言，数据如
生产企业使用系统大全十五001 其他笔记经验分享其他
作为一般企业员工可能只负责或对其中部分系统比较熟悉，其实如果是一个生产型企业完整的系统大全应该包含以下这些，但由于系统之间可能存在的边界模糊，会把其他系统的功能给进行合并，但不影响我们了解成熟系统所对应的职责，以下就是十大系统的功能：图来源于：白话聊IT一、MES（制造执行系统）核心作用：宛如一座桥梁，衔接企业的计划层（由ERP系统代表）与工厂的实际控制系统，专注于对工厂生产现场进行实时、精准的管
【人工智能时代】- AI 聚合平台 xiaoli8748_软件开发人工智能时代人工智能
最近听朋友介绍，国内有个团队开发了一个全功能的AI聚合平台，包含主流的GPT和绘画功能，以及一些其他的衍生功能，几乎应有尽有。于是，对AI很感兴趣的我，便也来瞧瞧这是个什么样的存在，以下便是我的真实使用感受。除此以外，作为一个程序员，我还使用了该平台提供的API接口，开发了一个简单的小程序。文章的末尾，我将提供免费的AI机器人，以及小程序体验地址，记得查收哦~官方网站：https://302.ai
在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南机＿长 YOLO系列模型有效涨点改进深度学习落地实战 YOLO c++开发语言
在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
YOLOv8 Pose使用RKNN进行推理い不靠譜︶朱Sir 实用项目部署 YOLO 人工智能 python linux pip
关注微信公众号：朱sir的小站，发送202411081即可免费获取源代码下载链接一、简单介绍YOLOv8-Pose是一种基于YOLOv8架构的姿态估计模型，能够识别图像中的关键点位置，这些关键点通常表示人体的关节、特征点或其他显著位置。该模型在COCO关键点数据集上训练，适合多种姿势估计任务。二、ONNX推理1.首先需要先将Pytorch模型转换为Onnx模型，下载pt模型这里给出官方的权重下载地
4070与3070ti显卡性能对比：哪款更适合您的需求？ mmoo_python windows
4070与3070ti显卡性能对比：哪款更适合您的需求？在高性能显卡市场中，4070和3070ti无疑是两款备受瞩目的产品。它们专为那些对游戏或其他图形密集型任务有高要求的用户而设计，提供了卓越的性能和体验。然而，尽管这两款显卡都拥有强大的性能，但它们在某些方面仍有所不同。本文将详细对比4070和3070ti显卡，以帮助您根据自己的需求做出明智的选择。一、性能对比：3070ti略胜一筹首先，我们来
linux网络安全网络安全Max linux web安全运维
Linux网络安全一直是IT行业中备受关注的话题，而红帽作为Linux操作系统的知名发行版，在网络安全领域也扮演着重要的角色。红帽公司一直致力于为用户提供安全可靠的Linux解决方案，以帮助用户建立强大的网络安全防护体系。首先，红帽操作系统本身具有较高的安全性。作为一款开源操作系统，Linux具有代码透明、强大的权限管理和丰富的安全功能等特点，这使得Linux相对于其他闭源操作系统更加安全可靠。而
B4158 [BCSP-X 2024 小学高年级组] 质数补全 wwjjjww 算法数据结构
题目描述Alice在纸条上写了一个质数，第二天再看时发现有些地方污损看不清了。在大于1的自然数中，除了1和它本身以外不再有其他因数的自然数称为质数请你帮助Alice补全这个质数，若有多解输出数值最小的，若无解输出−1。例如纸条上的数字为1∗（∗代表看不清的地方），那么这个质数有可能为11,13,17,19，其中最小的为11。输入格式第一行1个整数t，代表有t组数据。接下来t行，每行1个字符串s代表
如何将Docker容器打包并在其他服务器上运行 IT小辉同学技巧性工具栏分布式云部署搜索引擎 docker 服务器容器
如何将Docker容器打包并在其他服务器上运行我会幻想很多次我们的相遇，你穿着合身的T恤，一个素色的外套，搭配一条蓝色的牛仔裤，干净的像那天空中的云朵，而我，还是一个的傻傻的少年，我们相识而笑，默默不语，如此甚好！Docker容器使得应用程序的部署和管理变得更加简单和高效。有时，我们可能需要将一个运行中的Docker容器打包，并在其他服务器上运行。本文将详细介绍如何实现这一过程。1.提交容器为镜像
鸢尾花分类项目 GUI 编织幻境的妖分类数据挖掘人工智能
1.机器学习的定义机器学习是一门人工智能的分支，专注于开发算法和统计模型，使计算机能够在没有明确编程的情况下从数据中自动学习和改进。通过识别数据中的模式和规律，机器学习系统可以做出预测或决策。常见的应用包括图像识别、语音识别、推荐系统等。2.为什么使用鸢尾花数据集（Irisdataset）鸢尾花数据集是一个经典的多类分类问题数据集，由英国统计学家和遗传学家RonaldFisher在1936年引入。
关于防火墙运维面试题编织幻境的妖运维 php 网络
一、防火墙基础概念类1.请详细阐述防火墙在网络安全体系中的具体作用及核心原理。以下是防火墙在网络安全体系中的具体作用及核心原理的详细阐述：防火墙在网络安全体系中的作用访问控制限制非法访问：防火墙可以根据预设的规则，允许或拒绝特定的网络流量通过。例如，企业内部网络可能只允许来自特定IP地址范围的员工访问敏感资源，而阻止其他未经授权的外部IP地址的访问，从而保护内部网络免受未经授权的访问和潜在的攻击。
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
《神经网络与深度学习》(邱锡鹏) 内容概要【不含数学推导】 code_stream #机器学习神经网络
第1章绪论基本概念：介绍了人工智能的发展历程及不同阶段的特点，如符号主义、连接主义、行为主义等。还阐述了深度学习在人工智能领域的重要地位和发展现状，以及其在图像、语音、自然语言处理等多个领域的成功应用。术语解释人工智能：旨在让机器模拟人类智能的技术和科学。深度学习：一种基于对数据进行表征学习的方法，通过构建具有很多层的神经网络模型，自动从大量数据中学习复杂的模式和特征。第2章机器学习概述基本概念：
图像识别与应用狂踹瘸子那条好脚 python
图像识别作为人工智能领域的重要分支，近年来取得了显著进展，其中卷积神经网络（CNN）功不可没。CNN凭借其强大的特征提取能力，在图像分类、目标检测、人脸识别等任务中表现出色，成为图像识别领域的核心技术。一、卷积神经网络：图像识别的利器CNN是一种专门处理网格状数据的深度学习模型，其结构设计灵感来源于生物视觉系统。与全连接神经网络不同，CNN通过卷积层、池化层等结构，能够有效提取图像的局部特征，并逐
使用 Docker 基本命令创建并发布带有新功能的镜像到阿里云 2021级计算机网络技术2班梁嘉敏 docker 阿里云容器
1.关于Docker镜像1.基础假定您在开发一个网上商城，您使用的是一台笔记本电脑而且您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。此外，您的企业还拥有标准化的测试和生产环境，且具有自身的配置和一系列支持文件。您希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销。请问？您要如何确保应用能够在这些环境中运行和
YashanDB其他模式对象数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...视图用户可以将一个使用频率较高的查询语句定义为一个持久化的对象，该持久化对象称为视图，为视图提供原始数据的表称为基表。通过查询视图代替原来的查询表，可简化SQL语句编写。假设公司EMPLOYEE表包含所有员工个人信息，DEPA
知识图谱构建概念、工具、实例调研熟悉的黑曼巴知识图谱人工智能
一、知识图谱的概念知识图谱（Knowledgegraph）知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成。节点可以是实体，如一个人、一本书等，或是抽象的概念，如人工智能、知识图谱等。边可以是实体的属性，如姓名、书名或是实体之间的关系，如朋友、配偶。知识图谱的早期理念来自SemanticWeb（语义网络），其最初理想是把基于文本链接的万维网落转化为基于
应用内自动续订商品，畅享无缝服务体验 harmonyos-next
用户购买某种产品时习惯一次性付款，但是对开发者而言，单次购买模式或需要用户频繁续订的服务可能会导致收入不稳定，无法获得持续稳定的收入。对于有视频、音乐等会员需求的用户，一旦体验到服务中断或需要频繁操作，可能会转向其他竞争产品，导致用户流失。HarmonyOSSDK应用内支付服务（IAPKit）为开发者提供应用内自动续期订阅商品能力，用户购买后在一段时间内允许访问增值功能或内容，周期结束后可以选择自
【deepseek与chatGPT辩论】辩论题： “人工智能是否应当具备自主决策能力？” 海宁不掉头发软件工程人工智能人工智能 chatgpt deepseek
探讨辩论题这个提案涉及创建一个精确的辩论题目，旨在测试deepseek的应答能力。创建辩论题目提议设计一个辩论题目以测试deepseek的应答能力。希望这个题目具有挑战性并能够测量其回应质量。好的，来一道适合深度学习的辩论题：辩论题：“人工智能是否应当具备自主决策能力？”这个话题涉及到人工智能的发展、伦理以及未来应用，可以从以下几个方面展开辩论：支持方：认为人工智能的自主决策能力能够加速科技进步，
【后端java】构建工具maven 骑鱼过海的猫123 java maven python
文章目录1导入本地jar包到maven仓库1导入本地jar包到maven仓库mvninstall:install-file-Dfile=-DgroupId=-DartifactId=-Dversion=-Dpackaging=是你的jar文件的路径。是你的项目的组ID。是你的项目的ArtifactID。是你的jar包的版本号通常是jar，除非你的文件是其他类型的包，如pom。mvninstall:
全面解析 Enterprise Architect（EA）活动图的工具集：从元素到关系的详尽指南泡沫o0 C/C++编程世界:探索C/C++的奥妙 c++20 开发语言 c++嵌入式 qt uml arm
目录标题第一章:引言——理解活动图的重要性1.1什么是活动图？1.1.1活动图的组成元素1.1.2活动图的应用场景1.2为什么选择EA作为建模工具？1.2.1EA的强大功能1.2.2EA与其他建模工具的对比第二章:活动图中的核心元素2.1活动类元素2.1.1Activity（活动）示例：2.1.2Action（动作）示例：2.1.3Partition（泳道）示例：2.1.4Send（发送）与Rec
#渗透测试#批量漏洞挖掘#畅捷通T+远程命令执行漏洞独行soc 漏洞挖掘安全 web安全面试漏洞挖掘远程命令执行漏洞
免责声明本教程仅为合法的教学目的而准备，严禁用于任何形式的违法犯罪活动及其他商业行为，在使用本教程前，您应确保该行为符合当地的法律法规，继续阅读即表示您需自行承担所有操作的后果，如有异议，请立即停止本文章读。目录一、漏洞概况二、攻击特征三、应急处置方案四、深度防御建议五、后续监测要点六、漏洞POC一、漏洞概况技术原理漏洞存在于T+系统的特定接口组件，攻击者可通过构造恶意HTTP请求绕过身份验证，在
Node.js 中的 Event 模块详解小灰灰学编程 Node.js node.js 前端
Node.js中的Event模块是实现事件驱动编程的核心模块。它基于观察者模式，允许对象（称为“事件发射器”）发布事件，而其他对象（称为“事件监听器”）可以订阅并响应这些事件。这种模式非常适合处理异步操作和事件驱动的场景。1.概念1.1事件驱动编程事件驱动编程是一种编程范式，程序的执行流程由事件（如用户输入、文件读取完成、网络请求响应等）决定。Node.js的核心设计理念就是基于事件驱动的非阻塞I
[附源码]计算机毕业设计基于SpringBoot的小说阅读系统计算机毕设程序设计 spring boot java 后端
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
基于 Spring Boot 的社区居民健康管理系统部署说明书小星袁毕业设计原文 spring boot 后端 java
目录1系统概述2准备资料3系统安装与部署3.1数据库部署3.1.1MySQL的部署3.1.2Navicat的部署3.2服务器部署3.3客户端部署4系统配置与优化5其他基于SpringBoot的社区居民健康管理系统部署说明书1系统概述本系统主要运用了SpringBoot框架，前端页面的设计主要依托Vue框架来构建，实现丰富且交互性强的用户界面，后台管理功能则采用SpringBoot框架与MySQL数
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow（第2版）》学习笔记

文章目录

书籍信息

技术和工具

Scikit-Learn

TensorFlow

Keras

Jupyter notebook

资源

书籍配套资料

流行的开放数据存储库

元门户站点(它们会列出开放的数据存储库)

其他一些列出许多流行的开放数据存储库的页面

其他

机器学习项目清单

主要有8个步骤

框出问题并看整体

获取数据

研究数据

准备数据

列出有前途的模型

微调系统

演示你的解决方案

启动

机器学习概览

什么是机器学习

为什么使用机器学习

机器学习的应用示例

机器学习系统的类型

机器学习的主要挑战

测试与验证

端到端的机器学习项目

观察大局

获取数据

从数据探索和可视化中获得洞见

机器学习算法的数据准备

选择和训练模型

微调模型

启动、监控和维护你的系统

分类

训练二元分类器

性能测量

多类分类器

误差分析

多标签分类

多输出分类

训练模型

线性回归

梯度下降

多项式回归

学习曲线

正则化线性模型

逻辑回归

支持向量机

线性SVM分类

非线性SVM分类

SVM回归

工作原理

决策树

训练和可视化决策树

做出预测

估计类概率

CART训练算法

计算复杂度

基尼不纯度或熵

正则化超参数

回归

不稳定性

集成学习和随机森林

投票分类器

bagging和pasting

随机补丁和随机子空间

随机森林

提升法

堆叠法

降维

维度的诅咒

降维的主要方法

主成分分析 PCA

内核PCA

使用自动编码器和GAN的表征学习和生成学习