HS_Henry

人工智能学习笔记

1 扫盲阶段

2. 数学基础知识

3. 机器学习基础知识

4. 回归

4.1. 观察数据

4.2. 拆分数据集

4.3. 特征表示法

4.4. 特征组合

4.5. 损失

4.6. 拟合程度

4.7. 正则化

4.8. 逻辑回归

5. 分类

6. 神经网络

初探人工智能知识，初步认识数据处理、分类、回归。

1 扫盲阶段

1.1 四类人员

从角色维度分为四类人员

了解者：大致了解理论，对结果具有判断能力。
开发者：了解理论，根据业务场景选择合适算法，进行机器学习方面的业务开发。
实现者：精通理论，实现具体机器学习算法。
理论提供者：提出机器学习算法理论。

1.2 人工智能分类

数据挖掘：对海量数据进行分析，最终得到一个数据分析的静态结果，通过图表进行体现。
机器学习：基于(海量)数据的训练，最终获得一个方程式。后续将新数据应用于方程式，得出一个预测结果。

1.3 海量数据作为基础

1.4 要素

模型	表示机器学习系统用于进行预测的数据元素之间的数学关系，特征与标签之间的数学关系。
策略	选择模型的依据，评估模型效果的依据，从而得到最优的业务函数.
算法	训练过程中用到的算法，如梯度下降

1.5 有监督学习

使用已知正确答案的训练样本进行学习，发现数据模型，称为有监督学习。如分类、回归。

1.6 无监督学习

通过不包含任何正确答案的数据来进行预测。识别数据中有意义的模式。聚类技术是一种常用技术，划分自然分组的数据点。

2. 数学基础知识

使用数据矩阵(数据块)表现需要分析的数据。通过数据摘要、数据可视化清晰的表示数据。

2.1. 基础概念：

标量	单独一个数字，看作只有一个元素的一维数组。
向量	具有一个下标的数组，一维数组。把向量看作空间中的点，每个元素代表不同坐标轴上的坐标。
矩阵	二维数组，两个索引确定一个元素。
张量	超过两维的多维数组。

2.2. 数值摘要、数据降维

涉及的数学概念

计算平均的方式

均数mean	sum(数据列)/数据列中记录个数
众数mode	数据列中出现最多的数据
中位数median	数据列排序后，处于中间位置的数据；偶数个数据时，取中间两数据的均值
分位数	数据列正序排序后，长度＊(M/N)位置的数据。

评估数据点的离散程度

方差 deviation
标准差 standard deviation	方差的平方根
	表示离散程度的数字与样本数据点的数量级一致，更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例，其方差约为41，而标准差则为6.4；两者相比较，标准差更适合人理解。
	表示离散程度的数字单位与样本数据的单位一致，更方便做后续的分析运算。
	在样本数据大致符合正态分布的情况下，标准差具有方便估算的特性：66.7%的数据点落在平均值前后1个标准差的范围内、95%的数据点落在平均值前后2个标准差的范围内，而99%的数据点将会落在平均值前后3个标准差的范围内。
贝赛尔修正	方差和标准差，仅表示运算使用的数据集的离散程度；若想获取数据样本所对应的研究对象的离散程度，需要进行贝赛尔修正。

数值摘要

把数据表中的所有行(列)精简为几个数字
将数据表中几列摘要为一个数字，表示几列间的相关性

数据降维

将数据中很多列变为多列甚至一列，得到的列数据对于每行原数据都是唯一的。就是对每行就行数值摘要，构成新的数据表。

使用每一行数据的哪些属性来做降维呢？

最小值
第一个四分位数
中位数
均值
第三个四分位数
最大值
标准差

摘要统计

所有数据在某一列(某一属性)上的特点

2.3. 对数

指数的逆运算。自然对数，以e(近似2.718)为底数，符号为ln。常用对数，以10为底数，符号为log。

用途：

当数据非常大时，使用对数进行缩小；
当数非常小时，使用(对数＋仿射变换)进行放大。例如计算权重。

3. 机器学习基础知识

3.1. 主要的术语

标签	预测的内容，即简单线性回归的y变量。例如未来小麦的价格、图片中动物类型、音频的含义等。
特征	对标签具有预测能力的数据。输入的x变量，也可称为功能。一个机器学习项目中特征数量可多可少，可能数百万个，如x1、x2、....、xn。
样本	有标签样本：同时包含特征和标签的样本，用来训练模型。无标签样本：只包含特征，不包含标签的样本，使用训练后的模型预测该样本的标签。
数据集	由许多样本组成。数据集的大小指样本的数量，多样性指样本的范围，良好的数据集既庞大且多样化。
模型	定义特征和模型之间的关系。表示机器学习系统用于进行预测的数据元素之间的数学关系。模型生命周期的两个阶段训练是指创建或学习模型。通过有标签样本，让模型学习特征和标签之间的关系。推断是指将训练的模型应用于无标签样本，预测标签。
回归	回归模型可预测连续值。如房子的价格、点击广告的可能性
分类	分类模型可预测离散值。如垃圾邮件、图片中动物种类

3.2. 分析的数据，使用数据矩阵(数据块)表现。

4. 回归

用已知数据集合去预测另一个数据集合，输出是纯粹的数字，数字不代表任何含义。例如：以过去每天的温度预测明天的温度。

4.1. 观察数据

用回归模型关联数值型数据前，先绘制散点图，这样能清晰判断回归模型的线性假设是否成立。

散点图	用两组数据构成多个坐标点，观察坐标点的分布，判断两个变量之间的某种关联或总结坐标点的分布模式。
散点图矩阵	可同时展示每两个特征之间的关系
三维散点图

4.2. 拆分数据集

训练集	用于训练模型
验证集	用于验证训练出的多个模型并选择出效果好的模型，降低了过拟合的几率。
测试集	用于检测模型。

由图示直观展示不同数据集的作用：

4.3. 特征表示法

4.3.1. 特征工程

特征工程

代表的是一个过程，将原始数据转换为特征的实数向量，以便特征值乘以模型权重。

映射数值

原始数据是数字的，可能不需要特殊处理。

映射分类值

分类值维护一个词汇表，词汇表元素数量为矢量长度，index成对应关系。所以映射分类值得到一个二元向量：匹配到词汇，其对应向量的index元素设置为1；其他元素设置为0.

当单个值为1称为独热编码，多个值为1称为多热编码。有效为每个分类特征值创建布尔值变量，例如词汇A的二元值为1，则使用词汇A的权重。

当词汇矢量很长时，每次只有1或2个index为1，则效率低下。稀疏表示法，只存储非0值。[index]

4.3.2. 数据整理

为什么需要数据整理？

强制实现数据兼容性的转换，将非数值的特征转换为数值，将输入数据大小调整为固定大小。
有助于模型表现更好，文本功能的次元话，标准化的数值特征。

哪里进行数据整理？训练前转换、模型中转换。

如何转换数值数据？例如规范化和分桶。

规范化的意义：

将特征转换为相似的大小，提高性能、训练稳定性、收敛速度。强烈建议对涵盖范围的数字特征(年龄、薪资、人口)进行归一化。

规范化的方式：

扩展到某个范围	从其自然范围转换为标准范围。例如数据满足条件：大致知道上下限、数据在范围内大致均匀分布。例如适用于年龄；而薪资不适用，因为不是均匀分布。
剪辑	设置最大值或最小值以避免离散值，例如高于40度的温度都裁剪为40度。
对数缩放	少数值具有很多点，大多数值有很少点时。
z-score	公式 (x- u平均值)/标准差不确定离散数据是否极端时，可以先采用该方式进行规范化。

分桶，将(连续)数据转换为分类数据，需要明确如何设置边界以及要运用的分桶方式。

方式1：边界相等的区块，边界固定且包含相同的范围，如0-4，5-9，一些桶包含很多点，有些桶包含很少点。

方式2：具有分位数边界的分桶，每个分桶的点数相同，边界不固定，可以包含窄范围或宽范围的值。

如何转换分类数据？

词汇表

OOV词外匹配

将某些离散值归入名为OOV的综合分类，不用浪费时间处理某种离散数值。

哈希

特征词汇表随着时间产生较大变化时，哈希有优势，但是存在冲突。

4.4. 特征组合

对与非线性问题，可以创建一个特征组合。特征组合指的是将两个或多个输入的特征相乘，对特征空间中的非线性特征进行编码后得到的合成特征。例如特征组合x3=x1*x2，产生一个线性公式y=b+w1*x1+w2*x2+w3*x3。

特征组合是一种学习高度复杂模型的高效策略。

4.5. 损失

损失，用于衡量模型预测结果的质量，判断预测的准确性。在训练过程和测试过程都会产生损失。

线性回归的损失函数是平方损失。	平方误差。预测结果Y，实际结果h，平方误差(y-h)^2 均方误差MSE，平方误差的均值均方根误差RMSE，对均方误差开平方 R^2，模型的RMSE与仅使用均值作为预测结果的RMSE的比值，介于0-1之间，通常会＊100.
逻辑回归的损失函数是对数损失。

如何降低损失？

使用迭代法降低损失，迭代步骤如下：

模型中的变量设置初始值，例如模型y=b+wx,设置变量的初始值b=0,w=0.
输入特征样本，并根据损失函数计算损失
根据损失计算出新的变量值(例如b=0.1,w=0.05)，并应用在模型中
重复2、3步骤，直到损失停止变化或变化非常缓慢，即模型收敛。

迭代过程的图示：

这里要着重描述下一个算法思想：梯度下降算法。

变量与损失之间的关系成碗形。通过一个点的梯度乘以学习速率(步长，超参数)确定下一个点，重复这个步骤，逐渐找到接近最小值的点。例如梯度是2.5，学习速率为0.01，则找距离上一个点0.025的下一个点。

学习速率过小，学习时间很长；学习速率过大，下一点永远在左右弹跳，无法收敛。金发姑娘学习速率与损失函数的平坦程度有关，可以较快的收敛。

4.6. 拟合程度

拟合过程就是模型的训练过程。拟合程度有两种极端情况，分别为过拟合和欠拟合。

过拟合	过于拟合训练数据，训练误差小，但测试误差大，泛化能力很差。训练集准确性很高，但是无法很好的泛化到测试集。
欠拟合	模型过于简单，无法拟合训练数据

为了避免过拟合和欠拟合，可以采用交叉验证和正则化等措施。

交叉验证，即上述的验证集的作用。

正则化，指的是在拟合效果与模型复杂度之间进行权衡的过程，最终需要在“模型复杂度简单但拟合效果不够好的模型”与“模型复杂度高但拟合效果很好的模型”间进行选择。有助于使用复杂的模型描述数据中隐藏的复杂模式，又不至于过拟合。

影响拟合程度的因素

模型是否够强大
正则化
训练时长
数据集是否全面

得到合适拟合程度的方式

正则化(L1、L2)
早停法
随机丢弃法

4.7. 正则化

通过调整并降低复杂模型的复杂度来防止过拟合，这种原则称为正则化。

损失项，衡量模型与数据的拟合度。正则项，衡量模型的复杂度。

正则化的效果为：最小化(损失项+正则项) 。

如何衡量模型复杂度呢？

方式1：模型中所有特征的权重的函数，如L2正则化。所有特征权重的平方的和。w1平方+w2平方+wn平方。绝对值高的特征权重对绝对值低的特征权重复杂。

方式2：具有非零权重的特征总数的函数，如稀疏正则化L1。

当特征维度巨大时，最好可以将部分特征将为0，这样就可以删除这些特征。

L2正则化只能让权重接近0，无法减少特征的数量.

L1正则化可以让模型中很多特征(信息缺乏的特征，也可能是信息丰富的特征)的权重为0，从而减少特征数量，降低了模型大小.

L2降低权重的平方，L1降低|权重|；L2的导数为2*权重，L2的倒数为常数k。L2导数的作用理解为每次移除权重的x%，权重只会接近0；L1导数的作用理解为每次权重减去一个常量，如果减法使权重从 +0.1 变为 -0.2，L1 便会将权重正好设置为 0。

4.8. 逻辑回归

逻辑回归是一种概率计算机制，将概率作为输出。

输出的使用方式

原样使用，例如预测狗在夜晚叫的概率，逻辑回归模型输出为0.05，则一年内叫的天数为0.05*365.
将输出映射为二元分类

逻辑回归如何确保输出值肯定在0-1之间？使用S型函数处理。

举例逻辑回归推断计算

逻辑回归的损失函数是对数损失。

可能选用的正则化方式

L2
早停法，限制训练步数或学习速率，例如某种衡量指标达到某值时，停止迭代。

5. 分类

为了将逻辑回归的输出映射为二元类别，必须人为定义分类阈值、决策阈值。

对于两个类别的预测结果，人为决定阈值右侧正分类，阈值左侧为负分类。

假设二元分类为良性和恶性，认为决定良性作为负分类N，恶性作为正分类P。

预测良性，实际良性，称为真负值例。TN
预测良性，实际恶性，称为假负例。FN
预测恶性，实际恶性，称为真正例。TP
预测恶性，实际良性，称为假正例。FP

衡量标准：准确率、精准率、召回率。

准确率是指模型做出的正确预测所占的比例，(TN+TP)/(TN+TP+FN+FP)。

一个疑问：准确率0.91，代表分类效果好吗？

对于类别不平衡的数据集，即正类别标签和负类别标签的数量之间存在明显差异，准确率不能反映全面情况。

精准率，尝试回答正例识别的正确比例是多少？TP/(TP+FP)，上例为：0.5

召回率，正确识别的实际正例比例是多少？TP/(TP+FN)，上例为：0.11

评估模型的效果，必须同时考虑精准率和召回率。调整阈值，会影响二者。二者之间是此消彼长的关系。

另一种使用概率方式，贝叶斯。

6. 神经网络

神经网络是构建非线性模型的一种方式。

组成部分

至少一组节点，按层分组，类似神经元
至少一组权重，每个神经网络层与下一层之间的连接
至少一组偏差，层中每个节点一个偏差
至少一个激活函数，用于转换每层中每个节点的输出，不同的层可以有不同的激活函数。

训练神经网络的最佳做法

ReLU激活函数有助于防止梯度消失	靠近输入层可称为较低层，这些层的梯度可能变得非常小，逐渐消失，下降到0时，这些层的训练速度非常慢。所以要防止梯度消失
批量归一化有助于降低梯度下降，降低学习速率
降低学习速率有助于方式ReLU单元死亡	ReLU单元的加权总和为0，ReLU单元停滞。
丢弃正则化	随机为某个梯度步长随机在一个网络中丢弃单元激活。丢弃越多，正则化效果越强。0表示无丢弃正则化。1表示丢弃所有，模型无法学习任何信息。0-1之间的值更有用。

7. 机器学习过程

7.1. 问题构建

7.1.1. 确定机器学习是否为解决当前问题的正确方法？

需要了解问题：明确解决问题要达成的目标、判断ML是否为最佳方式、是否有数据集。

7.1.2. 用机器学习术语描述问题

定义理想成效和模型目标

理想成效，即功能的效果，如识别欺诈性交易。
模型目标，即预测什么，如预测是否持卡人进行交易。

选择合适的模型类型

分类模型可预测输入数据的类别，然后应用根据类别进行决策。

回归模型可预测输入数据放置在数字行中的位置，然后应用根据区间进行决策。

确定模型的输出

明确标签、代理标签

定义成效指标

不是对模型的评估，而是功能效果的衡量，如功能的使用率增加了20%，用户停留时间增加了20%。

7.2. 数据准备与特征工程

7.3. 测试与调试

开发流程\数据调试\模型调试\模型指标\模型优化。

至此，读者已经了解ML的冰山一角了，接下来可以进行实践。

深入解析Hadoop RPC：技术细节与推广应用码字的字节 hadoop布道师 Hadoop RPC
HadoopRPC框架概述在分布式系统的核心架构中，远程过程调用（RPC）机制如同神经网络般连接着各个计算节点。Hadoop作为大数据处理的基石，其自主研发的RPC框架不仅支撑着内部组件的协同运作，更以独特的工程哲学诠释了分布式通信的本质。透明性：隐形的通信桥梁HadoopRPC最显著的特征是其对通信细节的完美封装。当NameNode接收DataNode的心跳检测，或ResourceManager
百天创业笔记04 七色阳光l
七色阳光:浙江兰溪人，退休后选择走进思涵读书荟，不留遗憾，以往生活一去不复返，最重要的是余生怎么过，与读书绑在一起，会很精彩，用心去体会！成长蜕变挑战营打卡第18天每日任务:（完成打✓）①6:00起床进行魔力练习（√）②每日营养早餐，群内打卡（√）③每天运动20分钟以上（√）④每月更新20个短视频，本月目前为止更新第几个了？（14）⑤每天在官微连麦分享书籍（√）⑥每天直播不低于1个小时（√）⑦每天
学习卡卡002
今天很认真地听直播，带着好奇心，推开致良知，成圣成贤的大门。今天主要是两三个主题。第一是解释什么是致良知，成圣成贤。阳明心学是王守仁提出的。在我们的观念中，成圣成贤是多么的似乎可望不可及，非常的高大。但是，通过老师的解释，有所顿悟，首先，我们要立志——立圣贤之志。志不立，天下无可成之事，有志者，事竟成。如果一个人连立志的勇气都没有，如何谈致良知这件事。圣贤很抽象，非要说与圣贤最接近的，那就是诚信。
Flutter 响应式状态管理框架GetX xiangzhihong8 Flutter入门与实战 flutter android ios
一、状态管理框架对比在Flutter的状态管理框架中，主流的状态管理框架有四个：GetX（又称为Get）、BLoC、MobX、Provider。Provider其中，Provider是Flutter社区提供的一种状态管理工具，本质上是对InheritedWidget组件的封装，具有如下一些优点：简化的资源分配与处置懒加载创建新类时减少大量的模板代码支持DevTools更通用的调用Inherited
【水乡之恋】二月半~匆匆作别小刺猬乖乖
【原创作品】【侵权必究】与二月半匆匆作别时我还是个懵懂少年。依稀记得，那天下午放学后我背着书包匆匆走出校园大门，径直往南走了百来米便来到已热闹了一天的二月半集市。在熙熙攘攘的人群中，我左避右闪穿梭而行，眼睛不停地四处张望，看看哪个摊位或者角落围拢的人多，同时耳听八方，仔细搜寻哪里有吆喝或者其它特别的声音，发现没见过的稀奇玩意便也围上去看个究竟。此刻夕阳西下，余晖映照下人们的脸庞红扑扑的，身上也很似
重庆专业提供正规无创亲子鉴定的10家机构地址新版合集一览（附2024年9月鉴定标准）中量亲鉴生物
对于孕期的母亲而言，无创亲子鉴定无疑是一剂强心针。无需侵入性操作，只需简单采集孕妇静脉血，即可进行鉴定，既保障了母婴健康，又让爱的确认过程充满安心与尊重。重庆无创亲子鉴定正规机构1、重庆中量国鉴生物DNA亲子鉴定咨询中心机构地址：重庆市大渡口区春晖路机构业务范围：DNA鉴定服务咨询预约，包括：个人（隐私）亲子鉴定、司法亲子鉴定咨询预约、胎儿产前亲子鉴定、亲缘关系鉴定、上户口及等DNA鉴定。机构服务
Java全栈开发性能优化全攻略：从数据库到前端 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 java 性能优化数据库 ai
Java全栈开发性能优化全攻略：从数据库到前端关键词：Java全栈、性能优化、数据库索引、后端缓存、前端渲染、响应时间、系统瓶颈摘要：本文从全栈视角出发，系统讲解Java开发中数据库、后端服务、前端页面三大核心层的性能优化方法。通过生活类比、代码示例和实战案例，带你一步步理解索引设计、缓存策略、懒加载、防抖节流等关键技术，掌握从“发现瓶颈”到“精准优化”的完整流程，最终实现用户体验与资源效率的双重
深入解析Hadoop：大数据处理的基石学习的锅 hadoop 大数据分布式
随着信息技术的快速发展和互联网的普及，数据的产生速度极具增加。面对如此海量的数据，传统的数据处理工具显得力不从心。在这种背景下，诞生了一系列用于处理大数据的框架与工具，而ApacheHadoop便是其中最为知名和应用最广泛的一个。本文将深入解析Hadoop的基本原理、架构及其在大数据处理中的重要性。1.Hadoop的起源与发展Hadoop起源于Google公司的三篇奠基性论文：GoogleFile
【数据结构 | C语言】Dijkstra算法（迪杰斯特拉算法）竹一笔记 C 数据结构数据结构 c语言开发语言
文章目录一、Dijkstra算法介绍二、算法C语言三、完整代码四、示例一、Dijkstra算法介绍Dijkstra算法解决了单源点的最短路径Dijkstra算法是贪心算法步骤：从源点出发，找到已连通点与未连通点的最小代价边连接最小代价边，将该顶点归并到已连接顶点集将该顶点连通的边的代价与最小代价比较，若代价小于最小代价，则更新最小代价边重复操作，直到连通所有顶点为止Dijkstra算法与Prim算
LPL夏季赛季后赛回顾，哪场比赛和瞬间让你记忆犹新惊鸿的读书笔记
随着LPL夏季赛季后赛和九周年的落幕，四支代表LPL出征世界赛的战队经过浴血奋战抢下了宝贵的种子名额，谁将会笑到最后，捍卫LPL的荣耀，谁又会书写属于他们的传奇？让我们在S10全球总决赛上拭目以待！每年的夏季赛季后赛和冒泡赛算得上是LPL最激励残酷的比赛了，每年都会有难以预料的惊喜和难以复刻的奇迹，而今年似乎又格外不同：逆袭成功的V5、少年Bin的奇妙冒险、卧薪尝胆的LGD，及又诞生了TES与JD
数据结构进阶：使用链表实现栈和队列详解与示例（C, C#, C++）
文章目录1、栈与队列简介栈（Stack）队列（Queue）2、使用链表实现栈C语言实现C#语言实现C++语言实现3、使用链表实现队列C语言实现C#语言实现C++语言实现4、链表实现栈和队列的性能分析时间复杂度空间复杂度性能特点与其他实现的比较总结在软件开发中，数据结构是不可或缺的一部分。本文将详细介绍如何使用链表来实现栈和队列这两种基本的数据结构，并提供C、C#和C++三种语言的示例代码。1、栈与
高仿的江诗丹顿男表大概多少钱（售价与品质详细介绍）星耀腕表
在当今社会，越来越多的消费者关注到了江诗丹顿这个瑞士著名手表品牌。在当前的仿表市场中，价格差异悬殊，让消费者在选择时感到困惑。我的宗旨是确保每位顾客都能以最合理的价格购得质量上乘的手表。我没有夸张华丽的话术，而是真诚地为您提供保障，欢迎详细咨询，微信：85857133。高仿的江诗丹顿男表大概多少钱？高仿江诗丹顿男表的价格相对正品来说要便宜很多，大致可以分为以下几个档次：1、低档高仿江诗丹顿男表：这
鸿蒙分布式数据同步全解析：用一套代码搞定多设备实时共享前端世界 harmonyos harmonyos 分布式华为
摘要在万物互联的趋势下，多设备间的数据协同成了刚需。从手机到平板、手表、电视，再到智能车载系统，用户希望数据无缝同步、实时一致。鸿蒙系统通过分布式数据库与分布式消息总线，为开发者提供了一套跨设备的数据同步机制，简化了开发流程。本文将从实际开发角度出发，带你用最简单的方式了解如何实现跨设备的数据同步。引言过去，我们经常需要自己去写Socket通信、同步逻辑、数据一致性校验，整个过程又难又容易出错。而
高省支持抖音和快手购物返佣吗？详细解读高省邀请码使用方法与优惠好项目高省
在当今多元化的购物环境中，消费者越来越倾向于通过不同的平台来购买商品，其中抖音和快手等短视频平台也逐渐成为购物的新选择。那么，作为智能导购电商平台的高省，是否支持抖音和快手购物的返佣呢？同时，对于想要加入高省的用户来说，邀请码又是什么呢？首先，关于高省是否能在抖音和快手购物中提供返佣的问题，答案是肯定的。高省作为一个集成了多个电商平台的智能导购系统，不仅覆盖了传统的电商平台，也逐渐拓展了与新兴电商
2023-05-12 黑馨宇
“昨夜雨疏风骤，浓睡不消残酒，试问卷帘人却道海棠依旧。知否?知否？应是绿肥红瘦。”这是李清照十六岁时所作的《如梦令》。李清照出生于书香门第，也许是良好的家境让她年少时可以饱读诗书，有了后来的“千古第一词女”。十八岁前的李清照有着对未来良人的向往，从她前期的诗中可以看出她的少女情怀。她是个不受世俗约束的自由自在的少女，哪怕是后来的与张汝舟离婚，也有着不属于当时女子的霸气。
破茧成蝶：负债女性如何通过工作重拾财务自由氧惠购物达人
女人负债累累该做什么工作？首先，需要明确的是，没有任何一种工作可以迅速还清债务。因此，选择工作的关键在于其稳定性、可靠性和可持续性。以下是一些适合负债累累女性的工作：1.客服代表：客服代表可以在家里工作，并且可以灵活安排自己的时间。这意味着，你可以在保持稳定收入的同时，也有足够的时间来处理债务问题。月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与
SFBT（焦点解决法）改变你与孩子（十二）夏日凉凉
21天是一个人的养习惯养成期，心理学家研究发现，有意识的让自己执行新的想法，只要坚持21天就会对习惯产生影响，进而形成新的行为模式。SFBT就是焦点解决法，使用焦点解决法改变你与孩子之间的关系。第十二天，找到不同的合作方式，没有不合作的孩子，只有不懂得方法的父母合作不只有一种模式孩子遇到问题，不愿意咨询的时候，可能是还没有找到合适的方法，是需要一点时间，一种合适的方法。当孩子做了行为偏差时，父母可
告别过去南方的雨中人
所谓成长就是与过去决裂，再重新长出一个全新的自己。就如同蛇蜕皮一样，退掉了老的皮才能够长大。即使这期间有很大的危险和痛苦。但是世界就是如此演变的。我们也只有遵从。迷茫，是一个很经典的话题。如果你感到迷茫，那么恭喜你，你起码是一个会思考的人了。但是这并不表示你成长了。因为，成长=思考+行动一次偶然的相遇:去年寒假回家的时候，我在车上偶然听到了罗胖的罗辑思维。从那天起我的心里好像就被开了一条细缝。有些
重生天才全断更抄袭千金慌了(程蕊程绵)最新章节在线阅读_(重生天才全断更抄袭千金慌了)完整版免费在线阅读热门小说_5
书名：重生天才全断更抄袭千金慌了主角：程蕊程绵简介：当作品迎来高潮之时，我突发奇想决定草率结尾，网上骂声震天，我却带着乐坛与画界的朋友去享受山庄的悠闲生活，三人斗地主解闷。然而，天才千金却陷入舆论风暴，因为我们无心创作的作品，让她的名声受损。前世的我们因抄袭而毁灭，这一世，我回到了命运交织的关键时刻。>>>>>>>请前往文章底部全文完整免费阅读>>>>>>>>>戳我继续阅读<<<<<<<<<<关注
Maison Margiela单肩包怎么买便宜？单肩包什么品牌质量最好,内行人教你怎么选直返APP抖音优惠券
MaisonMargiela（梅森马吉拉）的单肩包在时尚界享有一定的声誉，其设计融合了简约、高级与独特性，深受时尚爱好者的喜爱。以下是对MaisonMargiela单肩包的详细评价：设计风格简约而不失格调：MaisonMargiela的设计哲学强调简约与功能性，其单肩包往往以简洁的线条和纯粹的色彩呈现，展现出一种低调的高级感。独特的设计元素：品牌常运用解构主义手法，如拼接设计、不对称剪裁等，为单肩
2023-03-24 怒吼的生命
生活王辉的人生是靠自身一步步奋斗成长起来他年少时刻认真拼命读书生活里面与同学嬉笑玩闹那些日子生活艰苦但很开心他的人生再次遭遇一点挫折那种坚韧品质开始启动认真做事起来
【算法-图论】图的定义与一些常用术语小蛋编程 C++c++算法
【算法-图论】图的定义图论编辑器1：https://csacademy.com/app/graph_editor/图论编辑器2：https://graphonline.top/ch/1.图是什么图（graph）由节点（node）和边（edge）组成。其中，节点集合记为VVV，边集合记为EEE。每条边连接两个节点，某些图的边可能具有方向性。集合元素的数量用该集合的绝对值来表示。通过对比可以看出，图比
操作系统视角下鸿蒙应用多语言的多媒体处理实践操作系统内核探秘操作系统内核揭秘 OS harmonyos wpf 华为 ai
操作系统视角下鸿蒙应用多语言的多媒体处理实践关键词：鸿蒙操作系统、多语言支持、多媒体处理、分布式架构、应用开发实践摘要：本文从鸿蒙操作系统的底层设计出发，结合多语言适配与多媒体处理两大核心场景，通过“系统能力-应用开发-用户体验”的全链路分析，揭示鸿蒙如何通过分布式架构、统一资源管理和多端协同特性，简化开发者在多语言多媒体应用中的开发复杂度。文章包含原理讲解、代码示例和实战案例，帮助开发者快速掌握
大数据领域HDFS的集群资源管理优化大数据洞察大数据与AI人工智能大数据AI应用大数据 hdfs hadoop ai
大数据领域HDFS的集群资源管理优化关键词：HDFS；集群资源管理；存储优化；性能调优；副本策略；负载均衡；NameNode优化摘要：HDFS（Hadoop分布式文件系统）作为大数据领域的基石，承载着海量数据的存储与管理重任。随着数据规模爆炸式增长和业务复杂度提升，HDFS集群的资源管理面临着"存不下、跑不快、管不好"的三重挑战：存储资源浪费与不足并存、计算与存储资源匹配失衡、集群运维效率低下。本
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
席慕容与乡愁胡杨林的美好
在一回首间，才忽然发现，原来，我一生的种种努力，不过只为了周遭的人对我满意而已。为了搏得他人的称许与微笑，我战战兢兢地将自己套入所有的模式所有的桎梏。走到途中才忽然发现，我只剩下一副模糊的面目，和一条不能回头的路。——席慕容对我影响最大的就是席慕蓉了，第一次喜欢诗歌，写诗歌都是受她的影响。席慕容的文字多写爱情、人生、乡愁，写得极美，淡雅剔透，抒情灵动，饱含着对生命的挚爱真情，影响了整整一代人的成长
柏舟日記|回眸柏木之舟
2021年05月18日深夜当你回眸的一瞬间，大抵就是整个夏天。等待千年，只为卿回眸一笑，却道人间凉似秋。夏凉秋更凉，人间愁似殇。离愁心上与，一度忘秋凉。凉夜回首毕业三年，却一事无成。想来这三年间，自己得到了什么，失去了什么，一开始的鬼迷心窍，到最后的安于现状，一切好像最好的过渡，又好像是抹平了自己的棱角，更好的适应这个世界。一个人心中有了牵挂，便再也放不下这个世界，一个人心中若没有牵挂，则到哪儿都
【Linux内核】Linux驱动开发撬动未来的支点 Linux内核 linux 驱动开发运维
推荐书籍：《Linux内核探秘：深入解析文件系统和设备驱动的架构与设计》知识点x86的IO地址空间和内存地址空间是独立的两套地址空间，并且使用不同的指令访问。MOV,IN,OUT。内存映射I/O可以将IO映射到内存。ARM等RISC采用统一编编址，无独立IO空间概念。为什么有IO地址空间的概念。因为在PCI总线下，外部芯片都有控制寄存器（配置空间）和设备本地内存（内存空间）两个部分，他们是独立的。
Python 中的列表（List）和元组（Tuple） shangjg3 Python python 开发语言
1.定义与语法差异1.列表的定义列表使用方括号`[]`定义，元素之间用逗号分隔。列表的元素可以是不同数据类型，甚至嵌套其他列表或元组。my_list=[1,"hello",True,[2,3]]2.元组的定义元组使用圆括号`()`定义，同样支持混合数据类型。需要注意的是，定义单元素元组时必须在元素后加逗号，以区别于数学表达式中的括号。my_tuple=(1,"world",False,(4,5))
Linux设备驱动SPI总线 ldh-02 linux 驱动开发单片机
SPI更全面内容可以查看我的githubSPI驱动的框架与I2C类似，都是分为主机控制器驱动和设备驱动，我们需要实现的是具体设备的驱动，主机控制器的驱动由Linux内核实现，也需要了解部分重要文件linux/drivers/spi/spi.cLinux提供的通用接口封装层驱动linux/drivers/spi/spidev.clinux提供的SPI通用设备驱动程序linux/include/lin
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

人工智能学习笔记

1 扫盲阶段

1.1 四类人员

1.2 人工智能分类

1.3 海量数据作为基础

1.4 要素

1.5 有监督学习

1.6 无监督学习

2. 数学基础知识

2.1. 基础概念：

2.2. 数值摘要、数据降维

2.3. 对数

3. 机器学习基础知识

3.1. 主要的术语

3.2. 分析的数据，使用数据矩阵(数据块)表现。

4. 回归

4.1. 观察数据

4.2. 拆分数据集

4.3. 特征表示法

4.3.1. 特征工程

4.3.2. 数据整理

4.4. 特征组合

4.5. 损失

4.6. 拟合程度

4.7. 正则化

4.8. 逻辑回归

5. 分类

6. 神经网络

7. 机器学习过程

7.1. 问题构建

7.1.1. 确定机器学习是否为解决当前问题的正确方法？

7.1.2. 用机器学习术语描述问题

7.2. 数据准备与特征工程

7.3. 测试与调试

你可能感兴趣的:(区块链与人工智能,梯度下降,正则化)