Mamong

第四章《全景图:机器学习路线图》笔记

4.1 通俗讲解机器学习是什么

4.1.1 究竟什么是机器学习

卡内基梅隆大学机器学习领域的著名学者汤姆·米切尔曾经在 1997 年对机器学习做出过更为严谨和经典的定义:

A program can be said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

翻译过来就是，假设用 P 来评估计算机程序在某一项任务 T 上的性能表现，如果程序能够利用经验 E 提升在任务 T 上的性能表现，那么我们就说对于任务 T 的性能 P，这个程序对经验 E 进行了学习。从米切尔的定义中，我们也可以发现机器学习的 3 个重要概念:任务(Task)、经验(Experience)和性能(Performance)。

机器学习有时候又被称为统计学习，它是计算机基于数据来构建概率统计模型并运用模型对数据进行分析和预测的学科。机器学习基于统计方法，以计算机为工具对数据进行分析和预测。之所以将其称为“统计学习”或者“机器学习”，是因为统计学习具有“自我改进”的特征。

器学习已经开始在各种场景之中广泛使用。

(1)营销场景:商品推荐、用户画像系统、广告精准投放。

(2)文本挖掘场景:新闻分类、关键词提取、文本情感分析。

(3)社交关系挖掘场景:微博用户领袖分析、社交关系链分析。

(4)金融反欺诈场景:贷款发放、金融风控。

(5)非结构化数据场景:人脸识别、图片分类、光学字符识别(OCR)等。

4.1.2 机器学习的分类

(1)按照是否有监督，机器学习可以分为有监督学习和无监督学习。

(2)按照预测值是连续还是离散，机器学习可以分为分类和回归。

4.2 机器学习所需环境介绍

4.2.1 Python的优势

4.2.2 Python下载、安装及使用

4.3 跟着例子熟悉机器学习全过程

4.4 准备数据包括什么

准备数据包含多个环节，例如数据采集、数据清洗、不均衡样本处理、数据类型转换、数据标准化、特征工程等。

4.4.1 数据采集

4.4.2 数据清洗

数据清洗，顾名思义就是把“脏”数据“清洗”干净，使数据能够使用的过程，常包括数据一致性检查，数据缺失值、错误值或无效值的纠正等。

4.4.3 不均衡样本处理

很多情况下，数据的正负样本是不均衡的，而大多数算法模型又对正负样本比较敏感，所以还需要进行样本均衡处理。

(1)如果正负样本数量较多，且正样本远多于负样本，则采用下采样方法来处理。

(2)如果正样本远多于负样本，且负样本数量较少，则可以采取上采样方法来处理。

4.4.4 数据类型转换

(1)连续数据离散化

连续数据离散化是一种常见的数值型数据预处理方法。在某些情况下，特征离散化会大大增加模型的稳定性。某些算法模型本身也对数据有着离散化的要求。

模型究竟采用离散特征还是连续特征，是一个 “海量离散特征 + 简单模型”与“少量连续特征 + 复杂模型”的权衡问题。处理同一个问题，你可以采用线性模型处理离散化特征的方式，也可以采用深度学习处理连续特征的方式，各有利弊。不过从实践角度来讲，采用离散特征往往更加容易和成熟。

(2)类别数据数值化

计算机能够处理的是数值型数据，但是原始数据集中却常常有类别型数据，例如性别有男和女，类别型数据需要通过一定的方法转换成数值型数据，才能够被计算机所处理。常见的转换方法有 one-hot 编码。one-hot 编码也叫“独热码”，简单地讲就是有多少个状态就有多少比特，其中只有一比特为 1，其他全为 0 的一种编码机制。由于性别特征总共有两个不同的分类值，采用 one-hot 编码，男性可以表示为 {10}，女性可以表示为 {01}。假如多个特征需要 one-hot 编码，则可以依次将每个特征的 one-hot 编码拼接起来。除了 one-hot 编码外，类别型数据也可以采用散列方法来处理。

4.4.5 数据标准化

数据标准化是特征处理环节中非常重要的一步，主要是为了消除不同指标量纲带来的影响，提高不同数据指标之间的可比性。数据标准化方法如下。

(1)最大值-最小值(max-min)标准化:最大值-最小值标准化也称为离差标准化，主要是将原始指标缩放到 0 ~ 1，相当于对原变量做了一次线性变化。

(2)z-score 标准化:这是一种较为常见的数据标准化方法，几乎所有线性模型进行拟合时都会考虑使用 z-score 标准化。主要是将数据转换为均值为 0、标准差为 1 的正态分布。

4.4.6 特征工程

(1)特征工程概述。

通过特征工程对数据进行预处理，能够降低算法模型受噪声干扰的程度，能够更好地找出发展趋势。特征工程的目的是筛选出更好的特征，获取更好的训练数据。因为更好的特征意味着特征具有更强的灵活性，可以使用更简单的算法模型同时得到更优秀的训练结果。一般来说，特征工程可以分为特征构建、特征提取、特征选择 3 种方式。

(2)特征选择。

特征选择是使用最为广泛的特征工程技术，一方面是因为部分特征之间相关度较高导致特征冗余，从而容易造成计算资源浪费，需要进行特征选择来降低计算资源的浪费;另一方面是因为部分特征是噪声，会对预测结果产生负面影响，需要进行特征选择。

特征选择的技巧和方法：

第一，过滤法。过滤法主要是评估某个特征与预测结果之间的相关度，对相关度进行排序，保留排序靠前的特征维度。实践中经常使用 pearson 相关系数、距离相关度等指标来进行相关度度量。

第二，包装法。首先使用全量特征进行算法模型构建，得到基础模型;然后根据线性模型系数，删除部分弱特征后观察模型预测能力的变化情况，当模型预测能力大幅下降时停止删除弱特征。最常用的包装法是递归消除特征法。

第三，嵌入法。使用正则化方法来对特征进行处理，正则化惩罚项越大，模型的系数就会越小，而当正则化惩罚项大到一定的程度时，部分特征系数会趋于 0。这部分特征就可以先剔除，只保留特征系数较大的特征。

4.5 如何选择算法

4.5.1 单一算法模型

4.5.2 集成学习模型

集成学习通过构建多个学习器并将其结合，从而更好地完成预测任务，也常被称为模型融合或者基于委员会的学习。

融合模型根据个体学习器生成方式的不同，可以分为两大类:个体学习器之间存在强依赖关系、必须串行生成的序列化算法，代表算法是 Boosting ;个体学习器之间不存在强依赖关系、可同时生成的并行化算法，代表算法是 Bagging 和随机森林。

1.Boosting

Boosting 算法的思想是，首先从初始训练集中训练一个基学习器，基学习器对不同的样本数据有着不同的预测结果，有些样本基学习器能够很好地预测，有些则不能;对于预测错误的样本，增加其权重后，再次训练下一个基学习器;如此反复进行，直到基学习器数目达到事先指定的数值 T，然后将 T 个基学习器进行加权结合。Boosting 算法实际上是算法族，表示一系列将基学习器提升为强学习器的算法。典型的 Boosting 算法有 AdaBoost。

2.Bagging 和随机森林

Bagging 算法的思想是通过尽可能增加每个学习器训练集的差异来使得学习器之间产生较大差异，从而避免各个学习器雷同。具体做法:第一，从原始样本集中抽取训练集，每次随机抽取 n 个训练样本抽取 T 次得到 T 个训练集;第二，每次使用一个训练集得到一个模型，T 个训练集共得到 T 个模型;第三，对上述 T 个学习器采取某种策略进行结合。一般来说，Bagging 对分类问题通常采用简单投票法，对回归问题通常采用简单平均法。

随机森林使用了分类与回归树作为弱学习器，并对决策树的建立做了改进，通过随机选择节点上的一部分样本特征进一步增强了模型的泛化能力。随机森林的“随机”主要体现在两方面:数据的随机选择、待选特征的随机选择。

4.5.3 算法选择路径

(1)观察数据量大小。如果数据量太小(例如样本数小于 50)，那么首先要做的应该是获取更多的数据。

(2)问题类型。究竟是连续值预测还是离散值分类。

(3)分类问题解决。分类问题根据数据是否存在标签数据，可以分为有监督分类问题和无监督分类问题。如果数据存在标签数据，那么我们可以采用有监督分类算法来予以解决，例如可以采取 LR、支持向量机(Support Vector Machine，SVM)或者梯度提升决策树(Gradient Boosting Decision Tree，GBDT)等算法;如果数据不存在标签数据，那么我们可以采用一些无监督算法来予以解决，例如聚类算法。

(4)连续值预测问题解决。如果特征维度不是特别多，我们可以直接采用回归算法来处理;如果特征维度很多则需要先进行降维处理。

4.6 调参优化怎么处理

4.6.1 关于调参的几个常识

(1)机器学习通过训练数据得到一个具体算法模型的过程，就是确定这个算法模型参数的过程。

(2)超参数是在模型训练前我们手动设定的。超参数设定的目的是更快、更好地得到算法模型的参数。而我们一般谈论的调参指的实际上是调整超参数。

(3)如果以线性回归算法为例，回归模型一般表达式里面的系数 ω 和 b 是参数，而正则项的惩罚系数就是超参数。神经网络算法中，节点的权重是参数，而神经网络的层数和每层节点个数就是超参数。

有监督学习的核心环节就是选择合适的算法模型和调整超参数，通过损失函数最小化来为算法模型找到合适的参数值，确定一个泛化性能良好的算法模型。

4.6.2 模型欠拟合与过拟合

欠拟合和过拟合是导致模型泛化能力不高的两种常见原因。“欠拟合”是指模型学习能力较弱，无法学习到样本数据中的“一般规律”，因此导致模型泛化能力较弱。而“过拟合”则恰好相反，是指模型学习能力太强，以至于将样本数据中的“个别特点”也当成了“一般规律”，因此导致模型泛化能力同样较弱。

欠拟合的解决解决办法是，提高学习器的学习能力，例如在决策树中扩展分支数量或者在神经网络算法中增加训练轮数等。

过拟合产生的原因是模型“过度用力”去学习训练样本的分布情况，甚至把噪声特征也学习到了，从而导致模型的普适性不够。常见的解决方法包括增大样本量和正则化。

4.6.3 常见算法调参的内容

线性算法需要调整的超参数主要是正则化系数，而决策树算法需要调整的超参数主要是决策树最大深度、决策树分裂标准等。

4.6.4 算法调参的实践方法

通常情况下，算法模型的超参数可以手动设定(如 k 近邻算法中的 k 值)。但由于超参数组合空间巨大，手动设定超参数的过程过于繁杂，这个时候我们就可以考虑使用网格搜索(Grid Search)方法来寻找合适的超参数。网格搜索本质上是穷举所有的超参数组合。

4.7 如何进行性能评估

根据机器学习问题类型的不同，算法模型有着不同的性能度量标准。回归预测问题通常采用平均绝对误差、均方误差等指标来度量算法模型的预测能力。分类问题则通过采用精度与错误率、查全率(Recall)与查准率(Precision)等指标来度量算法模型的预测能力。

4.7.1 回归预测性能度量

(1)平均绝对误差。各预测值偏离真实值的绝对值之和的平均数。

(2)均方误差。误差平方和的平均数。

4.7.2 分类任务性能度量

(1)精度与错误率。精度是分类正确的样本数占样本总数的比例，错误率是分类错误的样本数占样本总数的比例。

(2)查全率与查准率。查全率也被称为“召回率”，查准率也被称为“准确率”。大家可以这样记忆:查全率表示有多少癌症患者被医院真正检测出来了(比例)，查准率表示医院检测出来的癌症患者有多少真的是癌症患者(比例)。一般来说，如果要求查准率比较高，那么查全率就会比较低;而如果要求查全率比较高，那么查准率就会比较低。

Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
《小狗钱钱》学习心得（第三、四、五章） A01琪公子
《小狗钱钱》学习心得（第三、四、五章）最近在跟战友读一本《小狗钱钱》的书，今天把读到的精华与对这本书的感悟分享给正在看文章的你，希望对你有用。一、成功笔记：1.昨天的梦想相册的三个重要梦想开始在我脑海中浮现，我闭眼想到靠自己努力买房并装修好的新房的温馨舒适、爸妈安享晚年的幸福时刻，以及清晨爱人醒来那甜蜜的微笑。2.给客户重新发了合同，不在急急燥燥，而是准备好，只要有机会，就紧紧抓住。3.用心读完了
python分布式爬虫打造搜索引擎--------scrapy实现 weixin_30515513 爬虫 python 开发工具
http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
创意PPT模板：好水灵的排版，还是熟悉的味道 LJ的学习笔记
大家好，我是爱学习的瞄代表。今天给广大职场人带来一份创意PPT模板（好水灵的排版）。【总览图】：【PPT展示】：【PPT模板特点】：1、创意PPT模板，前所未有的快感；2、几乎所有素材均可编辑，有型更有料；3、扁平设计，时下正流行；4、好水灵的排版，还是熟悉的味道【获取方式】：微信公众号：LJ的读书笔记（ljdushubiji）回复关键词“0505”，即可获取。
深度学习：让 AI 拥有 “思考” 能力的核心技术田园Coder 人工智能科普人工智能科普
1.深度学习：突破传统的AI“进阶版”1.1什么是深度学习？深度学习是机器学习的一个分支，它通过模拟人脑神经网络的多层结构，让AI能够自动学习数据中的复杂特征，从而完成更高级的认知任务。例如，传统机器学习需要人类手动提取“猫有尖耳朵、胡须”等特征，而深度学习能直接从原始图片中，自主学习从像素到轮廓、再到整体形态的多层特征，最终实现更精准的识别。这种“自主提取特征”的能力，让深度学习突破了传统AI的
猴子·成功日记（32） Monkey_858e
2020/3/211、口语打卡2、牙套计时——26副第2天3、小提琴练习2小时4、学习理财+笔记5、备课+文稿6、尤克里里打卡7、上课8、练读《末日焚书》
《How to Take Smart Notes》读书笔记1 LY320
最近在读一本书，题为《HowtoTakeSmartNotes:OneSimpleTechniquetoBoostWriting,LearningandThinking–forStudents,AcademicsandNonfictionBookWriters》1。尚未读完，分享一些读这本书的感想，我的一些心得，和不解。这本书让我觉得最有收获的点是更新了我对记录和整理笔记的认识。通常我们在记录笔记时
左眼跳财右眼跳灾的科学依据是什么？医生告诉你答案高省张导师
俗话说“左眼跳财，右眼跳灾”。许女士对这句俗语深信不疑。从一年前开始，许女士总是左眼皮跳，但每次只要稍作休息就能恢复正常，所以许女士都没放在心上，甚至还心想：说不定能走财运了。大家好，我是高省APP最大团队，【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码520888，注册送2皇冠会员，送万元推广大礼包。给大家推荐一个公主号《张十五笔记》分享引流，思维
马斯克整出的半仙儿，Chat GPT会让多少白领失业？可能会带来哪些变化？良辰美景5566
这几天，ChatGPT火了，是美国一家叫OpenAI的高科技公司研发的，背后的投资人是谁？——埃隆马斯克！这哥们儿只要一出手，注定就和新奇呀伟大呀啥的绑在一起了，他搞的项目，比如特斯拉、星链、脑机接口，光听名字就透着不俗。很多人纳闷儿，他这次搞得ChatGPT是个啥玩意儿？简单说就是一个人工智能聊天软件，这个软件比以往的智能聊天软件强在哪儿？这么说吧，这简直就是个半仙儿啊。如果您是一位老人，这个C
为这人间操碎了心-读书笔记-02 Tracy的小书斋
火车有人嫌火车走得慢，又有人嫌火车冒烟脏。人类浪费时间精力做好多好多不该做的事，何必斤斤计较旅途所耗的时间？纵然火车走得像枪弹一般快，车上的人忙的是什么？火车冒烟是脏，可是冒烟的并不只是火车，何况现在火车多不冒烟了。如果老远地看火车冒黑烟或吐白气，那景象却不一定讨厌。送礼礼尚往来，来而不往非礼也。升官图一开始以为这篇文章会是在讲述官场的景象，但是原来升官图只是一个游戏。但是游戏中也蕴含了人间真理：
PyTorch torch.no_grad() 指南（笔记）拉拉拉拉拉拉拉马 pytorch 人工智能 python 笔记深度学习
PyTorchtorch.no_grad()权威在PyTorch深度学习框架中，高效的显存管理对于训练复杂模型和执行大规模推理任务至关重要。显存不足（OutOfMemory,OOM）错误是开发者经常面临的挑战之一。torch.no_grad()作为PyTorch提供的一个核心工具，能够在推理（inference）和验证（validation）阶段显著优化显存使用并提升计算速度。本报告旨在全面、深入
读书笔记之瑞达利欧《原则》 niuDavid
桥水创始人瑞·达利欧写的《原则》一书，厚厚的竟达五百多页，我也是花费很长时间读完。《原则》主体架构无非分为三个部分，首先是写自己的历程，夹杂一些自己感悟作为本书的引子，第二部分是讲到归纳的生活原则，最后一部分就讲了工作中的原则。书中归纳点很多，虽然有些是我们早已体察到的，但仍有部分观点新鲜可敬，有些理论是深刻的，有些观点是让人触动不已，有些竟是即相通而又交叉验证的，这些都通过此书系统的给我们展显出
网络爬虫-07 YEGE学AI算法 Python-网络爬虫
网络爬虫-07）**Spider06回顾****scrapy框架****完成scrapy项目完整流程****我们必须记住****爬虫项目启动方式****数据持久化存储****Spider07笔记****分布式爬虫****scrapy_redis详解****腾讯招聘分布式改写****机器视觉与tesseract****补充-滑块缺口验证码案例****豆瓣网登录****Fiddler抓包工具****移
量子计算与AI融合的技术突破与实践路径
量子计算与人工智能的融合正开启一个全新的技术纪元，这种"量智融合"不是简单的技术叠加，而是多领域、多学科的横向连接，通过协同创新实现非线性增长。本文将深入探讨这一领域的最新进展、技术实现路径以及行业应用案例。电子-光子-量子一体化芯片：硬件基础突破2025年7月，美国波士顿大学、加州大学伯克利分校和西北大学团队联合开发出全球首个电子-光子-量子一体化芯片系统。这一突破性成果发表在《自然·电子学》杂
【RK3568 嵌入式linux QT开发笔记】二维码开源库 libqrencode 交叉静态编译和使用
本文参考文章：https://blog.csdn.net/qq_41630102/article/details/108306720参考文章有些地方描述的有疏漏，导致笔者学习过程中，编译的.a文件无法在RK3568平台运行，故写本文做了修正，以下仅是自我学习的笔记，没有写的很详细。一：下载软件包https://download.csdn.net/download/qq_41630102/12781
117、Python机器学习：数据预处理与特征工程技巧多多的编程笔记 python 机器学习开发语言
Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
2025年各细分产业链企业数据(汽车、数字经济、食品、制造业) 经管数据库汽车智能手机数据分析
本数据包含2025年及之前的所有上中下游企业信息，67个细分产业。汽车专区、数字经济专区、数字创意专区、未来产业专区、高端装备专区、新能源专区、食品农业专区、传统制造业专区等71个文件。汽车专区：充电桩制造动力电池汽车材料制造汽车制造汽车制造设备汽车座椅制造驱动电机制造燃料电池汽车制造燃料电池系统制造新能源汽车制造智能驾驶智能视觉数字经济专区：5g边缘计算大数据类服务器光通信集成电路区块链人工智能
20200323《学习就是找对方法》笔记1 芯雨诚
走出学习误区，找对学习方法作为老师，经常被问及的问题之一就是，“老师，学习怎么那么难？”“老师，有没有好的学习方法，能够让成绩快速提高呢？”问这个问题的既有学生，也有家长。每每遇到这个问题，我都有一种一言难尽的感觉……其实，学习是一件快乐的事情。我们却总是认为学习是一件“苦差事”，总是觉得学习过程“既枯燥又乏味”，在学校中“厌学”的学生比比皆是……问题到底出在哪里了呢？关键在于我们走进了学习的误区
这也将过去——《大历史：虚无与万物之间》读书笔记毛毛小朋友
图片发自App无论你我的此生有多长，对整个生物的物种而言，都是短暂的；无论我们这个物种生命有多长，对所有的生命而言，都是短暂的；无论所有的生命有多长，对地球而言，都是短暂的；无论地球的寿命有多长，对银河系而言，都是短暂的；我们在短暂的生命中，仰望苍穹，渺小而又卑微的，仰视着时间的河流，那些生命的开端兴盛灭绝与重启。大历史，从星球的形成到未来的遐思，用13章，走完了关于地球的前世今生到未来，那么，阅
2024年，想要靠做软件测试获得高薪，还有机会吗？朱公子的Note 软件测试
2024年，科技行业风云变幻，随着自动化技术和人工智能的发展，软件测试领域的竞争愈发激烈。很多人会问，现在还投身软件测试，真的能拿到高薪吗？尤其是当越来越多的自动化工具涌现，手动测试员会不会被淘汰？时间过得真快，一眨眼，2024年已经过去了一大半。最近正值金九银十招聘季，后台不免又出现了这几个同学们关心的问题：2024年还能转行软件测试吗？零基础转行可行吗？那么，2024年，软件测试行业的高薪岗位
恋恋笔记本赫本_abf2
昨晚洗完澡就捧着电脑躲被窝花了两个小时重温了《恋恋笔记本》真心推荐大家看熬对我影响挺大的完全改变了我的爱情观鉴于恋恋笔记本会看哭所以拒绝任何院线的催泪大片（除非自己导/演）睡前会看阿拉斯加独居修行者的纪录片渴望搬去那里远离尘世第一次看这部电影是在高中时候飞往北京的天空中小小的爱情观从那时候开始萌芽电影讲述了一个穷小子爱上富家小姐历尽坎坷白头偕老的故事很难泪目的我也会有情感代入时候毕竟一辈子只爱一个
随笔记龙的心_48aa
新的模式下，人们争先恐后的抢占先机，未来的市场，是适应这种模式，还是淘汰这种模式！静观其变，以不变应万变！
2018-10-24丨微日记027 Jonathanchoi
今天分享一些小碎片：有道云笔记里头有一个扫描文档的功能，可是它只能自动识别，却不能给用户编辑的机会，可谓是“拍得到就是你的，拍不到就拜拜”，而扫描全能王则提供了识别错误后可编辑的功能。开完组会路过包道的时候，发现它提供了顾客到店开柜取餐的功能，为想吃到美食却赶路程赶时间的人们提供了多种选择性。这种饮食界的丰巢快递柜，个人我觉得很实用。捷登都会的洗手间设置让人不太习惯，三层男厕二层是女厕，经常让人白
2023-09-15 五角大楼探索生成式人工智能解决方案泰格
佳文砺道智库2023-09-1409:58发表于北京据“防务头条”网9月12日报道，美国研究机构“特殊竞争力研究项目”（SCSP）的一份报称告，如果美国想在制定生成式人工智能的开发和使用规范方面引领全球，就必须增加联邦研发支出，建立新的政府机构，或者改变现有的政府机构。生成式人工智能可以加速新药和网络安全解决方案的发现，从根本上实现更好的计算机网络，并提高公众的理解。但在对手手中，它可能会导致更多
c语言如何宏定义枚举型结构体,C语言学习笔记--枚举&结构体搁浅的鲎 c语言如何宏定义枚举型结构体
枚举枚举是一种用户定义的数据类型，它用关键字enum以如下语法格式来声明：enum枚举类型名字{名字0，名字1，。。。，名字n}；枚举类型名字通常并不真的使用，要用的是大括号里面的名字，因为它们就是常量符号，它们的类型是int，值则依次从0到n。如：enumcolor{red,yellow,green};就创建了3个常量，red的值是0，yellow的值是1，green的值是2。当需要一些可以排列
尚硅谷C语言笔记-结构体与共用体想名困难户尚硅谷C语言笔记 c语言笔记
1、结构体(struct)类型的基本使用1.1为什么需要结构体？C语言内置的数据类型，除了几种原始的基本数据类型，只有数组属于复合类型，可以同时包含多个值，但是只能包含相同类型的数据，实际使用场景受限。1.2结构体的理解C语言提供了struct关键字，允许自定义复合数据类型，将不同类型的值组合在一起，这种类型称为结构体（structure）类型。C语言没有其他语言的对象(object)和类(cla
2018-05-10 黛丽丝
今天，儿子给我分享他的快乐：上课时，因为积极发言得了两张表扬信。又因为能积极背诵课文片段，又得了两张！祝贺！祝贺！晚上写作业挺积极，从不用我催促！这好习惯妈妈也该奖励！唯一缺乏自我细心检查的好习惯，什么时间儿子会自己认真检查作业，就更“完美”了！自从儿子买上笔记本，就见他有时记录一些东西，具体内容他一直保密！睡觉的时间到了，我忍不住地问：“儿子，你笔记本都记录些什么？”儿子说：“今晚你可以看了！不
学习笔记(39):结合生活案例，介绍 10 种常见模型宁儿数据安全 #机器学习学习笔记生活
学习笔记(39):结合生活案例，介绍10种常见模型线性回归只是机器学习的“冰山一角”！根据不同的任务场景（分类、回归、聚类等），还有许多强大的模型可以选择。下面我用最通俗易懂的语言，结合生活案例，介绍10种常见模型及其适用场景：一、回归模型（预测连续值，如房价）1.决策树（DecisionTree）原理：像玩“20个问题”游戏，通过一系列判断（如“面积是否>100㎡？”“房龄是否0.5就判为“会”
USB Hub 和 USB Dock 技术解析 TESmart碲视 KVM切换器领域相关技术网络电脑计算机外设智能硬件物联网游戏
"笔记本只有两个USB口，外接键盘鼠标后就没法插U盘了…"这样的困扰正在数百万办公族日常上演。面对接口荒，市场给出了两种截然不同的解决方案——轻巧便携的USBHub与功能强大的USBDock扩展坞，但究竟哪种才是你的Mr.Right？本文将从工作原理、协议支持、应用场景三个维度展开深度解析：Hub如同USB接口的"分线器"，通过简单的信号复制实现多个USB端口基础扩展；Dock则是系统级的"外设中
LLM系统性学习完全指南（初学者必看系列） GA琥珀 LLM 学习人工智能语言模型
前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发，逐步剖析自然语言处理（NLP）的经典范式，深入探究引发革命的Transformer架构，并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后，我们将探讨如何将这些强大的基础模型转化为实用、安全的应用，涵盖对齐
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默