sty945

FastAI 2019课程学习笔记 lesson 2：自行获取数据并创建分类器

文章目录

数据获取

google_images_download 的安装和使用
挂载google 个人硬盘到Google colab中
删除不能打开文件
创建ImageDataBunch

训练模型

解释模型

将模型投入生产
可能出故障的情况

学习率太高(Learning rate too high)
学习率太低(Learning rate too low)
Too few epochs
Too many epochs

数据获取

数据集在深度学习模型的训练过程中有着重要的影响，本次课程教大家如何利用google的图片搜索功能来创建简单的图片数据集。

本人使用了Google colab作为学习fastai的平台，所以你需要科学上网。本人在实验的过程中发现fastai官方教程提供的获取google image的json文件不好用，所以找了一个开源的google image开源库来代替官方的图片获取方案。

google_images_download 的安装和使用

通过下面代码在Google colab中安装google_images_download:

!pip install google_images_download

我们现在需要制作黑熊，棕熊，泰迪熊的数据集，希望最终的模型可以区分这三种熊，所以我们通过如下的代码来从Google image上获取这三种熊的图片。

from google_images_download import google_images_download   #importing the library

response = google_images_download.googleimagesdownload()   #class instantiation

arguments = {"keywords":"black bear,grizzly bear,teddy bear","limit":100,"print_urls":True}   #creating list of arguments
paths = response.download(arguments)   #passing the arguments to the function
print(paths

在这段代码中我们需要注意的是"limit":100,由于这个库的问题，在下载100张以内图片时候是不需要安装selenium 库和 chromedriver 扩展的，但是差不多100张的图片也足够我们需要了。

下载的文件在google colab中一般放在/content/downloads/目录下，为了方便下次我们对数据的使用，我们可以将这些数据永久保存在我们自己Google 硬盘之中

挂载google 个人硬盘到Google colab中

from google.colab import drive
drive.mount('/content/gdrive', force_remount=True)
root_dir = "/content/gdrive/My\ Drive/"

可以通过如下代码实现挂载google硬盘到google colab中

然后我们可以通过如下代码将下载的图片文件拷贝到个人的文件夹中,后面的目标文件夹大家可以自行更改:

!cp -r /content/downloads/* /content/gdrive/My\ Drive/pytorch/Fast_AI_learning/data/bears/

删除不能打开文件

通过以下的程序实现删除不能打开的文件，当然我们也可以自己去https://drive.google.com下去找到对应的文件夹，看看是否存在图片不能打开的情况，如果存在则删除这些图片

path = Path("/content/gdrive/My Drive/pytorch/Fast_AI_learning/data/bears")
classes = ['black bear','grizzly bear','teddy bear']
for c in classes:
    print(c)
    verify_images(path/c, delete=True, max_size=500)

创建ImageDataBunch

与lesson 1类似，我们创建ImageDataBunch：

np.random.seed(42)
data = ImageDataBunch.from_folder(path, train=".", valid_pct=0.2,
        ds_tfms=get_transforms(), size=224, num_workers=4).normalize(imagenet_stats)

在我们在创建data bunch时候，如果不知道分离的验证集和训练集，就默认当前文件夹是训练集，但是我们应该留出20%的数据作为验证集，所以我们自动的、随机的创建一个验证集。在我们随机创建一个验证集时候，我们总是提前设置一个固定的随机种子，这意味着每次我执行这段代码的时候都会得到同样的验证集结果。
随机性是一个非常重要的部分来找出稳定的解，每次你运行它的时候它都会起作用。但重要的是,你总是有相同的验证集,否则当你正试图决定这个超参数改变改善我的模型,但你有一组不同的数据测试,那么你不知道也许这组数据恰好是有点简单。
这就是为什么总是把随机的种子放在这里。

通过下面代码显示出一部分图像结果：

data.show_batch(rows=3, figsize=(7,8))

通过下面代码显示数据种类结果以及训练集和验证集的数量：

data.classes, data.c, len(data.train_ds), len(data.valid_ds)

得到：

(['black bear', 'grizzly bear', 'teddy bear'], 3, 204, 51)

训练模型

根据lesson 1的训练模型方式，我们通过resnet34模型来进行训练：

learn = cnn_learner(data, models.resnet34, metrics=error_rate)
learn.fit_one_cycle(4)

得到如下的结果：
然后我们先保存当前状态，然后通过运行学习率寻找工具并绘制出学习率：

learn.save('stage-1')
learn.unfreeze()
learn.lr_find()
learn.recorder.plot()

最后得到这样的图像：

通过图像我们发现在区间[1e-4, 1e-3]中间loss是下降最快的，所以我们通过下面的代码进一步的优化模型：

learn.fit_one_cycle(2, max_lr=slice(3e-5,3e-4))

经过我们到现在的努力，我们的错误率维持在了1.9%，这已经是一个相对来说比较好的结果的了。我们通过google image创建了一个数据集，然后创建了一个分类器，最后我们得到了1.9%的错误率，现在我们保存下这个状态。

learn.save('stage-2')

解释模型

learn.load('stage-2')
interp = ClassificationInterpretation.from_learner(learn)
interp.plot_confusion_matrix()

绘制得到混淆矩阵如下：
我们发现其中有个黑熊被我们预测成了棕熊

将模型投入生产

首先将模型导出：

learn.export()

这会在目录中创建一个名为export.pkl的文件，它包含了部署模型所需要的所有内容（模型，权重以及一些元数据）
我们可以选择再cpu上执行这个预测程序，当我们的机器没有gpu时候，这是自行发生的

defaults.device = torch.device('cpu')

我们可以选择一张图片：

img = open_image(path/'grizzly bear/2.grizzly_pam-hartman_0_epv0457.jpg')
img

我们在保证路径下包含的export.pkl，然后我们在生产环境中创建学习器：

learn = load_learner(path)

然后我们就可以进行我们的预测工作了

pred_class, pred_idx, outputs = learn.predict(img)
pred_class

我们得到如下结果，预测表明这张图片表示的是棕熊。

Category grizzly bear

可能出故障的情况

在大多数情况之下，我们按照官方指定的教程去运行程序是没有产生正确的结果的，所以我们来谈谈当我们遇到问题时候会发生什么？这就是我们为什么开始学习一些理论的原因，因为为了方便我们理解为什么会有这些问题以及我们如何解决这些问题。
首先我们先看下一些典型的问题案例，如下：

你的学习率太高或者太低
你的epoch的数量太多或者太少

所以我们来学习下这意味着什么以及为什么他们发挥重要的作用。

学习率太高(Learning rate too high)

所以让我们用我们的泰迪熊探测器来提高我们的学习速度。默认的学习率是0.003，这在大多数情况下是可行的。如果我们试着把学习率设为0.5,这是非常大的，会发生什么呢?我们的验证损失相当大，它通常是1以下的数。如果你看到你的验证损失，在我们知道验证损失是什么之前，只要出现这样的情况，证明你的learning rate就太高了，你只需要知道这些让它更低就可以了。不管你经历了多少个epoch,如果发生这种情况，就没有办法挽回了,你必须回去重新建立你的神经网络，从零开始适应一个较低的学习率（learning rate）。

learn = create_cnn(data, models.resnet34, metrics=error_rate)
learn.fit_one_cycle(1, max_lr=0.5)

学习率太低(Learning rate too low)

如果我们传入的最大的学习率不是 0.003而是0.00001呢？

learn = create_cnn(data, models.resnet34, metrics=error_rate)
learn.fit_one_cycle(5, max_lr=1e-5)

虽然使用很低的学习率，我们的错误率有所下降但是下降的速度非常的缓慢。

可以通过使用learn.recorder.plot_losses来绘制出验证和训练损失，可以看见他们在慢慢的下降。

如果你看见这种情况，就证明你的学习速率太小了，所以你可以尝试10倍，100倍的放大学习率然后再次进行训练。**还有一个需要注意的是如果你的学习率太小了，那么你的训练损失会高于你的验证损失，你永远不会希望这样的情况发生在你的训练模型中的。**这就意味着你没训练够，意味着你的学习率太低了或者你的epoch的数量太小了。所以如果你的训练模型发生这样的情况，使用更高的学习率再多训练几次。

Too few epochs

learn = cnn_learner(data, models.resnet34, metrics=error_rate)
learn.fit_one_cycle(1)

如果使用一个epoch，并且错误率在7%，这是低于随机预测的，但是看看训练损失和验证损失之间的差别，我们发现训练损失是远远高于验证损失的，所以太少的epoch和太小的learning rate的结果是相似的。所以你可以尝试更多的epoch，如果结果还是一样，那么你可以尝试更高的学习率。如果尝试一个更高的学习率，损失会达到10亿，然后你再把学习率设为原来的值，再增加一个epoch，这就是平衡，也就是调参，99%的时候你只关心这些，只有1/20的情况下，默认值是无效的。

Too many epochs

太多的epoch会造成过拟合。当你训练你的模型时间太长，模型可能就会只识别特定的泰迪熊而不是一般的泰迪熊了。尽管你可能听过在深度学习中很难产生过拟合，所以现在为大家展示一个过拟合的案例，并且关闭一些其他选项，我关闭了数据增强，dropout，以及weight decay(权值衰减)，我尽可能的让模型过拟合。我以一个很小的学习率训练模型，并且训练模型很长时间，我可能会得到一个过拟合的模型。

唯一能告诉你过拟合的是错误率短暂的提升，然后开始变得更差。你可能会听见很多人，甚至那些声称了解机器学习的人告诉你说如果你的training loss 比validation loss低，那么就是过拟合，但是这其实并不是完全正确。

任何一个正确的训练模型的training loss都比validation loss低

这并不是过拟合的迹象，这并不意味着你做错了什么，这恰恰证明你做的是对的。你过拟合的标志是错误率开始变得更糟，这才是你应该关心的。你希望你的模型拥有更低的错误率，所以只要你在训练的时候，你的模型的错误在改善，那么你就没有过拟合。

np.random.seed(42)
data = ImageDataBunch.from_folder(path, train=".", valid_pct=0.9, bs=26, 
        ds_tfms=get_transforms(do_flip=False, max_rotate=0, max_zoom=1, max_lighting=0, max_warp=0
                              ),size=224, num_workers=4).normalize(imagenet_stats)

learn = cnn_learner(data, models.resnet50, metrics=error_rate, ps=0, wd=0)
learn.unfreeze()

learn.fit_one_cycle(40, slice(1e-6,1e-4))

结果如下：

epoch	train_loss	valid_loss	error_rate	time
0	1.281925	1.141897	0.694323	00:07
1	1.346654	1.129421	0.694323	00:03
2	1.340803	1.107458	0.681223	00:03
3	1.355779	1.085071	0.646288	00:03
4	1.295381	1.050753	0.589520	00:03
5	1.224308	1.000656	0.497817	00:03
6	1.159185	0.938931	0.397380	00:03
7	1.088768	0.867412	0.310044	00:03
8	1.008123	0.788017	0.231441	00:03
9	0.938289	0.708754	0.157205	00:03
10	0.864608	0.634222	0.122271	00:03
11	0.793969	0.566193	0.096070	00:03
12	0.733825	0.508754	0.082969	00:03
13	0.680985	0.458568	0.069869	00:03
14	0.632074	0.418085	0.061135	00:03
15	0.589376	0.385271	0.056769	00:03
16	0.551403	0.356482	0.056769	00:03
17	0.516843	0.330840	0.052402	00:03
18	0.485706	0.311566	0.052402	00:03
19	0.457809	0.295450	0.052402	00:03
20	0.432226	0.281761	0.052402	00:03
21	0.408979	0.269984	0.052402	00:03
22	0.387673	0.259906	0.048035	00:03
23	0.368162	0.251425	0.039301	00:03
24	0.350114	0.245693	0.034934	00:03
25	0.333477	0.238942	0.034934	00:03
26	0.318159	0.232099	0.030568	00:03
27	0.303887	0.226424	0.030568	00:03
28	0.290654	0.222446	0.030568	00:03
29	0.278258	0.218786	0.034934	00:03
30	0.266660	0.215658	0.030568	00:03
31	0.255738	0.214105	0.030568	00:03
32	0.245596	0.209824	0.030568	00:03
33	0.236173	0.205443	0.034934	00:03
34	0.227359	0.204399	0.030568	00:03
35	0.218893	0.202812	0.030568	00:03
36	0.210922	0.202212	0.039301	00:03
37	0.203402	0.201633	0.039301	00:03
38	0.196221	0.201402	0.039301	00:03
39	0.189409	0.201313	0.039301	00:03

综上是在训练深度模型时候容易出错的四点

入门pytorch-联邦学习四代机您发多少 pytorch 人工智能 python
本文联邦学习的代码引用于https://github.com/shaoxiongji/federated-learning本篇文章相当于带大家读一遍联邦学习的代码，同时加深了大家对联邦学习和Pytorch框架的理解。这里想简单介绍一下联邦学习。联邦学习说白了，就是假如有NNN个数据拥有者F1,...,FN{F_1,...,F_N}F1,...,FN，他们希望使用这些数据来训练机器学习模型，但是又各
FPGA FMC 接口 LEEE@FPGA FPGA高速接口开发 fpga开发 FMC
1FMC介绍FMC接口即FPGAMezzanineCard接口，中文名为FPGA中间层板卡接口。以下是对它的详细介绍：标准起源：2008年7月，美国国家标准协会（ANSI）批准和发布了VITA57FMC标准。该标准由从FPGA供应商到最终用户的公司联盟开发，旨在为位于基板（载卡）上的FPGA提供标准的扩展卡外形、连接器和模块化接口。接口构成：整个FMC模块由子板模块、载卡两部分构成。子板模块和载卡
探索Gemini Balance：Google Gemini API的代理与负载均衡解决方案几道之旅人工智能智能体及数字员工负载均衡运维人工智能
引言在人工智能领域，API的高效使用和管理至关重要。尤其是当涉及到Google的GeminiAPI时，为了实现更稳定、更高效的服务，我们需要一个强大的代理和负载均衡工具。今天，我们就来深入了解一下GeminiBalance这个开源项目，它为GeminiAPI的使用提供了全面而灵活的解决方案。项目概述GeminiBalance是一个基于PythonFastAPI构建的应用程序，主要用于提供Googl
从开源小白到 Apache Member，我的成长之路开源小秘书云栖社区 Apache 高并发
我们走过的每一步路，都会留下印记，越坚实，越清晰。近日，Apache软件基金会（ASF）官方Blog宣布全球新增40位ApacheMember，张乎兴有幸成为其中一位。目前，全球共有771位ASFMember，中国仅13位。本文将分享作者从0基础的开源小白，一路走来的感触，希望把期间的经历分享出来，让更多的人看到，世界开源舞台的中国力量。只要有持续的付出，总会有所收获。初次参与开源2014年，我加
一文搞懂 XR 立体渲染模式三叔 Tuncle xr 图形渲染
更好的阅读体验，可查看XR立体渲染模式在XR中物体通常需要以立体（insterro）的方式被渲染，即一个内容需要被绘制到左眼和右眼的纹理中，这种渲染方式被称为立体渲染（Stereo-Rendering），本文将介绍几种立体渲染的方式，包括：Multi-Pass：左眼和右眼画面由两张纹理构成，并分别绘制左眼和右眼画面。这是最原始，兼容性最好的渲染方式，但拥有较差的性能。Single-Pass：左眼和
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
《脑机接口：意识数字化的奇点何时到来？》 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《脑机接口：意识数字化的奇点何时到来？》展开全景式论述。文章结合2025年最新科研突破与伦理实践，以“技术裂变-意识革命-文明跃迁”为逻辑主线，揭示神经科学与人工智能融合如何重绘人类存在的边界：脑机接口：意识数字化的奇点何时到来？副标题：从神经解码到意识上传，一场重塑人类本质的技术奇袭作者：意识
提名 Apache ShardingSphere Committer，说说方法
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统文章首发在公众号（龙台的技术笔记），之后同步到博客园和个人网站：xiaomage.info就在前几天，收到了ApacheS
报告下载丨北京大学：2025年DeepSeek在教育和学术领域的应用场景与案例（上）报告下载丨德勤：2025年生成式AI档案报告下载丨SuperCLUE 中文大模型基准测评 2025 智能计算研究中心人工智能
该报告全面探讨了DeepSeek在教育和学术领域的应用。DeepSeek在2024-2025年推出的模型引发国际关注，其通过提升推理能力、全量开源、降低成本及国产自主研发等优势，在教育行业推动了范式革命。报告涵盖了从学前教育到特殊教育的各个阶段，列举了高校如北京大学的学科专业问答工具、北大青鸟的实训平台等应用案例。为教育工作者提供了系统指导，有助于推动教育创新，培养适应AI时代的各类人才。
在股市中寻找志同道合的朋友 niuniu15816888 财经社交大数据
作为一名普通的股票投资者，我在这条路上已经走了五年。从最初的懵懂无知到现在能独立分析行情，我深深体会到：**投资不是一个人的战斗，找到志同道合的伙伴能让这条路走得更远**。今天，我想和大家分享一些我在投资社交中的真实感悟。一、为什么我们需要投资社交？记得刚开始炒股时，我总是一个人盯着K线图发呆。直到有一天，我在一个股票论坛上认识了几位同样喜欢研究新能源板块的朋友，我们组建了一个小群组。每周五晚上，
WPF 之 exe 单文件打包工具：LibZ 外来物种桌面软件 WPF C#
▪前言在VS开发过程中我们需要不断的编译软件并进行测试，同时VS会自动在项目跟目录的\bin\Debug文件夹里生成一系列文件（包括程序执行的主exe文件）。对于简单WPF程序，我们通常可以直接拷贝[ProjectSub]\bin\Debug下程序主exe文件就可以到其他机子使用了，当然前提是机子要已经装了对应的.NetFormework版本库但是有时候我们会在项目引入其他第三方库（非.Net框架
从性能优化赛到社区Committer，走进赵宇捷在Apache Fory的成长之路
ApacheFory是一个基于JIT和零拷贝的高性能多语言序列化框架，实现了高效紧凑的序列化协议，提供极致的性能、压缩率和易用性。在多语言序列化框架技术领域取得了重大突破，推动序列化技术步入高性能易用新篇章！这一切，都源自全球开发者对开源的热忱。今天，一起走近这些用代码编织跨语言数据之网的Committer～一、自我介绍您的全名：赵宇捷当前职位/角色：后端开发工程师主要领域/方向：金融加入社区/项
手车互联基本介绍车载开发手车互联手车互联车载应用
目前常用的手车互联功能有CarPlay，AndroidAuto，CarLife，HiCar，Carlink等，其中AndrodiAuto在国外用得比较多，国内目前是CarPlay和CarLife比较多，HiCar和Carlink是最近几年才有的，势头也很猛；本人从事车载开发10余年，参与过这些功能的开发和认证，以下从认证的角度给出难易程度，五星最难，CarPlay：☆☆☆☆☆AndroidAuto
长尾形分布论文速览【80-119】木木阳 Long-tailed 人工智能
为便于理解和应用，以下将30篇关于长尾分布的研究文献按主题进行分类整理。每一大类包含相应的工作，帮助我们从整体上把握各方向的研究进展。1.长尾半监督学习与伪标签优化Paper90:Uncertainty-awareSamplingforLong-tailedSemi-supervisedLearning提出了一种动态阈值选择方法（UDTS），能有效改善尾部分类性能，适用于不平衡类别的半监督学习。P
Spring的事务基础详解：从原理到实践的全面解析一切皆有迹可循 Java开发 spring 数据库 sql java 架构后端
前言事务管理是企业级应用开发中不可或缺的一部分，它确保数据操作的一致性和完整性。Spring框架提供了强大而灵活的事务管理机制，本文将深入探讨Spring事务的基础知识、实现方式及最佳实践。一、事务基本概念1.1事务的ACID特性原子性（Atomicity）：事务中的操作要么全部成功，要么全部失败一致性（Consistency）：事务执行前后数据保持一致状态隔离性（Isolation）：多个事务之
H264码流介绍及 FFmpeg解封装得到H264码流方法冰冰的coco 音视频 ffmpeg
参考文章音视频H264编解码协议-知乎视频H264编码详解（上）-知乎H.264媒体流AnnexB和AVCC格式分析-CSDNH264之NALU解析-知乎H264帧,SPS,PPS概念-知乎H.264流媒体协议格式中的AnnexB格式和AVCC格式深度解析-CSDNH264简介H.264从1999年开始，到2003年形成草案，最后在2007年定稿有待核实。在ITU的标准⾥称为H.264，在MPEG
Maven的概念与核心配置代码如疯. maven java
安装步骤：1、安装jdk2、从官网中下载对应的版本3、解压安装，然后配置环境变量，将bin目录添加到path路径下4、在命令行中输入mvn-v,看到版本信息表示安装成功3、maven的基本常识3.1maven如何获取jar包maven通过坐标的方式来获取jar包，坐标组成为：公司/组织（groupId）+项目名（artifactId）+版本（version）--GAV组成，可以从互联网，本地等多种
【Maven】Maven 新手全面入门指南，核心概念 maven安装配置优化，项目创建与项目结构介绍核心Maven命令夜雨hiyeyu.com java maven java spring boot 后端 gradle 系统架构软件构建
Maven新手全面入门指南一、Maven简介Mavenvs其他构建工具二、核心概念1.POM（ProjectObjectModel）2.坐标系统（GAV）3.依赖管理4.仓库（Repository）5.构建生命周期三、Maven安装与配置1.安装步骤2.配置优化（settings.xml）四、项目创建与结构1.创建新项目2.标准项目结构五、核心Maven命令基本命令进阶命令六、完整pom.xml示
成像光谱遥感技术中的AI革命：ChatGPT在遥感领域中的应用科研的力量人工智能 ChatGPT chatgpt 人工智能
课程将最新的人工智能技术与实际的遥感应用相结合，提供不仅是理论上的，而且是适用和可靠的工具和方法。无论你是经验丰富的研究人员还是好奇的从业者，本课程都将为分析和解释遥感数据开辟新的、有效的方法，使你的工作更具影响力和前沿性。遥感技术主要通过卫星和飞机从远处观察和测量我们的环境，是理解和监测地球物理、化学和生物系统的基石。ChatGPT是由OpenAI开发的最先进的语言模型，在理解和生成人类语言方面
SHELL/SSH基础知识（入门篇）-包含 shell 脚本语言的基本用法、 shell 脚本语言的基本用法、流程控制、函数 function、其它脚本相关工具、数组 array(欢迎留言交流) 云计算小曹同学正则表达式 centos linux 运维 ssh
目录1shell脚本语言的基本用法1.1shell脚本注释规范1.1.1shell脚本注释规范1.1.2执行（5种）1.1.3在远程主机运行本地脚本1.1.4检查shell脚本1.2shell变量1.2.1Shell中变量命名法则1.2.2变量赋值与引用1.2.3环境变量的查看设置和删除1.2.4只读变量1.2.5位置变量1.2.6退出状态码变量1.2.7展开命令行1.3退出状态码变量1.4展开命
从0开始的Linux基础定偶 linux 服务器数据库
一、Linux文件系统核心特性层级式倒置树结构，以根目录/为起点统一资源管理方式（文件=目录=设备=socket等）关键目录说明/bin系统基础命令/boot引导程序/dev设备文件/etc配置文件/home用户家目录/lib系统库文件/proc运行时信息/usr应用安装目录/var动态数据/mnt临时挂载点/media外设挂载点/sbin管理员命令二、目录操作指令核心指令集指令功能常用选项示例p
数据结构：递归：汉诺塔问题（Tower of Hanoi） 95号闪电麦坤数据结构数据结构
目录问题描述第一性原理分析代码实现第一步：明确函数要干什么第二步：写好递归的“结束条件”第三步：写递归步骤递归调用树问题描述有三个柱子（A,B,C），上面有n个大小不等的圆盘，最开始所有圆盘按从大到小顺序堆在柱子A上。目标：将所有圆盘移动到柱子C，移动时要满足：一次只能移动一个盘子；任何时刻小盘子不能压在大盘子上。❓核心问题：如何将n个盘子从A移动到C，同时只用B做辅助，且不违反约束？第一性原理分
Redis 集群与分布式实现：从原理到实战一切皆有迹可循 redis redis 分布式数据库后端缓存
前言在大数据与高并发场景下，单节点Redis的容量与可用性已无法满足需求。Redis通过集群与分布式技术，实现了数据的分片存储与高可用部署，成为分布式系统的核心组件。本文将深入解析Redis集群的底层原理、架构模式与实战经验，结合代码示例与最佳实践，帮助开发者构建高性能、高可用的分布式缓存系统。一、集群基础架构与核心原理1.数据分片机制Redis集群采用哈希槽（HashSlot）实现数据分片，共有
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
创意，创新，动手，懂我 waterHBO 创意来源编程创意
对于上面的聊天，请帮我写个文章来总结一下，这几个案例视频，分别讲了什么东西，启发启示是什么把新鲜新奇的地方，保存下来。语言简洁，凝练。不要啰嗦、不要重复。分结构，输出为md格式，请使用有序列表。其他要求：1语言幽默有趣，平易近人，有吸引力。2.用中文写。单独新建一个文件。3.请帮我分条理,看起来很清晰。AIApp创富三部曲：从灵感到现实的秘籍解析序言：你的下一个App，藏在浴缸、通勤路和与AI的对
【分析学】从有限开覆盖定理出发 -- 实数系完备性 BlackPercy 分析学数学高等数学
目录有限开覆盖定理实数系完备性定理确界定理单调有界定理闭区间套定理聚点定理柯西收敛定理有限开覆盖定理开覆盖定义：设{Ui}i∈I\{U_i\}_{i\inI}{Ui}i∈I是一个开覆盖，即[a,b]⊆⋃i∈IUi[a,b]\subseteq\bigcup_{i\inI}U_i[a,b]⊆⋃i∈IUi,称⋃i∈IUi\bigcup_{i\inI}U_i⋃i∈IUi为闭区间[a,b][a,b][a,b
提示技术系列——主动提示 AIGC包拥它提示技术人工智能 prompt python langchain
什么是提示技术？提示技术是实现提示工程目标的具体技术手段，是提示工程中的“工具库”。什么又是提示工程？提示工程是指通过设计、优化和迭代输入到大语言模型（LLM）的提示（Prompt），系统性提升模型输出质量（如相关性、准确性、可控性）的实践领域。它是一个覆盖全流程的方法论，包括：明确目标任务（如生成教学内容、问答、翻译）；设计提示结构（如指令、上下文、示例）；选择模型与参数（如温度、top_p）；
【ISAQB大纲解读】软件密集型系统的三大分类小马哥编程系统架构架构
软件密集型系统的类型划分为信息系统、嵌入式系统和移动系统，主要基于其应用场景、功能定位、硬件依赖程度及软件设计逻辑的显著差异。以下从三类系统的核心特征、典型场景及分类逻辑展开分析：一、软件密集型系统的定义与分类逻辑软件密集型系统指软件在系统功能实现中起决定性作用的系统，其分类本质上反映了不同场景下软件与硬件、业务需求的耦合方式。三类系统的划分依据包括：应用领域：商业办公、设备控制、移动交互等不同场
GO泛型编程面试题及参考答案大模型大数据攻城狮 go golang go泛型 go语法 go面试 go面经 go编译器
目录什么是Go中的泛型？Go从哪个版本开始支持泛型？在Go中如何定义一个带类型参数的函数？如何为结构体添加类型参数？使用any关键字和自定义类型约束有什么区别？泛型中～T的语义及其实际应用是什么？如何在函数中使用多个类型参数？举例说明。Go泛型支持变长参数（variadic）吗？如何结合使用？什么是约束（constraint）？如何定义一个自定义约束？在泛型中如何使用接口类型作为约束？compar
github简单入门梦花火开发环境 github ssh
github使用小小总结在这里并不讲述任何关于如何配置github的问题，这些东西，稍微百度一下就有，不具备写的价值。-question1:如何创建一个新项目？1.确认你本地的github已经配置完全（特别是密钥）ps:可以用[email protected]来验证密钥是否配置好。2.在github官网上开启一个新的空白的项目库（可以选择配置readme）3.如果是从头创建版本库，可以采用先克
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1