holmes_MX

深度学习图像分类（一）——AlexNet论文理解

0. 写作目的

好记性不如烂笔头。

1. 论文理解

1.1 ReLU 激活函数的使用

Rectified Linear Units(ReLU)

使用ReLU比使用tanh（或者sigmoid）激活函数收敛速度更快。下图来自AlexNet论文中给出的在CIFAR-10上的测试效果。可以看出ReLU收敛速度更快。

1.2 多GPU训练

只在特殊层进行GPU数据之间的交流。

例如：第3卷积层的Feature map全部来自于第2卷积层(即来自不同GPU)，但第4卷积层的Feature map只来自同一GPU的feature map.

相比只使用一个GPU进行训练，多个GPU信息交互，可以提高精度： 1.7%(top-1)。

1.3 Local Response Normalization (LRN)

文章说： LRN可以增加泛化能力。

由于后继的分类网络说，LRN效果并不是很好，所以后继的网络都未加入该层。因此这里简单介绍一下。

LRN即对于一个feature map（N个channel）的其中一个channel，将该层前后各n个channel对应位置的数值，然后进行归一化。具体可以看下面的公式：

其中， (x, y)是channel中的位置， i是第i个channel，n 是相邻的“前后”n 个channel数，N是该feature map总的channel数目（即边界channel的处理），实验中k = 2, n = 5, aerfa = 1e-4, belta = 0.75。参数是通过交叉验证得到的。

LRN的使用位置：使用在特征层的ReLU激活函数后。

文中给出的性能提升：LRN可以看做是一种“亮度的正则化（brightness normaliztion）”。因为作者并没有减去均值。

LRN降低1.4%的error rates （TOP-1），在CIFAR-10验证的效果是降低2% test error rate。

1.4 Overlapping Pooling

采用重叠池化。

采用的s = 2 (stride), z = 3, 可以降低0.4%（TOP-1）error rates与 s = 2, z = 2(正常的池化，即无重叠池化)。

作者发现：使用Overlapping Pooling 可以轻微地减少过拟合。

2. AlexNet网络

网络为： 5 conv + 3 fully-connect（输入层不算）

上图中： 150528 = 224 * 224 * 3

从上图看出： GPU进行交叉的层是：第3层、第6层（fc-1）、第7层（fc-2）、第8层(softmax)。

使用LRN层的是：第1卷积层和第2卷积层， ReLU之后。

MaxPooling层：在第1卷积层、第2卷积层和第5卷积层后。

ReLU应用在每个卷积层和全连接层后（除了最后一层）。

实际的网络为：给出基于tensorflow的AlexNet（未使用多个GPU）

并附上AlexNet的代码

import os
import keras
import tensorflow as tf

def print_Layer(layer):
    print(layer.op.name, ' ', layer.get_shape().as_list())
tf.reset_default_graph()
    
def AlexNet():
    input = tf.keras.Input( shape=(224, 224, 3), name='alexNet_input' )
    print_Layer(input)
    
    ## conv1
    conv1 = tf.keras.layers.Conv2D( filters=96, kernel_size=(11,11), strides=(4,4), padding='same', activation=tf.nn.relu, name='conv1')(input)
    print_Layer(conv1)
    x = tf.nn.local_response_normalization( conv1, depth_radius=5, bias=1, alpha=1, beta=0.5, name='LRN-1')
    print_Layer(x)
    
    ## MaxPool
    maxpool1 = tf.keras.layers.MaxPooling2D( pool_size=(3, 3), strides=(2, 2), padding='valid', name='MaxPool1' )(x)
    print_Layer(maxpool1)
    
    ## conv2
    conv2 = tf.keras.layers.Conv2D( filters=256, kernel_size=(5,5), strides=(1,1), padding='same', activation=tf.nn.relu, name='conv2' )(maxpool1)
    print_Layer(conv2)
    x = tf.nn.local_response_normalization( conv2, depth_radius=5, bias=1, alpha=1, beta=0.5, name='LRN-2')
    print_Layer(x)
    
    ## MaxPool
    maxpool2 = tf.keras.layers.MaxPooling2D( pool_size=(3, 3), strides=(2, 2), padding='valid', name='MaxPool2' )(x)
    print_Layer(maxpool2)
    
    ## conv3
    conv3 = tf.keras.layers.Conv2D( filters=384, kernel_size=(3,3), strides=(1,1), padding='same', activation=tf.nn.relu, name='conv3')(maxpool2)
    print_Layer(conv3)
    
    ## conv4
    conv4 = tf.keras.layers.Conv2D( filters=384, kernel_size=(3,3), strides=(1,1), padding='same', activation=tf.nn.relu, name='conv4')(conv3)
    print_Layer(conv4)
    
    ## conv5
    conv5 = tf.keras.layers.Conv2D( filters=256, kernel_size=(3,3), strides=(1,1), padding='same', activation=tf.nn.relu, name='conv5' )(conv4)
    print_Layer(conv5)
    
    ## MaxPool
    maxpool3 = tf.keras.layers.MaxPooling2D( pool_size=(3, 3), strides=(2, 2), padding='valid', name='MaxPool3' )(conv5)
    print_Layer(maxpool3)
    
    ## flatten
    flat = tf.keras.layers.Flatten(name='Flat')(maxpool3)
    print_Layer(flat)
    
    ## fc-1
    fc1 = tf.keras.layers.Dense( units = 4096, activation=tf.nn.relu, name='fc1' )(flat)
    print_Layer(fc1)
    
    ##fc-2
    fc2 = tf.keras.layers.Dense( units = 4096, activation=tf.nn.relu, name='fc2' )(fc1)
    print_Layer(fc2)
    
    ## output
    predict = tf.keras.layers.Dense( units = 1000, activation=tf.nn.softmax, name='predict' )(fc2)
    print_Layer(predict)
    
    return predict

AlexNet()

3. 训练的细节

3.1 降低过拟合

（1）数据增强 Data Augmentation

第一种是：图像变换和水平镜像。

训练时：从256*256的图像中，先进行，crop 224 * 224的图像。

测试时：从图像中，crop 224*224的图像（10个， (four corner + center) * 2）镜像的结果，将10个结果取softmax输出结果的均值。

第二种是：改变RGBchannel的强度。

对每个训练图像，先使用PCA（主成分分析）求出特征值和特征向量（以RGB为特征，将图像看成一维的，然后计算），然后在特征值上乘以一个随机数，再将修改后的特征值与特征向量相乘，得到RGB channel强度变换后的值。随机数的产生：均值为0，方差为0.1的高斯随机数。

（2） Dropout

结合多个模型的预测结果是降低test errors的好方法，但是太耗时间，因此使用Dropout来降低过拟合。

Dropout可解释：每次训练时都是不同的网络（由于Drop的点不一样）；降低不同神经元之间的联系。

训练时，在两个全连接层使用Droptout( 0.5 )。测试时，计算所有神经元，但是结果*0.5.

3.2 训练参数

SGD + batch_size(128) + momentum (0.9) + weight decay (0.0005)

发现weight decay 对模型的学习很重要。不仅仅是正则化，也降低了test errors.

权重更新公式：

权重的初始化：均值为0的方差为0.01的高斯分布。

bias: 第2,4，5卷积层和全连接层初值为1，其他层为0。

当val loss不再下降时，将学习率除以10.

学习起始值为0.01，训练过程中修改了3次。

大概训练了90个epoch。

There may be some mistakes in this blog. So, any suggestions and comments are welcome!

[Reference]

AlexNet论文：http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

你可能感兴趣的:(深度学习,AlexNet论文解析,图像分类,Classification,图像分类训练细节)

你喜欢阔少,我暴露家产你哭什么!全集txt,苏烨vs秋迟全文阅读百鸣文库
你喜欢阔少,我暴露家产你哭什么!全集txt,苏烨vs秋迟全文阅读简介：故事中的主角是苏烨秋迟徐昊，本书考据严谨，细节翔实，全文讲述我爸：做水果生意赚了点外快，给你打个五百万！舍友：你爸卖水果给你打五百块生活费？穷鬼！我：你想什么我都可以买给你，钱我还是有一点的！前女友：你只有一点钱，还好意思在我面前装阔，恶心！书名：你喜欢阔少，我暴露家产你哭什么！主角：苏烨,秋迟车是李悦然和蔡敏敏提前叫好的出租车
顶级复刻手表哪里买靠谱,推荐6个渠道给大家高端顶级复刻手表大厂货源
高仿手表是一种仿制历史经典手表的产品，它们在外观和功能上与原版手表相似，但价格更加实惠。在市场上，有许多不同的复刻表品牌和型号，让消费者难以选择。宏杰腕表写这篇文章就是给大家介绍最值得入手的高仿手表，并从品牌、质量、市场需求等方面进行分析，宏杰腕表为消费者提供有价值的入手建议。加微信【515557529】了解更多细节，做工，机芯，会让你从一个小白跃升手表达人，更多精致手表等你来品鉴哦.下面宏杰腕表
情感主播培训有哪些项目，说说我的经历糖葫芦不甜
作为一名从情感主播培训中走出来的“新人”，我想分享一些我所经历的培训项目以及这段经历如何塑造了我。5星公会，免费加入，一对一指导扶持↓微信在文章底部。培训的第一步，是从理论根基开始。我们系统地学习了情感解析的技巧，包括如何识别不同情绪背后的深层需求、理解人际关系的动态变化等。作为主播，声音是我们最直接的“武器”。培训中，我们接受了专业的声音训练，包括发音技巧、语调控制、情感融入等，旨在通过声音传递
数据仓库是什么，一文读懂数据仓库设计步骤 Leo.yuan 数据数据仓库大数据人工智能数据库信息可视化
目录一、数据仓库：干啥用的？1.数据仓库是啥？2.数据仓库有啥大用？二、设计之前：准备啥？1.搞清楚业务要啥2.摸清数据家底3.划好仓库边界三、概念设计：搭框架1.定好主题域2.分清维度和事实3.画出概念模型四、逻辑设计：定细节1.设计维度表和事实表2.想好怎么存数据3.定好安全规矩五、物理设计：落地实施1.选好数据库软件2.优化数据库性能3.部署上线六、实施与测试：跑起来1.ETL：灌数据2.全
京东内部优惠券怎么领？京东怎么找内部优惠券？氧惠评测
京东内部优惠券的领取方式多样，以下是一些主要途径和具体步骤：月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。金珊
细节决定成败，态度决定高度欣悦随想
周国平说过：“凡做成大事的人，往往做小事也认真。而做小事不认真的人，往往也做不成大事。”这就是细节决定成败，态度决定高度。你对细节的态度，决定了你的人生。瓦特看祖母做饭，发现蒸汽把水壶盖顶开，就连续几天细心观察，最终明白壶盖跳动的推动力就是水蒸汽。瓦特意识到了蒸汽的力量，引发了兴趣。多年以后成了蒸汽机发明家。细节的成功看似偶然实则必然，注重细节是一种能力。所有的大事都是从简单的细节做起的。细节，能
微信二维码扫描登录流程详解黑塞123 QT 二维码登录流程
二维码扫描登录流程细节（项目经验）1：获取二维码信息PC会优先存放服务器生成的唯一密钥：比如source、secret以密文形式存储大致发送字段：sourcesecretmac(mac地址)服务器生成二维码信息：二维码字符、二维码过期时间、二维码状态。并将mac与二维码信息绑定后2：获取二维码状态、校验二维码是否过期客户端解析二维码信息生成二维码开启定时器1:轮询检测二维码过期时间（二维码过期暂停
按时写作|2021-04-17 格莱在创作
旷野上的风和老人.jpg（哈哈，声明一下：所有在发布的图片均为格莱诺本人的摄影作品）按时写作是一种训练方式，是通往作家之路的一种办法。就像是人们常说的那样，要想成为作家，你就要天天写，要想成为画家，你就要天天画。是的，每天都要按时写作，成为习惯，结合不断的输入，水到渠成的那天便是指日可待。按时写作是自己生活的笔记，是用来保存记忆场景、对话，以及为自己的创作埋下种子，还有训练文笔流畅，提升思辨力等等
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
《如何想到又做到》：实现持久性改变，只需做到这两个步骤莱雪思
在生活中，你是否会遇到这样的问题：想要改变自己的饮食习惯，制定了营养计划，一个星期后，却忍不住吃烧烤、喝啤酒；想要执行新年伊始制定的阅读计划，一年过去了，却一本书都没看完；想要提升自己的专业技能，报名参加了许多训练营，却无法坚持每天打卡、完成作业……于是，原本制定的改善身体健康状况、提升职场能力、打造个人品牌等目标，都没有实现。你或许会很苦恼，为什么你总不能把想做的事情，坚持做下去呢？美国加州大学
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
靠运动减肥的我看到这个，吓了一大跳～可信赖的大睡魔
以前总听说减肥，3分靠练，7分靠吃，一直没用太多的感触，今儿算是领会到了～比如晚上打算吃这个火锅，看了下热量表，吓了一大跳，火锅底料2000千焦，差不多500多千卡热量，再加上里面的配料，1000千卡热量。相当于什么？图片发自App今天早上我跑了80分钟才消耗了600多千卡热量～相对于我得跑20公里？图片发自App吓得我赶紧放下了火锅，拿起来酸奶图片发自App还是这个省心点儿吧～减肥，就是要从细节
每日复盘Day53 米果果教育张滢
10月7号复盘图片发自App米果果教育张滢【每日目标】每天三目标1.早起、早餐✅2.英语学习作业打卡✅3.赢效率手册和总结笔记✅【每日早起】6:30(今天6点醒来，起床后晨跑，好久没晨跑感觉好棒)【每日学习】萌姐英语课《第40课》；樊登读书会《运动改造大脑》【每日关爱】晨跑、一组减脂训练、胶原肽果饮、水光疗套装图片发自App图片发自App【每日成就】早上比计划早起，老妈在也不担心早饭，花30分钟晨
《用生活常识就能看懂财务报表》上勇子杨
本书一共四章，第一章主要是描述了一个基本的概念--财务报表不能单看一张，管中窥豹；一个方法：看懂全貌即可不必究细节；同时介绍了会计师审核意见。一、基本概念刚开篇就是一个换位思考，针对一个公司同时存在盈利和亏损的两个业务，急需用钱时是卖掉赚钱的还是先卖掉亏钱的？从个人投资角度和企业经营的角度可能会得到不同的答案。而财务报表作为一个企业经营的成绩单，只有我们对其有足够的认识才能在投资（私事）和经营（公
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
YXG362～037抓复习的方法丁妞森娃
没有一种知识是不需要复习巩固的，没有一种能力是不需要反复训练的。第一条日常进行知识性复习第二课时新授前要复习第一课时的内容，复习朗读、词、多音字、复习概括、分段。第二篇课文的第一课时先复习上一篇课文的要点。一个单元上两个星期，上星期学的内容到下一星期也要复习，一周一次基本知识的过关要形成惯例，小步子的小复习走得扎实，大步子的复，中后等学生跟不上。第二条单元进行整理性复习。一个单元结束后，复习主要依
股票模拟交易训练日志(427) 黄鸿昊
目标:100万1.12883.1650000股2.93>2.962.9988203300股110>1143.11867.3630000股5.42>5.444.16680.75200000股0.64>0.625.3904.1297000股4.73>4.8剩下:26250今天港股开半天，但已买进两只股票。因为本身就持有相同的，但仍看之后的走势。现在还是集中精力在写毕业论文上，股票的话，希望也能更进一步
C程序设计语言 cvcode吴 c语言开发语言
1.入门学习一门新程序设计语言的惟一途径就是使用它编写程序。对于所有语言的初学者来说编写的第一个程序几乎都是相同的，即:请打印出下列内容hello,world尽管这个练习很简单，但对于初学语言的人来说，它仍然可能成为一大障碍，因为要实现这个目的，我们首先必须编写程序文本，然后成功地运行编译，并加载、运行，最后输出到某个地方。掌握了这些操作细节以后，其它事情就比较容易了。在C语言中，我们可以用下列程
AI产品经理面试宝典第45天：AI应用设计与伦理隐私问题应对指南 TGITCIC AI产品经理一线大厂面试题产品经理 AI面试大模型面试 AI产品经理面试大模型产品经理面试 AI产品大模型产品
如何提升AI产品的用户体验？问：如何提升AI产品的用户体验？答：用户体验优化需从三个维度突破：数据质量、交互逻辑、反馈机制。首先确保训练数据覆盖真实场景长尾需求，例如智能客服需采集方言、行业术语等特殊语料。其次设计渐进式交互路径，如医疗影像诊断产品采用"一键初筛-人工复核-历史对比"三段式流程。最后建立动态反馈闭环，通过埋点采集用户行为数据，结合A/B测试持续迭代模型输出结果。专业指导此题考察产品
泽平的ScalersTalk第七轮新概念朗读持续力训练Day 394 20220420 郑泽平
练习材料：L44-3:SpeedandcomfortForafewhours,yousettlebackinadeeparmchairtoenjoytheflight.Therealescapistcanwatchafilmandsipchampagneonsomeservices.Butevenwhensuchrefinementsarenotavailable,thereisplentytok
微软CEO Satya Nadella提出AI重构法则：从范式跃迁到社会盈余 TGITCIC AI-大模型的落地之道 AI大模型大模型AI AI Agent AI智能体 AI落地大模型落地
1.范式跃迁：AI作为第四次技术革命的核心驱动力1.1技术代际的复合效应从客户端到互联网、移动互联网再到云计算，技术平台的演进始终遵循“平台变革→产品跃迁→反哺平台”的螺旋上升逻辑。AI的特殊性在于其叠加了前三代技术的基础设施能力：云计算：提供百亿级参数模型的分布式训练能力互联网：构建全球数据流动与反馈闭环移动终端：扩展AI服务的触达边界技术范式核心特征代表产品对AI的支撑作用客户端本地化计算Wi
LangChain 源码剖析（二）：LangChain 流程编排的核心骨架——Chain 基类源码剖析 ATM006 人工智能 langchain 大模型 Agent
每一篇文章都短小精悍，不啰嗦。在LangChain框架中，Chain是连接各种组件（模型、工具、数据库等）的核心骨架，负责将多个步骤按逻辑串联成可执行的工作流。无论是简单的「提问-回答」流程，还是复杂的「检索-思考-工具调用」pipeline，都依赖Chain基类提供的基础能力。本文将从架构设计、核心功能到实现细节，全面解析这一基类的设计智慧。一、架构定位：为什么需要Chain基类？Chain基类
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
20220812成就感日志225/365 kidII
奋斗是人生的底色，你会经历很多人事物，学会更多的东西。从学习上掌握技能，从学习上享受生活，即便是辛苦也没有关系，生活没有不辛苦的，但是要辛苦的有意义。与其说平凡的过一辈子，不如吃苦耐劳，选择自己喜欢的生活，一点点的付出，积累很多的经验，未来才会有希望。虽然我们渴望成就感，但也需要平衡生活，让自己越来越幸福。1.【日思】：今日最重要的一件事情。调整（训练3h，4k+2h信息1+1.5h信息2+自私的
2021年1月15日星期五天气阴亲子日记（771） love_happy
昨晚和豪宝做了几道必读书目的阅读题，感觉读过的他能记住，没读的就不会，今天考试正好有阅读题，虽然都读过了，但是有些细节的问题，还容易弄混，不确定，趁考试前还有几天的时间，想再略读一遍，顺便练习一下题目，必读书目考察的题目不多，但是也不能大意丢失了分数……今晚豪宝陪妹妹玩扑克，玩弹珠，游戏规则都是豪宝说了算，小柔不会玩，只能听哥哥的，赢的人可以吃一小块糖。一块糖吃过之后，还可以发挥想象，再利用一下，
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
*SFT深度实践指南：从数据构建到模型部署的全流程解析大千AI助手人工智能 Python #OTHER 人工智能深度学习算法大模型 SFT 微调 Lora
一、SFT技术原理与定位核心定义SFT是在预训练语言模型（如LLaMA、GPT）基础上，利用标注数据优化模型以适应特定任务的技术。其本质是通过调整模型参数，将通用语言能力迁移至专业领域（如法律、医疗）或任务（如对话生成、代码补全）。与预训练的区别预训练：使用无标注数据（如维基百科）学习通用表征，消耗千亿级token算力。SFT：使用标注数据（如指令-答案对）进行任务适配，成本仅为预训练的1/100
复刻劳力士日志哪个厂的好(这10个厂家一定要知晓) 潮品会
劳力士日志作为劳力士品牌旗下的经典之作，一直以来都备受表迷喜爱。然而，高昂的价格让许多喜爱它的人望而却步。幸运的是，市场上出现了许多复刻劳力士日志的厂家，它们以优质的产品和服务，让更多人有机会拥有这款经典之作【重要提醒】文章最下面有联系方式将为您介绍十家顶级复刻劳力士日志厂家，让您感受它们为您带来的美好时光。1.C厂C厂作为劳力士复刻表领域的佼佼者，以其卓越的工艺和完美的细节闻名于世。其产品几乎覆
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他