hehehe2022

2022李宏毅机器学习深度学习学习笔记第四周--Self-Supervised Learning

文章目录

- 前言
- Self-Supervised Learning
- 什么是Self-Supervised Learning
- Masking Input
- Next Sentence Prediction
- BERT如何使用
- 为什么BERT 有用呢？
- Multi-lingual BERT 多语言BERT
- GPT
总结

前言

本文要讲的是Self-Supervised Learning自监督学习，首先列举了Self-Supervised Learning的模型有哪些，再通过与Supervised Learning对比讲解了什么是 Self-Supervised Learning，通过四个例子具体讲了BERT怎么用以及为什么BERT有用，最后讲了自监督学习的另外一个模型GPT。

Self-Supervised Learning

模型介绍：
ELMo(Embeddings from Language Models)
BERT(Bidirectional Encoder Representations from Transformers)
ERNIE (Enhanced Representation through Knowledge Integration)
Big Bird(Transformers for Longer Sequences)

什么是Self-Supervised Learning

Supervised Learning就是有一个model，输入是x，输出是y，要有label（标签）才可以训练Supervised Learning，比如让机器看一篇文章，决定文章是正面的还是负面的，得先找一大堆文章，标注文章是正面的还是负面的，正面负面就是label。Self-Supervised Learning就是机器自己在没有label的情况下，想办法做Supervised Learning。比如把没有标注的资料分成两部分，一部分作为模型的输入，一部分作为模型的输出，模型的输出和label越接近越好。

Masking Input

“完形填空”
BERT的架构和Transformer 的Encoder 一样，一般用在自然语言处理上。BERT的输入是一串文字，将文字的一些部分随机盖住，所谓的盖住具体有两种方法，一种就是将句子中的某个字换成一个特殊的符号mask或者另一种做法就是随机把某一个字换成另外一个字，盖住部分的输出乘一个矩阵，做softmax得到一个输出，BERT学习的目标就是输出和湾字越接近越好。

Next Sentence Prediction

拿出两个句子，句子中加一个特殊的符号代表分隔，如下图，当做BERT的输入，只取CLS的输出乘上一个矩阵，做二元分类问题，两个句子相接则为yes，否则no；但是这个方法不是很有用，可能是太简单了。
我们现在训练的BERT模型其实只会做2件事情：Masked token prediction：预测盖住的词是什么。Next sentence prediction：预测两个句子是不是前后接起来的。
BERT不止做填空和句子连接，也可以被用在Downstream Tasks(一些我们真正在意的任务，需要一些标注资料)下游任务，BERT可以分化成各式各样的任务，这件事叫做fine-tune，产生BERT的过程叫做pre-train预训练。

想测试Self-Supervised Learning模型的能力，会把它测试在多个任务上，最知名的任务集叫做GLUE（具体如下图，有九个任务）想知道BERT训练出来的模型好不好，把它作用在九个任务上，看平均正确率是多少，代表了Self-Supervised Learning模型好坏。

黑线代表人类在这个任务上的正确率为1，每个点代表了一个任务，蓝色的虚线代表GLUE分数的平均。可以看到在某些任务上BERT及其改良模型已经超过的人类。

BERT如何使用

例一
比如，输入一个句子，输出类别，判断一个句子是正面还是负面问题。
BERT没法凭空解决句子分析的问题，还需要提供一些标注资料（提供大量句子，每个句子是正面还是负面）才能够训练BERT的模型。linear部分的参数是随机初始化的，BERT的初始参数是把可以做填空题的BERT的参数拿来当做初始化的参数。

例二
输入一个序列，输出同样长的序列，比如POS tagging词性标注。

BERT处理词性标注的问题，输入三个字，每个字对应一个输出向量，把三个输出向量分别做linear transformer乘上一个矩阵，在做softmax判断属于哪一个类别，BERT本体的参数不是随机初始化的参数。
例三
输入两个句子，输出一个类别，在这里举自然语言处理的例子，机器要做的事情就是判断前提和假设是否矛盾。
BERT对这个问题的处理，给它两个句子，句子中间用SEP分隔开，只取CLS的输出，丢到linear transformer（乘一个矩阵）里面，决定输出类别（判断两个句子是否矛盾）
例四
做一个问答系统（QA），即给机器一篇文章，问一个问题，机器会给你答案。

输入有文章和问题，把输入丢到QA模型里面,如上图，输出两个正整数s,e，表示从文章的第S个字到第e个字串起来就是正确答案。把文章和问题用SEP隔开作为BERT输入，如下图，需要从头开始训练的东西只有两个向量，两个向量的输出和BERT的输出长度是一样的，把橙色的向量和文章的输出向量做inner product，算出三个数值，做softmax得到三个数，d2对应的向量得到的分数最高，那么s=2，起始位置为2。

蓝色部分代表答案结束的位置，蓝色向量和对应的每个黄色向量做inner product，算出三个数值，做softmax得到三个数，d3对应的向量得到的分数最高，那么e=3，结束位置为3。正确答案就是d2 d3。

BERT 一般pre-trainingEncoder ,也有办法pre-training decoder。
给encoder的输入故意做一些扰动弄坏，decoder的输入希望跟弄坏前的结果一样。弄坏的方法有mass（把一些地方盖起来）、把词汇的顺序弄乱等等。

为什么BERT 有用呢？

输入一串文字，对应的输出向量我们叫它embedding，这些向量代表了输入的字的意思。

上面说的代表字的意思就是假设把向量划出来，发现意思越相近的字，他们的向量就越接近。很多语言都有一字多义的问题，BERT可以考虑上下文，同一个字，上下文不同，它的向量embedding也不同。
假设考虑果这个字，比如喝苹果汁，苹果电脑都就到BERT里面，计算每个“果”所对应的embedding，计算两个果之间的相似度。

值偏黄色算出来的值越大，所以自己和自己的相似度最高，对角线为黄色的，前五个果的相似度比较高，后五个果的相似度比较高，前五个果和后五个果的相似度就比较低。
一个词汇的意思可以从它的上下文中看出来，BERT可以从上下文中抽取资讯来预测W2，如下图，像这样的想法在BERT之前就已经有了，叫Word embedding，所以BERT抽出的向量又叫contextualized word embedding。

Multi-lingual BERT 多语言BERT

神奇之处在于拿英文的QA的资料去做训练，它自动就会学做中文的QA的问题。

在没有BERT之前，最强的问答模型叫QANet，正确率只有78.1，如果用BERT在中文上学会做填空题，在中文的QA资料上做fine-tune ，测试在中文的问题上，正确率只有89.1，如果是多语言的BERT，fine-tune在英文上，测试在中文上也有78.8的正确率。

GPT

Self-Supervised Learning除了BERT还有GPT系列的模型，BERT做的是填空题，GPT做的是预测接下来的token是什么。
举例，训练资料的句子是台湾大学，输入begin of sentence，GPT输出一个embedding,预测下一个出现的token“台”，详细来看就是有一个embedding(h1表示)通过一个linear transform，再通过softmax，得到一个结果。

后面是一样的，给“台”，预测出“湾”，“湾”预测出“大”

假设要GPT模型做翻译
给它一段描述，告诉他要做翻译，给出几个例子，让他直接翻译出结果，这个叫做“Few-shot” Learning,但它和一般的“Few-shot” Learning不一样，完全没有调参数的意思，所以叫“In-context” Learning,不做gradient descent；只看一个例子就知道要做翻译这件事叫“one-shot” Learning，直接叙述说要做翻译就看懂的叫“Zero-shot”Learning。

测试了42个任务，纵轴是正确率，三条实线是42个任务的平均正确率，分别代表了Few-shot、one-shot、Zero-shot，横轴代表了模型的大小。

Self-Supervised Learning不只可以用在文字上，在图像上、语音上也可以使用。

总结

通过学习了解了什么是自监督学习，是无监督学习里面的一种，主要是希望能够学习到一种通用的特征表达用于下游任务 (Downstream Tasks)。其主要的方式就是通过自己监督自己。对于BERT来讲，其自监督训练的部分就是训练 BERT 做简单的填空题，训练好之后的BERT具有了 Word Embedding 的能力，且这里的 Word Embedding 是可以自动地考虑上下文的。这样的预训练好的 BERT 模型，只需要少量的带标签数据集，就可以在无数下游任务 (Downstream Tasks) 中完成微调 (Fine-tune)，得到一个个不同的适用于下游任务的性能卓著的model。

你可能感兴趣的:(深度学习,机器学习,学习)

2019-01-11 Anne玉
姓名：周玉霞六项精进：327期反省二组公司：浙江意威服饰【日精进打卡第424天】【知~学习】《六项精进》0遍共451遍《六项精进》通篇共18遍《大学》1遍共506遍《静思语》0遍共109遍【经典名句分享】至乐莫如读书至要莫如教子【行~实践】一、修身：喝红糖水、蜂蜜水，好好喝药二、齐家：家和万事兴，扫地三、建功：督促、辅导孩子写作业｛积善｝：每天行善，做善事不分大小；【省～觉悟】1.爱出者爱返，福往
IM即时通讯源码/im源码基于uniapp框架从0开始设计搭建在线聊天系统宠友信息 uni-app mysql spring boot java 小程序
文章目录前言一、确定技术栈二、数据库设计：1.引入库2.使用SpringBoot创建后端项目3.实现WebSocket通信：3.1创建WebSocket配置类：3.2创建ChatWebSocketHandler类：3.3前端WebSocket连接与通信：总结前言随着人社交产品的不断发展，即时通讯聊天这门技术也越来越重要，很多人都开启了学习通讯技术，本文就介绍了即时通讯的基础内容。一、确定技术栈在开
从零开始学 Linux：循序渐进的学习指南我爱学嵌入式 Linux基础 linux 服务器
Linux作为一款开源、稳定且安全的操作系统，在服务器领域、嵌入式开发、云计算等场景中占据着举足轻重的地位。对于程序员、运维工程师或IT爱好者而言，掌握Linux技能已成为一项核心竞争力。但面对命令行界面和复杂的系统架构，很多初学者往往感到无从下手。本文将为你梳理一条清晰的Linux学习路径，助你从入门到精通。一、明确学习目标：为什么学Linux？学习Linux前需明确目标，不同目标对应不同的学习
中原焦点团队第29期第75天分享20211010 简单蜗行
看见不一样，才能做到不一样。“横看成岭侧成峰。”每件事情从不同的角度看，所见到的面也就不一样。这也是学习有魅力之处，让我们见到了自己没有想到的点，看到了事情的另一个面。越学习，认知越开阔，做事的弹性也会越大。今日听课的新认知：当一个人对周围的人挑剔的时候，一定是对他自己最不满意的时候，所以才会向外挑剔。当一个人受挫自卑的时候，他才会退行到孩子的状态。连要求都不敢向孩子提的家长，是家长的失职。拒绝孩
有所思之干货vs水货勤劳的farmer
许久没有开始敲钱盘写写自己最近的心得和感悟啦！刚好这两天的感悟蛮多的，所以写写。最近高能的冼姐邀请我加入南宁演讲群，一起成长学习，期间也单独找我聊着，鼓励我去霸占舞台，突破自我！在群里看到群友对冼姐的称呼是“冼主席”，还有每次冼姐发的活动文案感觉每次都是非常的用心的表达自己，帮助别人！能量超级强！只讲重点！！也讲到了会拖着我前进，期间给我说了一句话让我印象深刻：“人生不疯几次，怎么能做的了大事呢？
Python学习笔记 cherishSpring python python 学习笔记
目录一、名词解释二、数据类型（变量名无类型，变量值有类型）三、数据类型转换(万物皆可转字符串)四、标识符五、运算符六、字符串扩展七、数据输入八、if语句九、while语句十、for循环语句十一、函数十二、数据容器1、List列表2、tuple元组3、字符串4、序列的常用操作-切片5、set集合6、dict字典7、数据容器相互转换8、通用操作十三、文件编码一、名词解释1、字面量被写在代码中的固定的值
2019-02-20简单记录请叫我王青羽
近一周过得很充实，带娃去园博苑，见了朋友，学习培训，孩子开始新学期的学习，时间紧迫而充实；01.园博苑周六带去园博苑，我来厦门十年也是第一次到园博苑游览（我本是个不爱出门的人），走走停停，看看植物观察建筑；从南门走到北门，从早上十点到下午两点，中间休息几次吃个午饭，柳小宝基本全程自己走；跟他的小玩具合影身处自然的环境中让人身心舒畅，惊觉自己对自然.建筑.历史了解太少，没法跟孩子做更多的延展，只能挑
【记录】2017.7-2018.7复盘杨帆_c4ea
keene草莓杨2017目标：踏入直销行业（有平台发展快且好）营养讲师（热爱营养学）有自己的团队一起拼搏（让更多人了解营养知识拥有保健意识实现财务自由荣誉感）一年期间我想要关于职业和学习上面的提升想要生活上自己保障自己@职业（一年期间）汤臣倍健1.能门诊顾客（了解保健品中药西药人体解剖学）2.能拿起话筒（每天天看小汤网络讲师课程学习技巧有上台机会一定要上丢人没事经历一场是财富）3.情商与逻辑思维能
2022-6-29晨间日记 645e2ce505ed
今天是什么日子：今天是6月29日起床：5点50分就寝：22点天气：雨心情：好纪念日：叫我起床的不是闹钟是梦想年度目标及关键点：在头条突破千粉。本月重要成果：今日三只青蛙/番茄钟成功日志-记录三五件有收获的事务一、每天写一篇日记。二、听书学习，了解中国文化历史背景。三、运动锻炼。财务检视人际的投入曾子曰：“吾日三省吾身，为人谋而不忠乎？与朋友交而不信乎？传不习乎？”能够以曾子的为人处事方式为座右铭，
OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
linux如何使用jstack分析线程状态 ycllycll linux
在高并发，多线程环境下的java程序经常需要分析线程状态，本本是一个分析步骤无具体讲解（具体命令可自行google学习）一般流程：1.使用jps-l查看有哪些java程序在运行2.使用top查看步骤1中进程号（pid或者vmid）所占用cpu以及内存情况（或者省略步骤1）3.使用top-Hppid查看具体该pid下各个线程所占用的cpu情况（进程下的线程有一个nid，后面需要用到）4.使用jsta
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
2019-02-07 我心依旧_79e2
【六项精进打卡】2019.2.7日姓名：陈岗企业名称：上海孚因流体动力设备股份有限公司打卡第289天【知~学习】《六项精进》3遍,共738遍《大学》1遍，共580遍【经典名言名句分享》富贵不淫贫贱乐，男儿到此是豪雄。修身：（对自己个人）有理想的地方，地狱就是天堂，有希望的地方，痛苦也成快乐。1每天坚持诵读《六项精进》和《大学》。2学会宽恕他人，同时从错误中吸取教训。3每天中午睡十五分钟。二、齐家：
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制王莽v2 机器人神经网络神经网络算法控制器
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制摘要本文研究了在水平面内运动的全驱动自主水下机器人的轨迹跟踪问题。在我们的控制设计中考虑了外部干扰、控制输入非线性和模型不确定性。基于离散时间域的动力学模型，两个神经网络(包括一个临界神经网络和一个作用神经网络)被集成到我们的自适应控制设计中。引入临界神经网络来评价设计的控制器在当前时间步长内的长期性能，并利用作用神经网络来补偿未知动
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
深圳从心开始365心理咨询顾问深圳从心开始心理咨询
365心理顾问是什么？“365心理顾问”以“幸福人生，从心开始”为宗旨，依托香港、内陆两地优秀心理学师资队伍（1000余名执业心理咨询师），针对团体和个人常见的个性发展和人格完善、生活学习及职业发展、婚恋及家庭关系的处理、亲子教育、人际交往、情绪调节等主题开发出一套完备的心理支持系统，为团体及个体的心理建设提供一整套优秀的解决方案，为用户的心理成长提供全方位的支持。365心理顾问费用？365心理顾
相见恨晚田家浪子
“你有一张陌生的脸，到今天才看见……”彭佳慧还不甚出名的时候，我就知道了她。那个时候，我迷恋的是路绮欧，一个YY的主播。后来，彭佳慧真的火了起来，特别是那首《走在红毯那一天》。只是，在那个时候，我就再也不敢听彭佳慧的《相见恨晚》这首歌了。最开始接触这首歌的时候，是因为一个女孩，一个最熟悉却又最陌生的女人。那年大二，正是精力无限，美好的光阴不知道怎么去消磨的时节。除了学习之外，男孩子发泄精力的方式，
《MyBatis的运行原理》
一.MyBatis是什么？MyBatis是⼀个开源、轻量级的数据持久化框架，是JDBC和Hibernate的替代⽅案，MyBatis内部封装了JDBC，简化了加载驱动、创建连接、创建statement等繁杂的过程，开发者只需要关注SQL语句本身。二.MyBatis执行流程1.MyBatis与JDBC想要学习了解MyBatis，我们首先需要从JDBC入手并立足于JDBC，才能深入的理解MyBatis
日精进D29/1000 简尼2020
健康：腹部运动、5公里户外跑不管做什么运动，都比一睁眼就投入学习更可取。家庭：拥抱家人、交流、聊聊孩子的趣事陪孩子读了三篇成语故事。（可以找一个本子和孩子一起记下来每天的进度，是不是更增加仪式感呢）昨晚睡得稍晚点，因为权衡时间有难度。花在读书上的时间有多少？有多少时间可以用来做其他事情？没有计算好。工作：昨天在工作上找到一个窍门，就是需要比对数据时，原来无章法，乱乱的，费时间，自然很排斥，昨天就找
AI新纪元：2025年深度学习技术突破与行业应用全景像素笔记杂谈人工智能深度学习 ai 自动驾驶工业数字化转型未来趋势技术创新
2025年，人工智能技术迎来爆发式增长，大模型、生成式AI和多模态技术持续突破，人形机器人量产元年正式开启，自动驾驶商业化进程加速，工业数字化转型全面铺开。这些进展不仅重塑了技术边界，更在多个行业创造了实际价值，推动AI从实验室走向产业化。本文将深入剖析2025年深度学习与AI领域的核心技术突破、行业应用案例及未来发展趋势，为技术从业者提供全面视角。一、深度学习核心技术突破：大模型、生成式AI与多
课程设计的三大关键要素社群asd
最常犯的错误：没有对教学过程把控三大要素一：教学内容设计1：痛点解决（提分率问题，中高考痛点，成长痛点，某些没有达到的事情2：趣味性强（擅用道具，吉他唱歌。语言魅力，学会讲故事，老师个人风采提升）3：结果呈现（简单易懂，汇报展示，笔记展示）二：课堂气氛设计1：课堂游戏设计（击鼓传花，一块五毛，小舞蹈，松鼠大树）2：小组pk（分小组，定学习委员，定游戏规则）3：积分激励三：结果呈现设计1：教师点评（
模型移植实战：从PyTorch到ONNX完整指南慕婉0307 神经网络 pytorch 人工智能 python
一、认识ONNXONNX（OpenNeuralNetworkExchange）是一种开放的模型表示格式，由微软和Facebook（现Meta）在2017年共同推出，旨在解决深度学习模型在不同框架之间的互操作性问题。ONNX的主要优势包括：跨框架兼容性：支持主流深度学习框架间的模型转换，包括PyTorch、TensorFlow、MXNet、CNTK等例如，可以将PyTorch训练的ResNet模型导
【舰艇控制】基于matlab具有不确定性和扰动的水面舰艇的自适应有限时间平滑非线性滑模跟踪控制【含Matlab源码 13748期】复现含文献海神之光 Matlab路径规划（进阶版）matlab
欢迎来到海神之光博客之家✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进；个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式Matlab毕设：Matlab毕设系列–说明期刊发表：发表北大核心，SCI不是梦！！⛳️座右铭：行百里者，半于九十。更多Matlab路径规划仿真内容点击①Matlab路径规划（进阶版）②付费专栏Matlab路径规划（初级版）⛳️关注
PyTorch的基础概念和复杂模型的基本使用香蕉可乐荷包蛋 AI大模型项目中的使用 pytorch 人工智能 python
文章目录一、PyTorch基础概念二、复杂模型的学习使用一、PyTorch基础概念张量（Tensor）操作：张量是PyTorch中的基本数据结构，类似于NumPy的数组，但支持GPU加速常见操作包括创建张量、张量运算、索引、切片等importtorch#创建张量x=torch.randn(3,4)y=torch.zeros(3,4)#张量运算z=x+y自动求导（Autograd）：PyTorch的
三篇AAAI顶级论文带你一键搞懂多模态！
关注gongzhonghao【计算机sci论文精选】！拿捏更多顶会顶刊发文资讯随着人工智能技术的飞速发展，多模态学习逐渐成为研究热点。多模态技术能够整合文本、图像、语音等多种模态的信息，为人工智能的应用带来了更丰富的语义理解和更强大的交互能力。此外，多模态技术在视频和语言任务中的应用也取得了显著进展。这些技术不仅提升了模型的性能，还为人工智能在更多领域的应用提供了新的可能性。今天小图给大家精选3篇
组工干部队伍建设经验材料如来写作网
本期如来写作网为大家分享一篇：组工干部队伍建设经验材料，内容充实，结构精巧，借鉴性强。今年以来，我县聚焦“四个第一等”目标，着力打造“硬核”组工干部队伍，为推动全县经济社会高质量发展贡献智慧和力量。一是讲政治，筑牢第一等的忠诚。政治上绝对可靠、对党绝对忠诚，是推动组织工作高质量发展的“生命线”。坚持“第一议题”制度，把学习贯彻习近平总书记重要讲话重要指示批示精神作为部务会第一议题，推进理论武装走深
在工作中学习，在学习中成长花开半夏_1d0c
六年级第一单元的最后一课时表面涂色的正方体，实际上这是一节综合实践课，以了解和探索表面涂色的正方体为主。刚开始看这一课，我一下子愣住了，从头看到尾，压根没看懂啥意思，我反复翻了教案书去看，还是看不懂。这时我慌了，这咋办，看不懂咋去给学生讲呢！我想着还是得去问问有经验的老师，刚好之前教过六年里的李老师坐在那里改作业，我问李老师，你能不能给我讲讲这一课啥意思，我看了半天看不懂。李老师很细心给我讲解，讲
开启个人品牌的敲门砖 - 草稿蔡高语
短暂而又漫长的22天剽悍财富训练营学习接近尾声，想起从开始的茫然期待，到现在的充实奔跑，内心无比的雀跃和满足，因为，我有了方向。1.梦想在我的内心，一直觉得自己将来一定是一个有所成的人，我的人生一定是充满惊喜和满有成就的旅程，来到训练营之前，我的眼前总像有一层拨不开的迷雾，不知道怎样才能跨出自己的脚步，奔向自己的梦想和舞台，那种感觉就像心里装着很大的梦，但是脚就像被锁住了一样。2.信念来到训练营学
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他