QbitAl

全球最大中文单体模型来了！2600亿参数，AI产业规模化应用可期

金磊梦晨发自凹非寺
量子位报道 | 公众号 QbitAI

上学时候，有的同学花费大量时间去死记硬背，成绩却不一定好。

而学霸们往往有这样的心得：在刷题之外还要总结知识体系，事半功倍。

人学习过程中的这一现象，在机器学习领域似乎同样得到应验。

以巨头们竞争的热点NLP大模型为例，一味增加参数规模就相当于给AI更多的背诵资料。费时费力不说，有些只能从训练数据的海量文本中学到一些词句之间表面的关联。

强如GPT-3也无法用常识判断出问题本身是否成立，只要提问的时候使坏设个套，它就真的往里钻。

有网友提问“长颈鹿有几只眼睛？”，GPT-3能从文本中能学到，正确回答出两只，这很厉害。

再问“我的脚有几只眼睛？”这样没头脑的问题，GPT-3也不会拒绝回答，而是根据概率猜测出最大可能性也是两只。

△像极了考试没读懂题目还要硬猜的学渣

如果用上知识增强技术，让AI同时从大规模知识和海量多元数据中持续学习会如何？

其实知识增强大模型的威力，业界在7月份已经见证了一次。

ERNIE 3.0一举刷新54个中文 NLP 任务基准，其英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上，以超越人类水平0.8个百分点的成绩登顶全球榜首。

ERNIE 3.0具备超强语言理解能力以及写小说、歌词、诗歌、对联等文学创作能力。

不到半年时间，知识增强大模型这一方向上又传来新消息。

这一次，知识增强大模型参数达到2600亿，既是全球首个千亿级知识增强大模型，也是目前全球最大的中文单体模型。

有这样豪华的配置，实际表现如何？

新模型在机器阅读理解、文本分类、语义相似度计算等60多项任务中都取得了最好效果。

在30多项小样本和零样本任务上，也刷新了基准。

△小样本学习效果

△零样本学习效果

究其原因，是大规模知识+海量无结构数据，让AI在知识的指导下学习效率更高，能够更快地学习到海量数据中蕴含的规律。

所表现出来的也就是更加智能。

仅仅说刷榜、跑分等干巴巴的数据可能无法激发你的想象力，如果说这给大模型产业化规模应用打开了新窗口呢？

突破小样本、零样本学习问题，一方面能节省人工标注数据的昂贵成本，另一方面更是为本身就缺少足够数据的新场景带来希望。

试想医疗领域，有些罕见病历史上所有病历数据都收集起来，也不足以支撑传统预训练大模型。

像突发新型传染病这种争分夺秒的事件，如果AI可以在初期数据不足时也参与进来，病毒的破解研究和防治工作或许也能提速不少。

说了这么多，是时候正式介绍一下这次的知识增强千亿大模型了：鹏城-百度·文心大模型，由百度联合鹏城实验室共同研发。

△中国工程院院士、鹏城实验室主任高文(左)、百度首席技术官王海峰(右)联合发布鹏城-百度·文心

5个月时间从百亿到千亿的突破，百度做了什么？

知识增强千亿大模型，会带来哪些改变？

下面就来一探究竟。

知识增强千亿大模型是怎样炼成的？

千亿参数，要想“炼”动这种体量的大模型，一个强劲的“马达”是必不可少的。

说的直白一些，就是硬件层面上，需要提供一个强大的算力。

在这一方面，正如其名“鹏城-百度·文心”，它所采用的便是其前者——鹏城云脑Ⅱ。

鹏城云脑Ⅱ是一个算力集群，同时也是第一个国产自主的E级AI算力平台。或许这样说还感受不到其算力的强大，但换个角度来比较便可一目了然了。

例如在全球高性能计算领域最权威榜单——IO500中，鹏城云脑Ⅱ便曾以7043.99分和1129.75分“技压群雄”，获得了总榜第一名和10节点榜单第一名。

但除了算力这种“硬”功夫之外，与之相辅相成的还有其“软”的一面。

就好比炼丹过程中，不仅需要旺盛的火力，炼丹师的技艺、手法也是至关重要。

而炼就千亿大模型背后的这位“技巧型选手”，正是大家所熟知的百度飞桨。

不过这一次，飞桨这个深度学习开源开放平台，倒是展现出了它新炼成的核心技巧。

端到端自适应分布式训练框架。

值得一提的是，这框架是目前世界上为数不多的超大规模模型训练框架。

与传统的分布式训练方法相比，性能能够提升2.1倍，并行效率可以高达90%。

这个框架在面对不同的模型和硬件的时候，可以把它们“看做”统一的分布式计算视图和资源视图，并通过硬件感知细粒度切分和映射功能，搜索出最优的模型切分和硬件组合策略。

如此一来，诸如数据、模型参数、梯度、优化器状态等，便会按照最优的策略分配到不同的计算卡上了。

除此之外，飞桨在训练千亿大模型时为了加强模型训练的鲁棒性和稳定性，还增加了 弹性资源管理模块。

通过分布式训练框架和平台调度器之间更好的交互，来实现容错和弹性的分布式训练，从而提高整体资源利用率。

弹性资源管理模块能感知硬件资源变化，如故障、扩容、缩容，来自动重新构建资源视图，并触发飞桨框架的各个模块来自动的做出反应，如模型切分、硬件映射、流水执行，在不中断训练的情况下，弹性调度集群可用资源，来进一步提升整体的训练的性能。

而且为了能够在鹏城集群上高效训练，飞桨还加入了支持多种AI芯片下硬件感知的训练技巧。

除了软硬结合之外，为了能更好地理解语言并生成内容，这次鹏城-百度·文心大模型在算法层面上也有创新之处：

可控学习和可信学习算法。

可控的意思，简单来说就是不需要任何的标注样本，就可以生成不同类型的文本。

甚至可以把指定的体裁、情感、长度、主题、关键词等做自由组合。

具体而言，通过可控学习，可以把模型预测出来的文本，和原始文本做拼接，并构造从指定属性生成对应文本的预训练数据。

有了这样的数据之后，模型就通过对它的学习，做到即使面对不同类型的文本，也能炼就零样本生成的“功夫”。

至于可信学习，就是生成出来的内容是“符合事实”的。

在这一点上，就有点像GAN了，主要的方式是通过自监督的对抗训练，来让模型学会区分数据的真伪。

模型在学会了这项技能之后，就可以在众多生成的候选内容中，挑出来最可靠的那个了。

最后，炼成鹏城-百度·文心大模型的背后，还有一个首创的 大模型在线蒸馏技术。

这个技术要解决的，便是应用难落地的老大难问题。

因为大模型不论是训练还是推理，需要消耗的资源都是非常密集且昂贵。

而在“在线蒸馏技术”的加持之下，模型参数压缩率可达99.98%！

换言之，在几乎相同的效果之下，压缩版的参数量仅为原来的0.02%。

而相比于传统的蒸馏技术，它可以在大模型学习的过程中，周期性地将知识信号传递给若干个学生模型同时训练。

如此以来，就可以达到在蒸馏阶段一次性产出多种尺寸的学生模型的目的。

就好比老师也需要学习，学成之后再将自己总结的笔记拿给学生们去学习。

而有了这项技术之后，就可以做到“老师学习的同时还能教学生”的作用。

再打个比方就是，如果大模型去参加一个考试能拿100分，那通过在线蒸馏技术后，压缩5000倍的小模型也能考出96分的高分成绩。

但更为重要的是，算力仅需原来的1/5000。

……

这，便是鹏城-百度·文心千亿大模型的炼就过程。

那么在具体应用场景上，知识增强大模型与其他模型相比有什么优势？

打10010就能体验的大模型

其实，百度这次除了发布鹏城-百度·文心千亿大模型，还让百度产业级知识增强大模型“文心”全景图亮了相。

没想到吧，这样学霸级别的大模型不止一个，还有一整个大模型家族。

文心大模型中，既包含基础通用的大模型，也包含面向重点领域、重点任务的大模型，以及丰富的工具与平台，能够促进技术创新和产业发展。

知识增强跨语言大模型ERNIE-M，同时从多种语言中学习，让机器有了同时学习和理解多种语言的能力，权威跨语言理解榜单第一名；
知识增强跨模态理解大模型ERNIE-ViL，将场景图的结构化知识融入预训练，在视觉常识推理任务榜单获得第一名；
知识增强跨模态生成大模型ERNIE-ViLG，实现图文双向生成，也是全球规模最大中文跨模态生成模型。

……

不过说了这么多，效果好不好，只有用起来才知道。

而大模型“出山”下场的地方之一，是与许多人的日常所息息相关的场景——中国联通。

对于中国联通来说，每天都会面临来自用户的海量需求，包括业务咨询、业务办理、问题解答等等。

对于诸如此类的业务需求，又需要马上作出回应，而且要理解用户的问题并给予满意的答复。

培训大量的业务员所需要投入的人力、物力之大，基于中国联通的客户体量也就可想而知了。

于是，针对这样的一种现实情况，联通便和百度携手，基于百度文心大模型打造了一款可定制的对话技术。

具体而言，这项技术采用了百度文心大模型的语义表示能力，建立了面向对话理解问题的专用预训练模型。

换言之，现在你打“10010”咨询业务问题，作出丝滑解释的背后，正是大模型在发力。

或许你会说，类似这种功效的智能客服AI在电商等场景中经常也能看到。

但也正如刚才我们提到的，百度文心大模型一个非常显著的特点，就是降本增效。

在联通的这个场景中，模型对于数据标注量的需求降低了45%，如此一来便做到了在人力和物力上的“双重释放”。

而不仅仅是在联通这个案例，百度文心大模型在金融领域也在发挥着它的作用，例如保险合同业务处理，就是其中一个。

一般来说，一份保险合同需要完成近40个类目的条款解析分类，如果采用人工的方式去处理，那么一份合同大概需要小半天的时间。

再细分到每个员工，那么一个人每天至多仅能处理20份左右的保险合同。

那么如果面对海量的合同需求，随即而来的便是人工的成本、处理的效率等一系列问题。

而基于文心大模型，百度与金融领域的客户便打造了保险合同条款智能解析模型。

这个模型可以对合同作出智能分类，由它做“辅助”，一个业务员处理一份合同的时间就骤减到了1分钟，速度是此前的几十倍了。

据了解，目前这款模型已经覆盖百余份合同模板，完成了上亿份合同条款的智能分类，而且还是一天之内就能上线的那种。

……

由此可见，诸如百度文心大模型的能力，已经不单单是科研上的大势所趋，更是行业众多领域实打实所需要的需求。

其能够体现的核心价值便是降本增效，而这也是与当今数字化转型大浪潮的目标相契合。

那么接下来一个问题便是，大模型的能力该如何铺开来大规模的用起来。

对外开放，开发者不必重复造轮子

虽说知识增强大模型有千般好，如何把AI能力向外输出，让大家都能用上也是产业化大规模应用的关键。

而百度表示，百度文心大模型都会通过百度自研的深度学习平台飞桨上逐步对外开源开放。

近年来，百度AI反复强调的两个关键词是「融合创新」与「降低门槛」。

这次的鹏城-百度·文心以及文心知识增强大模型，就是多项融合创新积累起来的一次爆发。

技术研发上，知识与深度学习融合，改变了从神经网络技术单点突破的局面。

降低模型的研发和使用成本，解决数据标注困难、模型可控可信度差等难题，增加在各个场景的泛化能力。

应用场景上，跨模态多技术融合，让AI面对复杂的真实业务场景有了更多实用价值。

金融上的合同与报表、医疗影像与病例分析都是仅靠NLP或CV技术无法单独完成的，而AI与人直接交流的场合更是需要视觉、语言、语音、知识共同参与。

落地部署上，百度飞桨深度学习框架、鹏城云脑II的软硬件融合释放AI能力，首创大模型在线蒸馏技术更是节省千倍算力……

以上种种技术创新的积累终于产生质变，在传统的定制化模型开发之上，开辟出基于通用大模型的个性化微调的新模式。

新技术、新模式通过算力中心和开放社区向全行业输出AI能力，真正做到降低门槛。

通用大模型通过少量数据甚至无需数据就能训练出特定业务场景的AI模型，让开发模式变得可以复制，AI模型可轻松跨场景迁移。

以开源平台、算力中心为基础构建产业生态，为医疗、金融、法律等垂直领域的中小企业降低创新成本，提高社会运行效率。

未来，学校、科研机构和企业也计划参与到合作研发之中，这个过程中积累的数据、实现的应用场景、汇聚的开发者又能回过头来反哺整个技术生态和产业生态。

在这条路上积累十年的百度看来，下一步，就是形成以社会化协作为特征的AI大生产了。

Google 跨平台方案 Flutter 从入门到实战 2401_84121603 程序员 flutter
printNumber(numaNumber){print(‘Thenumberis$aNumber.’);//控制台打印}//启动方法，类似于java的main函数main(){varnumber=42;printNumber(number);}我们可以以看到一下几点：能赋值给变量的所以东西都是对象，包括numbers,null,function,都是继承自Object内置类尽量给变量定义一个类
ES6+新特性，var、let 和 const 的区别小美的打工日记 es6 javascript 前端
在JavaScript中，var、let和const都用于声明变量，但它们有一些重要的区别，主要体现在作用域、可变性和提升机制等方面。1.作用域（Scope）var:var声明的变量是函数作用域，也就是说，它只在函数内部有效。如果var声明在函数外面，它的作用域就是全局的。如果var在一个代码块内（如if语句中）声明，它的作用域并不限于该代码块，而是整个函数或全局作用域。if(true){vara
Apache Hive 聚合函数与 OVER 窗口函数：从基础到高级应用大鳥 sql hive apache hive hadoop
在大数据时代，ApacheHive是处理和分析海量数据的强大工具。Hive提供了丰富的聚合函数和强大的OVER窗口函数，能够帮助我们高效地进行数据分析。本文将综合介绍Hive的聚合函数和OVER窗口函数，结合实际使用场景和代码示例，帮助读者深入理解这些功能，尤其是它们在时间序列分析中的应用。一、Hive聚合函数基础聚合函数是Hive中用于对一组数据进行计算并返回单个值的函数。它们在数据分析中非常常
《剖析Transformer架构：自然语言处理飞跃的幕后英雄》人工智能深度学习
在人工智能的迅猛发展进程中，自然语言处理（NLP）领域取得了令人瞩目的突破，而Transformer架构无疑是这场变革的核心驱动力。自从2017年在论文《AttentionIsAllYouNeed》中被提出，Transformer便在NLP领域引发了一场革命，彻底改变了模型处理和理解人类语言的方式。打破传统枷锁，开创并行计算新时代在Transformer出现之前，循环神经网络（RNN）及其变体，如
this、self、window、top 在 JavaScript 中的区别深入研究 javascript
在JavaScript开发中，this、self、window、top是四个常用的概念，它们在不同的上下文中有着不同的用途和含义。理解它们的区别对于编写健壮的JavaScript代码至关重要。本文将详细解释这四个概念的区别，并通过代码示例进行验证。一、this的含义与用法基础概念this是一个关键字，它在JavaScript中指向当前执行上下文的对象。this的值取决于函数的调用方式。例如，在全局
Android 开发中 javax.imageio.ImageIO 获取图片宽高不可用（替代方案：使用 Bitmap、使用 BitmapFactory.Options）我命由我12345 Android -问题清单 android java-ee java android-studio android studio 安卓 android runtime
问题描述与处理策略1、问题描述try{ByteArrayInputStreambyteArrayInputStream=newByteArrayInputStream(bytes);BufferedImagebufferedImage=ImageIO.read(byteArrayInputStream);if(bufferedImage!=null){//获取图片的宽度和高度intwidth=bu
Java异步编程大-魚 Java #Java异步编程 java
目录Java异步编程异步和同步的区别NIO原理NIOinJava响应式编程1.什么是响应式编程？他和传统的编程方式有什么区别？Java.Util.Concurrent.FutureListenableFutureCompletableFutureJDK8中搭建CompletableFuture超时控制轮子Java异步编程什么是异步编程？响应式编程+NIO。异步和同步的区别该图是传统模式下IO线程的
大数据治理实战指南：数据质量、合规与治理架构一ge科研小菜鸡大数据大数据
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着企业数字化转型的加速，大数据已成为驱动业务决策的核心资产。然而，数据治理的缺失或不完善，可能导致数据质量问题、合规风险以及业务价值的流失。大数据治理的目标在于确保数据的可用性、完整性、安全性和合规性，支撑企业的智能化发展。本教程将系统讲解大数据治理的关键概念、技术方法，并提供实际应用案例，帮助企业构建高效的数据治理体系。1.大数据治理概述
java语言学习（5） memorycx Javase 学习历程 java 学习开发语言
第九章目录类变量和类方法理解main方法语法代码块单列设计模式final关键字抽象类接口类变量/静态变量该变量最大的特点就是会被本类的所有对象实例共享，类变量可以通过类名来访问分析代码，探讨内存的分配classChild{privateStringname;publicstaticintcount=0;//这个叫类变量或者叫静态变量publicChild(Stringname){this.name
java语言学习（6） memorycx Javase 学习历程 java 学习 python
十章类部类枚举和注解自定义实现枚举enum关键字实现枚举JDK内置的基本注解类型元注解：对注解进行注解补充：类的五大成员属性方法构造器代码块内部类内部类定义：一个类的内部又完整的嵌套了另一个类结构。被牵头的类称为内部类，嵌套其他类的类称为外部类，内部类最大的特点就是可ui直接访问私有属性，并且可以体现类与类之间的包含关系局部内部类（有类名）基本语法*classOuter{//外部类classInn
java语言学习（3）------初级篇完稿 memorycx Javase 学习历程 java 学习 python
第七章续方法重载定义：java中允许一个类中，多个同名方法的存在，但是要求形参列表不一样。重载的好处：减轻了起名的麻烦减轻了记名的麻烦重载的细节：方法名必须相同形参列表必须不同（形参类型或个数或顺序，至少有一样不同，参数名无要求）返回类型无要求可变参数概念：java允许将同一个类中多个同名同功能但参数个数不同的方法，封装成一个方法。基本语法访问修饰符返回类型方法名（数据类型…形参名）快速入门cla
BPMN.js详解 GISer_Jinger Javascript 前端基础项目 javascript 开发语言 ecmascript
bpmn.js是一个基于JavaScript的开源库，它允许开发者在Web应用程序中创建、查看和编辑BPMN2.0流程图。以下是对bpmn.js的详细解析：一、基本概念与功能定义：bpmn.js是bpmn-io团队开发的一个JavaScript库，它专注于BPMN（业务流程模型和标记法）2.0标准的实现。主要功能：渲染BPMN图表：bpmn.js能够将BPMN2.0的XML文件渲染成SVG格式的图
Java 21 探讨虚拟线程锁在哪里？幻想多巴胺技术论文 java 开发语言
介绍Netflix在广泛的微服务架构中一直将Java作为主要编程语言。随着我们使用更新版本的Java，JVM生态系统团队会寻找可以改善我们系统的人机工程学和性能的新语言特性。在最近的一篇文章中，我们详细描述了当我们迁移到Java21并将代际ZGC作为默认垃圾收集器时，我们的工作负载如何受益。虚拟线程是我们在此次迁移中兴奋采用的另一项功能。对于虚拟线程的新手，它们被描述为“轻量级线程，大大减少了编写
Python的未来 future模块 gftygff
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！转载：http://omencathay.itpub.net/post/30163/414347简单介绍一下python未来将会支持的一些语言特点,虽然Ibm的网站上也有介绍.但是太凌乱了.而且中翻译过后,代码的
华为OD机试E卷 - 最优资源分配/芯片资源占用（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为华为od 华为OD机试E卷 python java javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述某块业务芯片最小容量单位为1.25G，总容量为M*1.25G，对该芯片资源编号为1，2，…，M。该芯片支持3种不同的配置，分别为A、B、C。配置A：占用容量为1.25*1=1.25G配置B：占用容量为1.25*2=2.5G配置C：占用容量为1.25*8=10G某块板卡上集成了N块上述芯片，对芯片编号为1，2，…，N，各
华为OD机试 - 微服务的集成测试（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为华为OD 华为od 华为机试算法
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述现在有n个容器服务，服务的启动可能有一定的依赖性（有些服务启动没有依赖），其次服务自身启动加载会消耗一些时间。给你一个nxn的二维矩阵useTime，其中useTime[i][i]=10表示服务i自身启动加载需要消耗10suseTime[i][j]=1表示服务i启动依赖服务j启动完成useTime[i][k]=0表示服
leetcode——两数相加（java） gentle_ice leetcode java 算法
给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的，并且每个节点只能存储一位数字。请你将两个数相加，并以相同形式返回一个表示和的链表。你可以假设除了数字0之外，这两个数都不会以0开头。示例1：输入：l1=[2,4,3],l2=[5,6,4]输出：[7,0,8]解释：342+465=807.示例2：输入：l1=[0],l2=[0]输出：[0]示例3：输入：l1=[9,9,9
sklearn模型评估全景：指标详解与应用实例 2402_85758936 scala 开发语言人工智能
sklearn模型评估全景：指标详解与应用实例在机器学习中，模型评估是衡量算法性能的关键步骤。scikit-learn（简称sklearn）提供了一套全面的模型评估工具，帮助开发者量化模型的准确性、健壮性和其他重要特性。本文将详细介绍sklearn中的模型评估指标，并通过代码示例展示如何应用这些指标。模型评估的重要性模型评估指标是理解和改进模型性能的基础。它们可以提供以下信息：准确性：模型预测的准
链表相交问题（双指针法）（java和c语言）野犬寒鸦链表 c语言算法 java
问题描述给你两个单链表的头节点headA和headB，请你找出并返回两个单链表相交的起始节点。如果两个链表没有交点，返回null。方法：双指针一种高效的方法是使用两个指针，分别从两个链表的头部开始遍历。当一个指针到达链表末尾时，它切换到另一个链表的头部继续遍历。如果两个链表相交，那么这两个指针一定会在某一点相遇，这个相遇点就是相交的起始节点。实现思路初始化两个指针：分别指向链表A和链表B的头节点。
java基础加强四（反射，代理模式，自定义注解）咸鱼太咸从新开始 java 反射
一、反射反射机制是java中一个很强大的功能，可以跳过jvm实例化对象的过程，直接实例化类的class对象，然后直接操作class对象，再运行过程中，几乎可以得到任何一个类的属性和方法，能够调用任何一个对象的方法和属性。Class对象：一个类的描述，存储了类的信息。看一下api：比如一个类叫Demo，在jvm加载的时候就会创建一个class对象，里边存储了Demo类的信息，有什么属性，方法，构造器
java线程间如何通信一只爪子 java jvm 开发语言
Java线程之间可以通过以下方式进行通信：使用wait()和notify()方法，这需要使用同步代码块或同步方法。在同步代码块或同步方法中，线程可以调用wait()方法阻塞，并在其他线程调用notify()方法后恢复执行。使用CountDownLatch，它是一个同步辅助类，可以让一个线程等待其他线程的完成。使用CyclicBarrier，它也是一个同步辅助类，可以让多个线程在某个点上等待，直到所
《Effective Java》学习笔记——第7部分并发 Suwg209 Effective Java最佳实践笔记 java 学习笔记
文章目录一、前言二、并发最佳实践1.优先使用现有的并发库2.避免共享可变数据3.最小化锁的持有时间4.使用合适的同步策略5.使用volatile变量来避免缓存问题6.避免死锁7.使用ExecutorService管理线程8.优先使用无锁并发工具三、小结一、前言《EffectiveJava》第7部分“并发”介绍了如何编写高效、安全的多线程程序。随着多核处理器的普及，Java的并发编程变得更加重要。本
《Effective Java》学习笔记--第3部分方法设计和实现最佳实践 Suwg209 Effective Java最佳实践笔记 java 学习笔记
文章目录第3部分方法设计和实现一、前言二、方法设计和实现最佳实践1.方法的参数要尽量少2.避免使用过多的返回值3.避免在方法中返回null4.方法要尽量做到单一职责5.使用合适的访问修饰符6.避免方法内部的过多的条件分支7.使用适当的异常处理8.考虑方法的线程安全性三、小结第3部分方法设计和实现一、前言《EffectiveJava》共有多个章节，每个章节提供了若干条建议或最佳实践，整理了对应章节关
《手写Mybatis渐进式源码实践》实践笔记 (第三章映射器的注册和使用) Suwg209 手写mybatis mybatis 笔记 java 数据库
文章目录第3章映射器的注册和使用背景特点结构代码示例（Java）适用场景优点缺点目标设计实现工程代码类图实现步骤1.映射器注册机2.SqlSession标准定义和实现3.SqlSessionFactory工厂定义和实现测试事先准备测试用例测试结果总结第3章映射器的注册和使用背景工厂模式（FactoryMethodPattern）是一种创建型设计模式，它定义了一个用于创建对象的接口，但允许子类决定实
Java多线程之线程通信心情阿少 java 开发语言
线程通信通过synchronized关键字，可保证线程在执行的过程中不会被其他线程打断，但无法保证线程的执行次序。比如上述案例中，我们可以保证t1线程输出"好好学习"时，不会被t2线程打断，但无法保证t1、t2两个线程执行的次序。如果想要控制线程输出次序，则需要学习线程通信技术。1）概念理解线程间通信：多个线程并发执行时,在默认情况下CPU是随机切换线程的，当我们需要多个线程来共同完成一件任务，并
java干货线程间通信小男孩编程 java 开发语言 jvm
文章目录一、线程间通信1.1为什么要处理线程间通信？1.2什么是等待唤醒机制？二、等待唤醒机制使用2.1等待唤醒机制用到的方法2.1.1wait2.1.2notify2.2线程通信代码实践2.2.1重要说明2.2.2代码一、线程间通信1.1为什么要处理线程间通信？在默认情况下，cpu是默认切换线程来执行的，当我们需要多个线程共同来完成一个任务，希望他们按照一定的规律执行，那么就需要他们进行通信协调
Java中的注解 RB_VER Java基础 java 编程语言
为什么要引入注解？使用【注解】之前(甚至在使用之后)，【XML】被广泛的应用于描述元数据，得到各大框架的青睐，它以松耦合的方式完成了框架中几乎所有的配置，但是随着项目越来越庞大，【XML】的内容也越来越复杂，一些应用开发人员和架构师发现维护成本变高。他们希望使用一些和代码紧耦合的东西，于是就有人提出来一种标记式高耦合的配置方式【注解】。方法上可以进行注解，类上也可以注解，字段属性上也可以注解，反正
java常见单词汇总3（非常使用哦）糟糕透了的都精彩极了学习 java java常用英文单词
JSP中常用英文URL:UniversalResourceLocation:统一资源定位符IE:InternetExplorer因特网浏览器JSP:javaserverpage.java服务器页面Model:模型View:视图C:controller:控制器Tomcat:一种jsp的web服务器WebModule:web模块Servlet:小服务程序Request:请求Response:响应Ini
Java 中如何使用 SSL 连接 IoTDB 铁头乔 java ssl iotdb 数据库时序数据库开源
问题Java中如何使用SSL连接IoTDB？方案SSL（SecureSocketsLayer）是一种安全协议，用于在网络通信中提供加密、认证和数据完整性保护。它主要用于在互联网上保护数据传输，确保数据在传输过程中不被窃听或篡改。IoTDB支持SSL协议，但是在配置文件中相关参数是默认关闭的状态，如下：#Doesdn_rpc_portenableSSL#effectiveMode:restart#D
Java stream流的避坑指南冰糖心158 2025 Java面试系列 java
在使用JavaStreamAPI时，虽然它提供了强大的功能来简化集合操作，但也存在一些常见的“坑”需要注意。以下是详细的避坑指南：1.Stream的不可重用性问题：Stream一旦被消费（如调用forEach、collect等终端操作），就不能再次使用。解决方案：如果需要多次操作同一个数据源，可以重新创建Stream，或者将Stream的结果保存到集合中。Listnumbers=Arrays.as
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =