夕小瑶

微软最新研究成果：使用GPT-4合成数据来训练AI模型，实现SOTA！

文本嵌入是各项NLP任务的基础，用于将自然语言转换为向量表示。现有的大部分方法通常采用复杂的多阶段训练流程，先在大规模数据上训练，再在小规模标注数据上微调。此过程依赖于手动收集数据制作正负样本对，缺乏任务的多样性和语言多样性。

此外，大部分方法采用BERT作为编码器，如非常经典的Sentence-BERT和SimCSE通过在推理数据集上对BERT进行微调学习文本嵌入。

但现在LLMs技术发展得如火如荼，能否用LLMs来克服现有方法的限制，升级文本嵌入方法呢？

当然可以！

最近，微软发布了一种新颖的文本嵌入方法，使用专有的LLMs为93种语言中各种文本嵌入任务生成合成数据，并且涉及了多个任务场景。

微软使用了Mistral-7B对合成数据和标记数据进行混合训练，**成功登顶Huggingface排行榜，比之前的方法高2%**。

论文标题:
Improving Text Embeddings with Large Language Models

论文链接:
https://arxiv.org/pdf/2401.00368.pdf

模型:
https://huggingface.co/intfloat/e5-mistral-7b-instruct

数据：
https://huggingface.co/datasets/andersonbcdefg/synthetic_retrieval_tasks

方法

合成数据生成

作者使用GPT-4集思广益产生一系列潜在的检索任务，然后为每个任务生成(查询,正例,困难反例)三元组，如下图所示。

为了生成多样化的合成数据，作者提出了一个简单的分类法，将嵌入任务分为几个组，并针对每个组应用不同的提示模板：

非对称任务：包括查询和文档在语义上相关但并不是互相改写的任务。根据查询和文档的长度，进一步分为四个子组：短-长匹配、长-短匹配、短-短匹配和长-长匹配。短-长匹配任务涉及短查询和长文档，是商业搜索引擎中的典型情况。

对称任务：涉及具有相似语义但表面形式不同的查询和文档。包括单语语义文本相似性（STS）和双语检索。

训练

给定一个相关的查询-文档配对（，），将以下指令模板应用于原始查询，生成一个新的查询：

其中，嵌入任务的一句话描述的占位符。

给定一个预训练的LLM，将[EOS]标记附加到查询和文档的末尾，然后将它们输入LLM，通过获取最后一层的[EOS]向量来获得查询和文档的嵌入（）。

为了训练嵌入模型，采用了标准的InfoNCE损失函数L，使用批内负样本和困难负样本进行计算。

其中计算查询q和文档d之间匹配分数的函数,本文采用温度缩放余弦相似度函数，是温度超参，在本实验中设为0.02。

实验

合成数据统计

本文一共生成了500k个示例，其中包含150k个独特指令。25%由GPT-3.5-Turbo生成，其余由GPT-4生成。总的token消耗约为180M。主要语言为英语，覆盖了共计93种语言。对于75种低资源语言，平均每种语言约有1k个示例。

模型微调与评估

模型选用Mistral-7b进行1个epoch微调，评估基准选用MTEB基准测试。

训练数据：利用生成的合成数据和包含13个公共数据集的集合，在采样后得到约180万个样例。为了与一些先前的工作进行公平比较，还报告了仅有标签监督的MS-MARCO数据集的结果。

主要结果

▲表1

如上表所示，本文提出的模型“E5mistral-7b + full data”在MTEB基准测试中获得了最高的平均得分，比之前的最先进模型高出2.4个点。

在“仅使用合成数据”的设置中，没有使用标记数据进行训练，其性能仍然相当有竞争力。生成式语言建模和文本嵌入都需要模型对自然语言有深刻的理解，。基于嵌入任务定义，一种真正强大的轻量级模型应该能够自动生成训练数据，然后通过轻量级微调转换为嵌入模型。

▲表2

在表2中，作者还对几个商业文本嵌入模型进行了比较。然而，由于这些模型缺乏透明度和文档说明，不可能做到完全公平的比较。作者主要关注BEIR基准测试的检索性能，因为RAG是未来LLMs应用的重要趋势之一。正如表2所示，本文的模型在性能上明显优于当前的商业模型。

多语言检索

为了评估模型的多语言能力，作者在包含18种语言的MIRACL数据集上进行了评估。该数据集包括人工注释的查询和相关性判断。

▲表3

如表3所示，该模型在高资源语言特别是英语上超过mE5large。对于低资源语言，本文的模型仍然不够优秀。这是因为Mistral-7B主要预训练于英语数据，未来将可以使用多语言LLM弥合这一差距。

除此之外，作者还探讨分析了几个问题。

分析

1. 对比预训练真的重要吗？

弱监督对比性预训练是现有文本嵌入模型取得成功的关键因素之一。例如，将随机裁剪的片段作为预训练的正样本对待，或者从各种来源收集并筛选文本对。

那么对于LLMs而言，对比预训练还有用吗？

如上图所示，对比预训练有益于XLM-Rlarge，在相同数据上微调时，其检索性能提高了8.2个点，与之前的研究结果一致。

然而，对于基于Mistral-7B的模型，对比预训练对模型质量几乎没有影响。这意味着广泛的自回归预训练使LLMs能够获取良好的文本表示，只需要进行最少限度的微调即可将其转化为有效的嵌入模型，而无需对比预训练。

个性化密码检索

为了评估模型的长上下文能力，作者引入了一项新的合成任务——个性化密码检索，如下图所示，包含多个文件，每个文件都有一个独特的人名和一个随机的密码，插入在随机的位置。任务是从100个候选项中找回包含给定个人密码的文件。通过这个过程测试模型将长上下文中的密码信息编码到嵌入中的能力。

作者通过改变滑动窗口大小和RoPE旋转基，比较了不同变体的性能。

结果表明，默认配置下，使用4k滑动窗口在4k个token内达到了100%的准确率，但随着上下文长度的增加，准确率迅速下降。
将滑动窗口大小天真地扩展到32k会导致更差的性能。
通过将RoPE旋转基准更改为，模型可以在32k个标记内实现超过90%的准确率。但在短上下文不太适用。

结论

这篇工作证明了通过LLMs技术，文本嵌入的质量可以得到显著提升。 研究人员使用了专有的LLMs（如GPT-4），在多种语言环境下生成了多样化的合成数据，并结合Mistral模型强大的语言理解能力，在竞争激烈的MTEB基准测试中取得了SOTA。与现有的多阶段方法相比，既简单又高效，不再需要中间预训练的环节。

用网友的话说就是“Amazing Amazing Amazing!”，省去了人工采集数据的繁琐步骤，每个人都可以轻松地生成自己的数据集，并训练强大的嵌入模型。 语义检索模型不给力导致生成模型性能受影响的局面，总算有希望翻篇儿了！

你可能感兴趣的:(人工智能)

【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
重塑知识的圣殿：人工智能时代的教育革命与人文守护田园Coder 人工智能科普人工智能科普
教育，承载着文明火种传递的千年使命，其核心始终围绕两个永恒命题：如何让知识更有效地被获取？如何让个体潜能更充分地绽放？在信息爆炸、技能迭代加速的当代，传统教育模式——标准化课程、统一进度、有限师资、资源不均——正面临前所未有的压力。人工智能（AI）的崛起，如同一股强大的变革洪流，正以前所未有的深度和广度渗透教育生态的各个环节。从量身定制的学习路径到永不疲倦的智能导师，从虚拟现实的沉浸课堂到洞察学情
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
面向高校的人工智能通识教育课程实验设计方案武汉唯众智创人工智能人工智能通识教育课程实验人工智能通识教育人工智能通识课程人工智能通识
一、前言2018年，教育部发布《高等学校人工智能创新行动计划》，明确提出“重视人工智能与计算机、控制、数学、统计学、物理学、生物学、心理学、社会学、法学等学科专业教育的交叉融合，探索‘人工智能+X’的人才培养模式”。过去，人工智能教育多集中于研究生阶段，本科生接触机会相对有限。2019年，教育部批准35所高校增设“人工智能”本科专业，这标志着人工智能正式纳入本科教育体系。如今，人工智能课程大多是计
SpringBoot电商项目实战：从零搭建百万级架构
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot电商项目实战：从
人工智能赋能气象气候：从数据智能到预测创新的融合之路慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：气象气候与AI的“天然耦合”气象与气候系统是典型的复杂、多尺度、强非线性的自然系统，其建模、分析与预测依赖庞大观测数据和高性能计算资源。传统方法以数值天气预报（NWP）与物理建模为核心，虽然取得重要成就，但也面临计算代价大、精度不足、长期预测偏差大等瓶颈。与此同时，人工智能（AI），尤其是以深度学习为代表的机器学习方法，近年来在图像识别、自
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
面向智能医疗的6G物联网和人工智能 Allen_Lyb 医疗高效编程研发物联网人工智能健康医疗
AbstractTheconvergenceof6Gwirelesstechnology,theInternetofThings(IoT),andArtificialIntelligence(AI)ispoisedtorevolutionizehealthcaredeliverybyenablingunprecedentedlevelsofconnectivity,intelligence,and
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
AI 加持下的智能家居行业：变革、挑战与机遇低代码老李人工智能智能家居
在当今科技迅猛发展的浪潮中，人工智能（AI）已深深融入智能家居领域，成为推动其蓬勃发展的关键力量，为人们的生活带来了诸多便利和创新体验，同时也面临着一系列亟待解决的问题。一、AI驱动的智能家居功能升级（1）智能语音交互与控制智能语音助手作为智能家居的核心交互方式，借助自然语言处理（NLP）技术，让用户仅通过简单的语音指令，就能轻松操控家中各类智能设备，如精准控制灯光的开关与亮度调节、窗帘的开合、电
逻辑结构学派一（五个基础理论）刘海东刘海东人工智能
逻辑结构学派一（五个基础理论）作者：刘海东，中国广东技术师范大学摘要本篇论文通过《逻辑结构学派的宗旨》、《逻辑结构学》、《逻辑工程学》、《逻辑方程结构图理论》、《仿生逻辑理论》五个领域的研究提出《逻辑结构学派的宗旨》、《主观能动性结构》、《主观能动性结构工程》、《赋予生命的逻辑方程结构图》、《仿生逻辑》五个基础经典理论，让人工智能、机器人、智能社会三个主体的基础研究有了方向、方法和判断标准。关键词
基于图神经网络的ALS候选药物预测模型设计与实现神经网络15044 MATLAB专栏神经网络深度学习神经网络人工智能深度学习机器学习
基于图神经网络的ALS候选药物预测模型设计与实现一、任务背景与意义肌萎缩侧索硬化症（ALS）是一种致命的神经退行性疾病，目前尚无有效治愈方法。传统药物发现流程耗时长、成本高，而人工智能技术为加速药物发现提供了新途径。本文设计并实现了一个基于图神经网络（GNN）的ALS候选药物预测模型，通过整合分子图结构信息和生物活性数据，实现对潜在治疗ALS化合物的高效筛选。二、系统架构设计
大模型黄金时代！IT人转行指南：有人薪资翻倍，35+仍吃香_转行大模型！
高薪背后，是百万人才缺口与IT人前所未有的转型机遇当传统IT岗位增长放缓，一个全新领域正以惊人的速度重塑技术人才格局：大模型算法岗平均月薪突破6.8万元，AI产品经理岗月薪近5万元，自动驾驶等AI岗位扩招幅度高达60%36。与此同时，人社部数据显示我国人工智能领域人才缺口超过500万，供需比例达1：106。曾经焦虑“35岁危机”的程序员们发现，那些深耕大模型领域的同行不仅未被淘汰，反而成为企业竞相
大模型卷出新高度|暴雨AI服务器M8878助解算力之困 BAOYUCompany 人工智能服务器运维
当今世界，作为新一轮科技革命和产业革命的重要驱动力，AI已经成为“兵家必争之地”。我国也在政府报告中首次将“人工智能+”行动纳入国家战略，开启了以人工智能为核心的数字经济高质量发展的新时代。当今世界，作为新一轮科技革命和产业革命的重要驱动力，AI已经成为“兵家必争之地”。我国也在政府报告中首次将“人工智能+”行动纳入国家战略，开启了以人工智能为核心的数字经济高质量发展的新时代。AI热度和话题持续火
探索AI时代：全国启动人工智能与未来公益讲座私域合规研究人工智能百度
人工智能与未来——AI赋能中小企业数字化升级公益讲座一、讲座背景随着科技的飞速发展，人工智能（AI）已经深入到了各行各业，为了推动AI技术在中小企业的广泛应用，助力企业拥抱新技术，迎接新机遇，拟申请联合组织AI赋能中小企业数字化升级公益讲座。讲座内容涵盖包括AI新媒体矩阵营销、AI智能跨境获客平台、AI+直播电商认证，AI+数字展厅、中检AI报关风险诊断及合规AI制单系统、AI+商品追溯、AI个人
MATLAB基础应用精讲-【人工智能】数据空间（概念篇）林聪木算法分类
目录前言算法原理发展历程什么是数据空间数据空间基本规律？数据共存方法Pay-as-you-go的进化方式跨域和异构数据源的需求技术实现服务提供数据空间的特点多元主体的开放参与多元角色的中间服务全面覆盖的认证机制丰富的数据联合利用机制数据空间技术框架国际数据空间组成部分使用控制数据场数据场的作用下，三种典型的数据要素价值释放模式数据空间的发展现状国内发展现状：国外发展现状：数据空间的基础设施数据空间
【Python】已解决：Traceback (most recent call last): File “C:/python/kfc.py”, line 8, in KfcError: KFC Cra 屿小夏 python c语言开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
国内主流云服务商对比？阿里云、腾讯云、华为云怎么选？ NicolasLearner 服务器云服务器云主机云服务云服务器阿里云腾讯云华为云
随着中国企业云服务器使用率的不断提升，虽然与国外一些国家相比还有很大差距。但得益于政策红利和中国企业的数字化转型，市场潜力空间仍然很大，而作为互联网行业中的一员，我们也应当对云服务器的基础知识有一定的了解，利用具有较多优势的云服务平台，研发应用层人工智能产品提供决策辅助。一、什么是云服务器云服务器(ElasticComputeService,ECS)是一种简单高效、安全可靠、处理能力可弹性伸缩的计
Ollama实践之：Python代码生成与执行小村学长毕业设计 python 开发语言
Ollama实践之：Python代码生成与执行在人工智能领域，生成式模型正逐渐展现出其强大的潜力。Ollama，作为一个先进的生成式语言模型，不仅能生成连贯的文本，还能生成代码片段，并在某些情况下，生成可执行的代码。本文将详细探讨如何使用Ollama生成Python代码，以及执行这些代码的实践过程。我们不仅会讨论技术细节，还会探讨其应用场景、潜在风险以及未来的发展趋势。一、Ollama简介Olla
探索未来科技：Ollama Python 库——Python 与 AI 的无缝对接尚绮令Imogen
探索未来科技：OllamaPython库——Python与AI的无缝对接项目地址:https://gitcode.com/gh_mirrors/ol/ollama-python在人工智能领域，Python是无可争议的首选语言。而OllamaPythonLibrary正是为了让开发者更加便捷地将Python3.8及以上版本项目与Ollama平台集成，从而解锁更强大的AI功能。这个库以其直观的API设
科学的第五范式：人工智能如何重塑发现之疆田园Coder 人工智能科普人工智能科普
在人类探索未知的壮阔史诗中，科学方法的演进如同照亮迷雾的灯塔。从基于经验的第一范式（描述自然现象），到以理论推演为核心的第二范式（牛顿定律、麦克斯韦方程），再到以计算机模拟为标志的第三范式（气候模型、分子动力学），直至以大数据挖掘为驱动的第四范式（基因组学、高能物理），每一次范式跃迁都极大地拓展了认知的疆界。如今，我们正站在一个更恢弘转折的门槛上——第五范式：人工智能驱动的科学（AIforScie
AI人工智能领域多智能体系统：推动智能医疗的精准诊断
AI人工智能领域多智能体系统：推动智能医疗的精准诊断关键词：人工智能、多智能体系统、智能医疗、精准诊断、医疗数据摘要：本文聚焦于AI人工智能领域中的多智能体系统在智能医疗精准诊断方面的应用。首先介绍了多智能体系统和智能医疗精准诊断的背景知识，包括目的、预期读者等。接着阐述了多智能体系统的核心概念及其与智能医疗精准诊断的联系，并给出了相应的文本示意图和Mermaid流程图。详细讲解了多智能体系统用于
Python 解析 AI 在企业智能数据分析中的落地案例动态链接者Bw 人工智能 python 数据分析
```htmlPython解析AI在企业智能数据分析中的落地案例Python解析AI在企业智能数据分析中的落地案例随着人工智能（AI）技术的飞速发展，越来越多的企业开始将AI应用于数据分析领域，以提升决策效率和业务洞察力。Python作为一门功能强大的编程语言，因其丰富的库支持和易用性，在AI驱动的数据分析中扮演着重要角色。本文将通过几个实际案例，探讨Python如何帮助企业实现智能数据分析。案例
Python 解析 AI 在金融风控中的应用案例浮世清欢ai python 人工智能开发语言
```htmlPython解析AI在金融风控中的应用案例Python解析AI在金融风控中的应用案例在当今快速发展的金融科技领域，人工智能（AI）的应用正在改变传统的金融风险管理方式。通过使用Python编程语言和各种机器学习库，金融机构能够更准确地识别潜在风险，提高决策效率。本文将探讨几个具体的AI在金融风控中的应用案例，并展示如何利用Python实现这些功能。案例一：信用评分模型信用评分是金融风
视觉表征和多模态融合一只齐刘海的猫语言模型
视觉表征和多模态融合是当前人工智能领域的研究热点，特别是在计算机视觉和自然语言处理的交叉领域。视觉表征是指将图像或视频信息转化为模型可以处理的向量形式，而多模态融合则是将不同类型的数据（如视觉、文本、音频等）进行整合，以实现更全面、准确的信息理解和处理。视觉表征(VisualRepresentation)目的：将图像或视频数据转化为深度学习模型可以理解的特征向量。方法：卷积神经网络(CNN)：传
AI时代的微改变测试@小成同学人工智能人工智能
改变1：新闻行业AI主播正式上岗改变2：手机制造商李健称荣耀不再是智能手机制造商改变3：汽车制造商马斯克:特斯拉其实不是一家汽车制造商，而是一家人工智能机器人公司。特斯拉的终极目标是成为一家生产机器人的公司，包括车形机器人和人形机器人。强者拥抱变化，弱者畏惧变化，顺应时代洪流。
Deepoc 大模型：无人机行业的智能变革引擎
在科技飞速发展的当下，无人机行业正经历着一场深刻的变革。从最初简单的遥控飞行设备，到如今广泛应用于航拍、物流、农业、测绘等众多领域的智能飞行器，无人机的功能不断拓展，应用场景日益丰富。而在这场变革中，人工智能技术的融入无疑是最为关键的推动力量，尤其是大模型技术的兴起，为无人机行业带来了前所未有的发展机遇。其中，Deepoc大模型以其卓越的性能和强大的功能，正逐渐成为无人机行业垂直应用领域的一颗璀璨
AI人工智能领域必备：AI芯片的关键作用 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 AI人工智能与大数据技术人工智能 ai
AI人工智能领域必备：AI芯片的关键作用关键词：AI芯片、算力、神经网络、能效比、专用架构、异构计算、存算一体摘要：在人工智能高速发展的今天，从手机里的“语音助手”到马路上的“自动驾驶汽车”，从医院的“智能影像诊断”到工厂的“机器人流水线”，AI技术的落地离不开一个“幕后大功臣”——AI芯片。本文将用“快递分拣工厂”“人脑神经村”等生活案例，带你一步一步理解AI芯片的核心作用、工作原理和未来趋势，
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他