开源大模型文档

开源大模型综述

    • 排行榜
    • 1.LLaMA
      • 资源:
    • 2.Chinese-LLaMA-Alpaca
      • 资源:
    • 3.Alpaca
      • 资源:
    • 4.Alpaca-LoRA
    • 5.Vicuna
      • 资源:
    • 6.OpenChatKit
      • 资源:
    • 7.GPT4ALL
    • 8.Raven RWKV
      • 资源:
    • 9.OPT
      • 资源:
    • 10.Flan-T5-XXL
      • 资源:
    • 11.MPT-7B
      • 资源:
    • 12.清华**ChatGLM-6B**
      • 资源:
    • 13.复旦MOSS
      • 资源:
    • 附录
      • 训练推理最低资源汇总
      • 语料
        • 1.维基百科json版(wiki2019zh)
        • 结构:
        • 例子:
        • 2.新闻语料json版(news2016zh)
        • 250万篇新闻( 原始数据9G,压缩文件3.6G;新闻内容跨度:2014-2016年)
        • 数据描述
        • 可能的用途:
        • 结构:
        • 例子:
        • 3.百科类问答json版(baike2018qa)
        • 150万个问答( 原始数据1G多,压缩文件663M;数据更新时间:2018年)
        • 数据描述
        • 可能的用途:
        • 结构:
        • 例子:
        • 公开评测:
        • 4.社区问答json版(webtext2019zh) :大规模高质量数据集
        • 数据描述
        • 可能的用途:
        • 结构:
        • 例子:
        • 在该数据集上的公开评测和任务:
        • 5.翻译语料(translation2019zh)
        • 数据描述
        • 可能的用途:
        • 结构:
        • 例子:
        • 可能的用途:
        • 结构:
        • 例子:

排行榜

我们展示了 Chatbot Arena,这是一个大型语言模型 (LLM) 的基准平台,以众包方式进行匿名、随机的战斗。在这篇博文中,我们将发布我们的初步结果和基于 Elo 评级系统的排行榜,该系统是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作,贡献新模型并通过提问和投票选出您最喜欢的答案来评估它们。
开源大模型文档_第1张图片

1.LLaMA

LLaMA项目包含了一组基础语言模型,其规模从70亿到650亿个参数不等。这些模型在数以百万计的token上进行训练,而且它完全在公开的数据集上进行训练。结果,LLaMA-13B超过了GPT-3(175B),而LLaMA-65B的表现与Chinchilla-70B和PaLM-540B等最佳模型相似。

开源大模型文档_第2张图片
开源大模型文档_第3张图片

资源:

  • 研究论文:“LLaMA: Open and Efficient Foundation Language Models (arxiv.org)” [https://arxiv.org/abs/2302.13971]
  • GitHub:facebookresearch/llama [https://github.com/facebookresearch/llama]
  • 演示:Baize Lora 7B [https://huggingface.co/spaces/project-baize/Baize-7B]

2.Chinese-LLaMA-Alpaca

以ChatGPT、GPT-4等为代表的大语言模型(Large Language Model, LLM)掀起了新一轮自然语言处理领域的研究浪潮,展现出了类通用人工智能(AGI)的能力,受到业界广泛关注。然而,由于大语言模型的训练和部署都极为昂贵,为构建透明且开放的学术研究造成了一定的阻碍。

为了促进大模型在中文NLP社区的开放研究,本项目开源了中文LLaMA模型和指令精调的Alpaca大模型。这些模型在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础语义理解能力。同时,中文Alpaca模型进一步使用了中文指令数据进行精调,显著提升了模型对指令的理解和执行能力。

开源大模型文档_第4张图片

资源:

  • GitHub:https://github.com/ymcui/Chinese-LLaMA-Alpaca

3.Alpaca

斯坦福大学的Alpaca声称它可以与ChatGPT竞争,任何人都可以在不到600美元的情况下复制它。Alpaca 7B是在52K指令遵循的示范上从LLaMA 7B模型中进行微调。

开源大模型文档_第5张图片

资源:

  • 博客:斯坦福大学CRFM。[https://crfm.stanford.edu/2023/03/13/alpaca.html]
  • GitHub:tatsu-lab/stanford_alpaca [https://github.com/tatsu-lab/stanford_alpaca]

4.Alpaca-LoRA

使用低秩适应 (LoRA)重现斯坦福羊驼结果的代码

资源:

  • GitHub: https://github.com/tloen/alpaca-lora
  • 演示:Alpaca-LoRA [https://huggingface.co/spaces/tloen/alpaca-lora]

5.Vicuna

Vicuna是在从ShareGPT收集到的用户共享对话上的LLaMA模型基础上进行微调。Vicuna-13B模型已经达到了OpenAI ChatGPT和Google Bard的90%以上的质量。它还在90%的情况下超过了LLaMA和斯坦福大学Alpaca模型。训练Vicuna的成本约为300美元。

开源大模型文档_第6张图片

资源:

  • 博客文章:“Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality” [https://vicuna.lmsys.org/]
  • GitHub:lm-sys/FastChat [https://github.com/lm-sys/FastChat#fine-tuning]
  • 演示:FastChat (lmsys.org) [https://chat.lmsys.org/]

6.OpenChatKit

OpenChatKit:开源的ChatGPT替代方案,是一个用于创建聊天机器人的完整工具包。它提供了用于训练用户自己的指令调整的大型语言模型、微调模型、用于更新机器人响应的可扩展检索系统以及用于过滤问题的机器人审核的指令。

开源大模型文档_第7张图片

可以看到,GPT-NeoXT-Chat-Base-20B模型在问答、提取和分类任务上的表现优于基础模式GPT-NoeX。

资源:

  • 博客文章:“Announcing OpenChatKit”—TOGETHER [https://www.together.xyz/blog/openchatkit]
  • GitHub: togethercomputer/OpenChatKit [https://github.com/togethercomputer/OpenChatKit]
  • 演示:OpenChatKit [https://huggingface.co/spaces/togethercomputer/OpenChatKit]
  • 模型卡:togethercomputer/GPT-NeoXT-Chat-Base-20B [https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-20B]

7.GPT4ALL

GPT4ALL是一个社区驱动的项目,并在一个大规模的辅助交互语料库上进行训练,包括代码、故事、描述和多轮对话。该团队提供了数据集、模型权重、数据管理过程和训练代码以促进开源。此外,他们还发布了模型的量化4位版本,可以在笔记本电脑上运行。甚至可以使用Python客户端来运行模型推理。
开源大模型文档_第8张图片

  • 技术报告:GPT4All [https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf]
  • GitHub: nomic-ai/gpt4al [https://github.com/nomic-ai/gpt4all]
  • 演示:GPT4All(非官方)。[https://huggingface.co/spaces/rishiraj/GPT4All]
  • 模型卡:nomic-ai/gpt4all-lora · Hugging Face [https://huggingface.co/nomic-ai/gpt4all-lora]

8.Raven RWKV

Raven RWKV 7B是一个开源的聊天机器人,它由RWKV语言模型驱动,生成的结果与ChatGPT相似。该模型使用RNN,可以在质量和伸缩性方面与transformer相匹配,同时速度更快,节省VRAM。Raven在斯坦福大学Alpaca、code-alpaca和更多的数据集上进行了微调。

开源大模型文档_第9张图片

资源:

  • GitHub:BlinkDL/ChatRWKV [https://github.com/BlinkDL/ChatRWKV]
  • 演示:Raven RWKV 7B [https://huggingface.co/spaces/BlinkDL/Raven-RWKV-7B]
  • 模型卡:BlinkDL/rwkv-4-raven [https://huggingface.co/BlinkDL/rwkv-4-raven]

9.OPT

OPT:Open Pre-trained Transformer语言模型并不像ChatGPT那样强大,但它在零样本和少样本学习以及刻板偏见分析方面表现出卓越的能力。还可以将它与Alpa、Colossal-AI、CTranslate2和FasterTransformer集成以获得更好的结果。**注意:**它上榜的原因是它的受欢迎程度,因为它在文本生成类别中每月有624,710次下载。

开源大模型文档_第10张图片

资源:

  • 研究论文:“OPT: Open Pre-trained Transformer Language Models (arxiv.org)” [https://arxiv.org/abs/2205.01068]
  • GitHub: facebookresearch/metaseq [https://github.com/facebookresearch/metaseq]
  • 演示:A Watermark for LLMs [https://huggingface.co/spaces/tomg-group-umd/lm-watermarking]
  • 模型卡:facebook/opt-1.3b [https://huggingface.co/facebook/opt-1.3b]

10.Flan-T5-XXL

Flan-T5-XXL在以指令形式表述的数据集上微调了T5模型。指令的微调极大地提高了各种模型类别的性能,如PaLM、T5和U-PaLM。Flan-T5-XXL模型在1000多个额外的任务上进行了微调,涵盖了更多语言。
开源大模型文档_第11张图片

资源:

  • 研究论文:“Scaling Instruction-Fine Tuned Language Models” [https://arxiv.org/pdf/2210.11416.pdf]
  • GitHub: google-research/t5x [https://github.com/google-research/t5x]
  • 演示:Chat Llm Streaming [https://huggingface.co/spaces/olivierdehaene/chat-llm-streaming]
  • 模型卡:google/flan-t5-xxl [https://huggingface.co/google/flan-t5-xxl?text=Q%3A+%28+False+or+not+False+or+False+%29+is%3F+A%3A+Let%27s+think+step+by+step]

11.MPT-7B

MPT全称是MosaicML Pretrained Transformer,是MosaicML发布的一系列大模型。尽管业界已经发布了很多大模型,但是这些模型通常都比较难以训练和部署。而MosaicML发布这样的大模型的目的就是为了解决上述限制,提供一个完全开源且可商用的一个大模型。MPT系列主要的特点是:

  1. 有商用许可

  2. 基于大量的数据训练

  3. 目标是解决长输入(最高支持65K的输入,84K的处理)

  4. 训练与推理速度的优化

  5. 高效的开源训练代码

资源:

  • 模型GitHub链接 https://github.com/mosaicml/llm-foundry

  • 模型HuggingFace链接 https://huggingface.co/mosaicml/mpt-7b

  • 论文 https://www.mosaicml.com/blog/mpt-7b

12.清华ChatGLM-6B

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。为了方便下游开发者针对自己的应用场景定制模型,同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南) ,INT4 量化级别下最低只需 7GB 显存即可启动微调。

开源大模型文档_第12张图片

资源:

  • GitHub链接 https://github.com/THUDM/ChatGLM-6B

13.复旦MOSS

据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

开源大模型文档_第13张图片

资源:

  • GitHub链接 https://github.com/OpenLMLab/MOSS

附录

训练推理最低资源汇总

模型 推理 训练(微调)
LLaMA 17G 不可
Chinese-LLaMA-Alpaca 3.9G
Alpaca 未说明 112G
Alpaca-LoRA 未说明 23G
Vicuna 14G 160G
OpenChatkit 40G 未说明
GPT4All 16G 未说明
Raven RWKV 15G 未说明
OPT 未说明 350GB
Flan-T5-XXL 未说明 未说明
MPT-7B 未说明 未说明
清华ChatGLM-6B 7G 96G
复旦MOOS 7.8G 未说明

语料

1.维基百科json版(wiki2019zh)

104万个词条(1,043,224条; 原始文件大小1.6G,压缩文件519M;数据更新时间:2019.2.7)

结构:

{"id":,"url":,"title":,"text":<text>} 其中,title是词条的标题,text是正文;通过"\n\n"换行。
</code></pre> 
  <h4>例子:</h4> 
  <pre><code>{"id": "53", "url": "https://zh.wikipedia.org/wiki?curid=53", "title": "经济学", "text": "经济学\n\n经济学是一门对产品和服务的生产、分配以及消费进行研究的社会科学。西方语言中的“经济学”一词源于古希腊的。\n\n经济学注重的是研究经济行为者在一个经济体系下的行为,以及他们彼此之间的互动。在现代,经济学的教材通常将这门领域的研究分为总体经济学和个体经济学。微观经济学检视一个社会里基本层次的行为,包括个体的行为者(例如个人、公司、买家或卖家)以及与市场的互动。而宏观经济学则分析整个经济体和其议题,包括失业、通货膨胀、经济成长、财政和货币政策等。..."}
</code></pre> 
  <h4></h4> 
  <p><a href="http://img.e-com-net.com/image/info8/7a22ab888d4440709c49cf3e7c16dd75.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/7a22ab888d4440709c49cf3e7c16dd75.jpg" alt="开源大模型文档_第14张图片" width="650" height="231" style="border:1px solid black;"></a></p> 
  <h4>2.新闻语料json版(news2016zh)</h4> 
  <h4>250万篇新闻( 原始数据9G,压缩文件3.6G;新闻内容跨度:2014-2016年)</h4> 
  <p>Google Drive下载或 百度云盘下载,密码:k265</p> 
  <h4>数据描述</h4> 
  <p>包含了250万篇新闻。新闻来源涵盖了6.3万个媒体,含标题、关键词、描述、正文。</p> 
  <p>数据集划分:数据去重并分成三个部分。训练集:243万;验证集:7.7万;测试集,数万,不提供下载。</p> 
  <h4>可能的用途:</h4> 
  <pre><code>可以做为【通用中文语料】,训练【词向量】或做为【预训练】的语料;

也可以用于训练【标题生成】模型,或训练【关键词生成】模型(选关键词内容不同于标题的数据);

亦可以通过新闻渠道区分出新闻的类型。
</code></pre> 
  <h4>结构:</h4> 
  <pre><code>{'news_id': <news_id>,'title':<title>,'content':<content>,'source': <source>,'time':<time>,'keywords': <keywords>,'desc': <desc>, 'desc': <desc>}

其中,title是新闻标题,content是正文,keywords是关键词,desc是描述,source是新闻的来源,time是发布时间
</code></pre> 
  <h4>例子:</h4> 
  <pre><code>{"news_id": "610130831", "keywords": "导游,门票","title": "故宫淡季门票40元 “黑导游”卖外地客140元", "desc": "近
</code></pre> 
  <p><a href="http://img.e-com-net.com/image/info8/1ebce869309c43a786f3dfbad5632b86.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/1ebce869309c43a786f3dfbad5632b86.jpg" alt="在这里插入图片描述" width="650" height="61"></a></p> 
  <h4>3.百科类问答json版(baike2018qa)</h4> 
  <h4>150万个问答( 原始数据1G多,压缩文件663M;数据更新时间:2018年)</h4> 
  <p>Google Drive下载 或 百度云盘下载,密码:fu45</p> 
  <h4>数据描述</h4> 
  <p>含有150万个预先过滤过的、高质量问题和答案,每个问题属于一个类别。总共有492个类别,其中频率达到或超过10次的类别有434个。</p> 
  <p>数据集划分:数据去重并分成三个部分。训练集:142.5万;验证集:4.5万;测试集,数万,不提供下载。</p> 
  <h4>可能的用途:</h4> 
  <pre><code>可以做为通用中文语料,训练词向量或做为预训练的语料;也可以用于构建百科类问答;其中类别信息比较有用,可以用于做监督训练,从而构建

更好句子表示的模型、句子相似性任务等。
</code></pre> 
  <h4>结构:</h4> 
  <pre><code>{"qid":<qid>,"category":<category>,"title":<title>,"desc":<desc>,"answer":<answer>}

其中,category是问题的类型,title是问题的标题,desc是问题的描述,可以为空或与标题内容一致。
</code></pre> 
  <h4>例子:</h4> 
  <pre><code>{"qid": "qid_2540946131115409959", "category": "生活知识", "title": "冬天进补好一些呢,还是夏天进步好啊? ", "desc": "", "answer": "你好!\r\r当然是冬天进补好的了,夏天人体的胃处于收缩状态,不适宜大量的进补,所以我们有时候说:“夏天就要吃些清淡的,就是这个道理的。”\r\r不过,秋季进补要注意“四忌” 一忌多多益善。任何补药服用过量都有害。认为“多吃补药,有病治病,无病强身”是不的。过量进补会加重脾胃、肝脏负担。在夏季里,人们由于喝冷饮,常食冻品,多有脾胃功能减弱的现象,这时候如果突然大量进补,会骤然加重脾胃及肝脏的负担,使长期处于疲弱的消化器官难于承受,导致消化器官功能紊乱。 \r\r二忌以药代食。重药物轻食物的做法是不科学的,许多食物也是好的滋补品。如多吃荠菜可治疗高血压;多吃萝卜可健胃消食,顺气宽胸;多吃山药能补脾胃。日常食用的胡桃、芝麻、花生、红枣、扁豆等也是进补的佳品。\r\r三忌越贵越好。每个人的身体状况不同,因此与之相适应的补品也是不同的。价格昂贵的补品如燕窝、人参之类并非对每个人都适合。每种进补品都有一定的对象和适应症,应以实用有效为滋补原则,缺啥补啥。 \r\r四忌只补肉类。秋季适当食用牛羊肉进补效果好。但经过夏季后,由于脾胃尚未完全恢复到正常功能,因此过于油腻的食品不易消化吸收。另外,体内过多的脂类、糖类等物质堆积可能诱发心脑血管病。"}
</code></pre> 
  <h4>公开评测:</h4> 
  <p>欢迎报告模型在验证集上的准确率。任务1: 类别预测。</p> 
  <p>报告包括:#1)验证集上准确率;#2)采用的模型、方法描述、运行方式,1页PDF;#3)可运行的源代码(可选)</p> 
  <p>基于#2和#3,我们会在测试集上做测试,并报告测试集上的准确率;只提供了#1和#2的队伍,验证集上的成绩依然可以被显示出来,但会被标记为未验证。</p> 
  <p><a href="http://img.e-com-net.com/image/info8/4d72e60c325648d9af4123fb8e424bf0.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/4d72e60c325648d9af4123fb8e424bf0.jpg" alt="在这里插入图片描述" width="650" height="61"></a></p> 
  <h4>4.社区问答json版(webtext2019zh) :大规模高质量数据集</h4> 
  <p>410万个问答( 过滤后数据3.7G,压缩文件1.7G;数据跨度:2015-2016年)</p> 
  <p>Google Drive下载</p> 
  <h4>数据描述</h4> 
  <p>含有410万个预先过滤过的、高质量问题和回复。每个问题属于一个【话题】,总共有2.8万个各式话题,话题包罗万象。</p> 
  <p>从1400万个原始问答中,筛选出至少获得3个点赞以上的的答案,代表了回复的内容比较不错或有趣,从而获得高质量的数据集。</p> 
  <p>除了对每个问题对应一个话题、问题的描述、一个或多个回复外,每个回复还带有点赞数、回复ID、回复者的标签。</p> 
  <p>数据集划分:数据去重并分成三个部分。训练集:412万;验证集:6.8万;测试集a:6.8万;测试集b,不提供下载。</p> 
  <h4>可能的用途:</h4> 
  <pre><code>1)构建百科类问答:输入一个问题,构建检索系统得到一个回复或生产一个回复;或根据相关关键词从,社区问答库中筛选出你相关的领域数据

2)训练话题预测模型:输入一个问题(和或描述),预测属于话题。

3)训练社区问答(cQA)系统:针对一问多答的场景,输入一个问题,找到最相关的问题,在这个基础上基于不同答案回复的质量、

  问题与答案的相关性,找到最好的答案。

4)做为通用中文语料,做大模型预训练的语料或训练词向量。其中类别信息也比较有用,可以用于做监督训练,从而构建更好句子表示的模型、句子相似性任务等。

5)结合点赞数量这一额外信息,预测回复的受欢迎程度或训练答案评分系统。
</code></pre> 
  <h4>结构:</h4> 
  <pre><code>{"qid":<qid>,"title":<title>,"desc":<desc>,"topic":<topic>,"star":<star>,"content":<content>,

"answer_id":<answer_id>,"answerer_tags":<answerer_tags>}

其中,qid是问题的id,title是问题的标题,desc是问题的描述,可以为空;topic是问题所属的话题,star是该回复的点赞个数,

content是回复的内容,answer_id是回复的ID,answerer_tags是回复者所携带的标签
</code></pre> 
  <h4>例子:</h4> 
  <pre><code>{"qid": 65618973, "title": "AlphaGo只会下围棋吗?阿法狗能写小说吗?", "desc": "那么现在会不会有智能机器人能从事文学创作?<br>如果有,能写出什么水平的作品?", "topic": "机器人", "star": 3, "content": "AlphaGo只会下围棋,因为它的设计目的,架构,技术方案以及训练数据,都是围绕下围棋这个核心进行的。它在围棋领域的突破,证明了深度学习深度强化学习MCTS技术在围棋领域的有效性,并且取得了重大的PR效果。AlphaGo不会写小说,它是专用的,不会做跨出它领域的其它事情,比如语音识别,人脸识别,自动驾驶,写小说或者理解小说。如果要写小说,需要用到自然语言处理(NLP))中的自然语言生成技术,那是人工智能领域一个", "answer_id": 545576062, "answerer_tags": "人工智能@游戏业"}
</code></pre> 
  <p><a href="http://img.e-com-net.com/image/info8/11a401ddc05c41e294badc8ed3fa3957.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/11a401ddc05c41e294badc8ed3fa3957.jpg" alt="在这里插入图片描述" width="650" height="75"></a></p> 
  <h4>在该数据集上的公开评测和任务:</h4> 
  <p>任务1: 话题预测。</p> 
  <p>报告包括:#1)验证集上准确率;#2)采用的模型、方法描述、运行方式,1页PDF;#3)可运行的源代码(可选)</p> 
  <p>基于#2和#3,我们会在测试集上做测试,并报告测试集上的准确率;只提供了#1和#2的队伍,验证集上的成绩依然可以被显示出来,但会被标记为未验证。</p> 
  <p>任务2:训练社区问答(cQA)系统。</p> 
  <p>要求:评价指标采用MAP,构建一个适合排序问题的测试集,并报告在该测试集上的效果。</p> 
  <p>任务3:使用该数据集(webtext2019zh),参考OpenAI的GPT-2,训练中文的文本写作模型、测试在其他数据集上的zero-shot的效果,或测评语言模型的效果。</p> 
  <h4>5.翻译语料(translation2019zh)</h4> 
  <p>520万个中英文平行语料( 原始数据1.1G,压缩文件596M)</p> 
  <p>Google Drive下载</p> 
  <h4>数据描述</h4> 
  <p>中英文平行语料520万对。每一个对,包含一个英文和对应的中文。中文或英文,多数情况是一句带标点符号的完整的话。</p> 
  <p>对于一个平行的中英文对,中文平均有36个字,英文平均有19个单词(单词如“she”)</p> 
  <p>数据集划分:数据去重并分成三个部分。训练集:516万;验证集:3.9万;测试集,数万,不提供下载。</p> 
  <h4>可能的用途:</h4> 
  <pre><code>可以用于训练中英文翻译系统,从中文翻译到英文,或从英文翻译到中文;

由于有上百万的中文句子,可以只抽取中文的句子,做为通用中文语料,训练词向量或做为预训练的语料。英文任务也可以类似操作;
</code></pre> 
  <h4>结构:</h4> 
  <pre><code>{"english": <english>, "chinese": <chinese>}

其中,english是英文句子,chinese是中文句子,中英文一一对应。
</code></pre> 
  <h4>例子:</h4> 
  <pre><code>{"english": "In Italy, there is no real public pressure for a new, fairer tax system.", "chinese": "在意大利,公众不会真的向政府施压,要求实行新的、更公平的税收制度。"}
</code></pre> 
  <p>,数万,不提供下载。</p> 
  <h4>可能的用途:</h4> 
  <pre><code>可以用于训练中英文翻译系统,从中文翻译到英文,或从英文翻译到中文;

由于有上百万的中文句子,可以只抽取中文的句子,做为通用中文语料,训练词向量或做为预训练的语料。英文任务也可以类似操作;
</code></pre> 
  <h4>结构:</h4> 
  <pre><code>{"english": <english>, "chinese": <chinese>}

其中,english是英文句子,chinese是中文句子,中英文一一对应。
</code></pre> 
  <h4>例子:</h4> 
  <pre><code>{"english": "In Italy, there is no real public pressure for a new, fairer tax system.", "chinese": "在意大利,公众不会真的向政府施压,要求实行新的、更公平的税收制度。"}
</code></pre> 
  <p><a href="http://img.e-com-net.com/image/info8/4e495001bb4e47b6b61a43d5d05cfb03.jpg" target="_blank"><img src="http://img.e-com-net.com/image/info8/4e495001bb4e47b6b61a43d5d05cfb03.jpg" alt="开源大模型文档_第15张图片" width="650" height="104" style="border:1px solid black;"></a></p> 
 </div> 
</div>
                            </div>
                        </div>
                    </div>
                    <!--PC和WAP自适应版-->
                    <div id="SOHUCS" sid="1669936168965332992"></div>
                    <script type="text/javascript" src="/views/front/js/chanyan.js"></script>
                    <!-- 文章页-底部 动态广告位 -->
                    <div class="youdao-fixed-ad" id="detail_ad_bottom"></div>
                </div>
                <div class="col-md-3">
                    <div class="row" id="ad">
                        <!-- 文章页-右侧1 动态广告位 -->
                        <div id="right-1" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad">
                            <div class="youdao-fixed-ad" id="detail_ad_1"> </div>
                        </div>
                        <!-- 文章页-右侧2 动态广告位 -->
                        <div id="right-2" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad">
                            <div class="youdao-fixed-ad" id="detail_ad_2"></div>
                        </div>
                        <!-- 文章页-右侧3 动态广告位 -->
                        <div id="right-3" class="col-lg-12 col-md-12 col-sm-4 col-xs-4 ad">
                            <div class="youdao-fixed-ad" id="detail_ad_3"></div>
                        </div>
                    </div>
                </div>
            </div>
        </div>
    </div>
    <div class="container">
        <h4 class="pt20 mb15 mt0 border-top">你可能感兴趣的:(人工智能,LLama,开源大模型,MOSS,chatglm)</h4>
        <div id="paradigm-article-related">
            <div class="recommend-post mb30">
                <ul class="widget-links">
                    <li><a href="/article/1940707020445380608.htm"
                           title="科普语音交互所需开源技术方案" target="_blank">科普语音交互所需开源技术方案</a>
                        <span class="text-muted"></span>

                        <div>以下是ASR(自动语音识别)、LLM(大语言模型)和TTS(文本转语音)三者结合的应用场景及开源方案:一、应用场景智能语音助手如百聆(Bailing),支持语音输入、意图理解、任务管理及语音输出,端到端延迟仅800ms,支持打断和记忆功能。车载语音交互系统(如蔚来、小鹏),结合ASR识别指令、LLM处理复杂查询(如"找有充电桩的高评分餐厅")和TTS提供语音反馈。语音到语音翻译(S2ST)阿里Fu</div>
                    </li>
                    <li><a href="/article/1940706767839227904.htm"
                           title="结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践" target="_blank">结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践</a>
                        <span class="text-muted">大模型之路</span>
<a class="tag" taget="_blank" href="/search/RAG/1.htm">RAG</a><a class="tag" taget="_blank" href="/search/rag/1.htm">rag</a>
                        <div>一、引言:混合RAG技术的发展与挑战在人工智能领域,检索增强生成(RAG)技术正成为构建智能问答系统的核心方案。传统RAG通过向量数据库存储文档嵌入并检索相关内容,结合大语言模型(LLM)生成回答,有效缓解了LLM的“幻觉”问题。然而,单一的稠密向量检索(如基于Transformer的嵌入模型)在处理关键词匹配和多义词歧义时存在局限性,而稀疏向量检索(如BM25)虽擅长精确关键词匹配,却缺乏语义理</div>
                    </li>
                    <li><a href="/article/1940706135157829632.htm"
                           title="SQLmap 使用指南:开启安全测试高效之旅" target="_blank">SQLmap 使用指南:开启安全测试高效之旅</a>
                        <span class="text-muted"></span>

                        <div>SQLmap作为一款强大的开源自动化SQL注入工具,在安全测试领域扮演着至关重要的角色,它能够精准检测并有效利用Web应用程序中潜藏的SQL注入漏洞。但请务必牢记,其使用必须严格限定在合法授权的范围内,以确保不触碰法律红线。安装SQLmap在Windows系统中安装SQLmap,首先要确保已成功安装Python环境。因为SQLmap是基于Python开发的,Python环境是其运行的基础。安装好P</div>
                    </li>
                    <li><a href="/article/1940702354538033152.htm"
                           title="DeepSeek 大模型:工单系统优化与企业提效关键" target="_blank">DeepSeek 大模型:工单系统优化与企业提效关键</a>
                        <span class="text-muted">合力亿捷-小亿</span>
<a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a>
                        <div>随着信息化时代的到来,企业对运营效率的需求日益增强,工单系统作为重要的运营管理工具,其优化程度直接影响到企业的响应速度与服务质量。DeepSeek大模型通过强大的数据处理能力,为工单系统提供了多维度的优化方案,从分类、派发到内容填充、优先级排序,再到知识管理,全面提升了工单处理的智能化与自动化水平,帮助企业在提升客户满意度的同时,也实现了自身运营效率的跃升。一、工单分类与派发1.精准分类工单分类是</div>
                    </li>
                    <li><a href="/article/1940701218137501696.htm"
                           title="学习笔记(29):训练集与测试集划分详解:train_test_split 函数深度解析" target="_blank">学习笔记(29):训练集与测试集划分详解:train_test_split 函数深度解析</a>
                        <span class="text-muted">宁儿数据安全</span>
<a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/1.htm">机器学习</a><a class="tag" taget="_blank" href="/search/%E5%AD%A6%E4%B9%A0/1.htm">学习</a><a class="tag" taget="_blank" href="/search/%E7%AC%94%E8%AE%B0/1.htm">笔记</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/1.htm">深度学习</a>
                        <div>学习笔记(29):训练集与测试集划分详解:train_test_split函数深度解析一、为什么需要划分训练集和测试集?在机器学习中,模型需要经历两个核心阶段:训练阶段:用训练集数据学习特征与目标值的映射关系(如线性回归的权重)。测试阶段:用测试集评估模型在未见过的数据上的表现,避免“过拟合”(模型只记住训练数据的噪声,无法泛化到新数据)。类比场景:学生通过“练习题”(训练集)学习知识,再通过“考</div>
                    </li>
                    <li><a href="/article/1940700083767013376.htm"
                           title="Redis总结" target="_blank">Redis总结</a>
                        <span class="text-muted">傲祥Ax</span>
<a class="tag" taget="_blank" href="/search/redis/1.htm">redis</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%BA%93/1.htm">数据库</a><a class="tag" taget="_blank" href="/search/Redis%E9%87%8D%E7%82%B9%E6%80%BB%E7%BB%93/1.htm">Redis重点总结</a>
                        <div>一、Redis是什么?key-value形式的非关系型数据库,基于内存(64位系统默认是物理内存的四分之三),单线程多路io复用,通常当缓存使用,提高查询效率。二、为什么使用Redis?2.1快(内单异高算)内存存储,单线程模型,异步操作,高效的网络通信,优化的算法和数据结构2.2作用2.2.1五大数据类型Redis存储,key-value形式,value的五种数据类型String,List,Se</div>
                    </li>
                    <li><a href="/article/1940696802416193536.htm"
                           title="[2219]基于JAVA的物流车智慧管理系统的设计与实现" target="_blank">[2219]基于JAVA的物流车智慧管理系统的设计与实现</a>
                        <span class="text-muted">阿鑫学长【毕设工场】</span>
<a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E5%BC%80%E5%8F%91%E8%AF%AD%E8%A8%80/1.htm">开发语言</a><a class="tag" taget="_blank" href="/search/%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1/1.htm">课程设计</a><a class="tag" taget="_blank" href="/search/%E6%AF%95%E4%B8%9A%E8%AE%BE%E8%AE%A1/1.htm">毕业设计</a>
                        <div>毕业设计(论文)开题报告表姓名学院专业班级题目基于JAVA的物流车智慧管理系统的设计与实现指导老师(一)选题的背景和意义选题背景与意义:随着我国物流行业的快速发展和互联网技术的深度融合,高效、精准、智能的物流管理已经成为企业提升竞争力的关键要素。在当前信息化、智能化的大背景下,基于Java的物流车智慧管理系统的设计与实现具有重要的理论研究价值和广阔的应用前景。首先,从行业背景看,传统的物流管理模式</div>
                    </li>
                    <li><a href="/article/1940695039160152064.htm"
                           title="军事,本身就是智能" target="_blank">军事,本身就是智能</a>
                        <span class="text-muted">人机与认知实验室</span>
<a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a>
                        <div>军事智能后面两个字不重要,军事本身就是智能。军事活动中的许多决策和操作本质上都离不开“智能”,不论是指人类的智慧,还是现代技术和人工智能的应用。军事行动本质上是一种复杂的决策过程,涉及到战略、战术、资源配置、情报分析等多个方面。每一个决策都需要充分的智慧和智能的支持,考虑的因素包括敌我态势、地理环境、气候、技术优势等。人类指挥官的战略智慧和经验在军事行动中至关重要,但随着现代技术的发展,智能化技术</div>
                    </li>
                    <li><a href="/article/1940693271449759744.htm"
                           title="Python 3.11.6 Windows 64位版安装程序下载:轻松上手Python最新版本" target="_blank">Python 3.11.6 Windows 64位版安装程序下载:轻松上手Python最新版本</a>
                        <span class="text-muted">惠凯忱Montague</span>

                        <div>Python3.11.6Windows64位版安装程序下载:轻松上手Python最新版本去发现同类优质开源项目:https://gitcode.com/项目介绍在编程领域,Python无疑是一种极为流行且强大的编程语言。Python3.11.6Windows64位版安装程序的推出,为Windows用户提供了官方最新版本的安装便利。这个版本不仅包含了许多优化和新特性,而且确保了在64位Windows</div>
                    </li>
                    <li><a href="/article/1940691883902693376.htm"
                           title="【YOLOv11】ultralytics最新作品yolov11 AND 模型的训练、推理、验证、导出 以及 使用" target="_blank">【YOLOv11】ultralytics最新作品yolov11 AND 模型的训练、推理、验证、导出 以及 使用</a>
                        <span class="text-muted">Jackilina_Stone</span>
<a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/Deep/1.htm">Deep</a><a class="tag" taget="_blank" href="/search/Learning/1.htm">Learning</a><a class="tag" taget="_blank" href="/search/%E3%80%90%E6%94%B9%E8%BF%9B%E3%80%91YOLO%E7%B3%BB%E5%88%97/1.htm">【改进】YOLO系列</a><a class="tag" taget="_blank" href="/search/YOLO/1.htm">YOLO</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89/1.htm">计算机视觉</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/1.htm">深度学习</a>
                        <div>目录一ultralytics公司的最新作品YOLOV111yolov11的创新2安装YOLOv113PYTHONGuide二训练三验证四推理五导出模型六使用文档:https://docs.ultralytics.com/models/yolo11/代码链接:https://github.com/ultralytics/ultralyticsPerformanceMetrics</div>
                    </li>
                    <li><a href="/article/1940691631111991296.htm"
                           title="零基础学土壤物理建模|Hydrus2D、Hydrus3D实操教程+参数设置技巧" target="_blank">零基础学土壤物理建模|Hydrus2D、Hydrus3D实操教程+参数设置技巧</a>
                        <span class="text-muted">weixin_贾</span>
<a class="tag" taget="_blank" href="/search/%E5%9C%B0%E4%B8%8B%E6%B0%B4/1.htm">地下水</a><a class="tag" taget="_blank" href="/search/%E5%9C%9F%E5%A3%A4%E8%BD%AF%E4%BB%B6%E5%90%88%E9%9B%86/1.htm">土壤软件合集</a><a class="tag" taget="_blank" href="/search/Hydrus3D%E6%A8%A1%E5%9E%8B/1.htm">Hydrus3D模型</a><a class="tag" taget="_blank" href="/search/HYDRUS/1.htm">HYDRUS</a><a class="tag" taget="_blank" href="/search/2D%E6%A8%A1%E5%9E%8B/1.htm">2D模型</a>
                        <div>一、Hydrus简介发展历史HYDRUS2D/3D界面和功能介绍二、土壤物理基础知识1、土壤水流土壤物理性质土壤水的能量状态土壤水分特征曲线饱和土壤中的水流非饱和土壤中的水流Richards方程土壤水力学特性的缩放土壤水分入渗土壤水分蒸发滞后现象根系吸水水分胁迫和盐分胁迫双孔隙度/双渗透率模型2、溶质运移土壤溶质及其迁移转化形式对流弥散方程(CDE)土壤溶质穿透曲线溶质在土壤中的反应非吸附溶质的迁</div>
                    </li>
                    <li><a href="/article/1940689990358986752.htm"
                           title="分享一个 Cursor mdc 生成器,基于 Gemini 2.5,很实用!" target="_blank">分享一个 Cursor mdc 生成器,基于 Gemini 2.5,很实用!</a>
                        <span class="text-muted"></span>
<a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AFcursor%E5%90%8E%E7%AB%AF/1.htm">前端cursor后端</a>
                        <div>大家好,我是Immerse,一名独立开发者、内容创作者。关注公众号:#沉浸式趣谈,获取最新文章(更多内容只在公众号更新)个人网站:https://yaolifeng.com也同步更新。转载请在文章开头注明出处和版权信息。我会在这里分享关于编程、独立开发、AI干货、开源、个人思考等内容。如果本文对您有所帮助,欢迎动动小手指一键三连(点赞、评论、转发),给我一些支持和鼓励,谢谢!大部分小伙伴现在应该都</div>
                    </li>
                    <li><a href="/article/1940689741661925376.htm"
                           title="计算机网络高频面试题" target="_blank">计算机网络高频面试题</a>
                        <span class="text-muted"></span>

                        <div>1、介绍一下ISO七层网络模型?ISO七层网络模型(OSI参考模型)是国际标准化组织(ISO)提出的网络通信框架,将网络通信划分为七个逻辑层次,每层提供特定的服务并与相邻层交互。其核心目的是实现不同厂商设备的互操作性,并简化网络通信的设计与故障排查。(1)OSI七层模型的结构:物理层(PhysicalLayer)功能:负责传输原始比特流,定义电压、接口等物理特性。关键技术:双绞线、光纤、无线信号(</div>
                    </li>
                    <li><a href="/article/1940688102687305728.htm"
                           title="图像分类:从基础原理到前沿技术" target="_blank">图像分类:从基础原理到前沿技术</a>
                        <span class="text-muted">随机森林404</span>
<a class="tag" taget="_blank" href="/search/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89/1.htm">计算机视觉</a><a class="tag" taget="_blank" href="/search/%E5%88%86%E7%B1%BB/1.htm">分类</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98/1.htm">数据挖掘</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a>
                        <div>引言在当今数字化时代,图像数据正以惊人的速度增长。从社交媒体上的照片分享到医疗影像诊断,从自动驾驶到工业质检,图像分类技术已经成为人工智能领域最基础也最重要的应用之一。本文将全面介绍图像分类的基础概念、发展历程、关键技术、应用场景以及未来趋势,帮助读者系统性地理解这一领域。第一章图像分类概述1.1什么是图像分类图像分类(ImageClassification)是计算机视觉中的一项核心任务,其目标是</div>
                    </li>
                    <li><a href="/article/1940685832801284096.htm"
                           title="探索3D空间新维度:gltf-to-3d-tiles开源项目推荐" target="_blank">探索3D空间新维度:gltf-to-3d-tiles开源项目推荐</a>
                        <span class="text-muted">史琼鸽Power</span>

                        <div>探索3D空间新维度:gltf-to-3d-tiles开源项目推荐gltf-to-3d-tilesglTFto3dTilesConverter.ConvertglTFmodeltoGlb,b3dmor3dtilesformat.项目地址:https://gitcode.com/gh_mirrors/gl/gltf-to-3d-tiles在数字世界日益壮大的今天,高效地展示三维模型成为了技术领域的一大</div>
                    </li>
                    <li><a href="/article/1940685706032640000.htm"
                           title="通义灵码+DeepSeek:国产代码生成王炸组合,带你飞!" target="_blank">通义灵码+DeepSeek:国产代码生成王炸组合,带你飞!</a>
                        <span class="text-muted"></span>

                        <div>引言在人工智能飞速发展的当下,AI代码生成工具如雨后春笋般涌现,为开发者们带来了前所未有的编程体验。其中,国产的通义灵码结合DeepSeek模型异军突起,成为众多开发者关注的焦点。它们凭借强大的功能和出色的表现,在代码生成领域崭露头角,不仅提升了开发效率,还为编程工作流注入了新的活力。然而,如同任何新兴技术一样,在使用过程中也会遇到各种问题和挑战。本文将通过实测,深入剖析通义灵码与DeepSeek</div>
                    </li>
                    <li><a href="/article/1940685453342601216.htm"
                           title="数智管理学(二十七)" target="_blank">数智管理学(二十七)</a>
                        <span class="text-muted">虚谷23</span>
<a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%99%BA%E7%AE%A1%E7%90%86%E5%AD%A6/1.htm">数智管理学</a><a class="tag" taget="_blank" href="/search/%E4%BC%81%E4%B8%9A%E6%95%B0%E6%99%BA%E5%8C%96/1.htm">企业数智化</a><a class="tag" taget="_blank" href="/search/%E5%88%9B%E4%B8%9A%E5%88%9B%E6%96%B0/1.htm">创业创新</a><a class="tag" taget="_blank" href="/search/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/1.htm">数据分析</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a>
                        <div>第二章数智化重塑管理的核心概念第四节三者的协同作用:构建数智化管理新生态在当今数智化浪潮的深刻影响下,企业管理领域正经历着前所未有的变革与重塑。数据驱动、网络化协作和动态资源配置作为数智化管理的三大核心要素,它们之间相互交织、协同作用,共同构建起了一个全新的管理生态系统。这一生态系统的形成,不仅突破了传统管理模式的诸多局限,还在管理效率、灵活性和智能化程度等方面展现出了巨大的优势和潜力。深入理解这</div>
                    </li>
                    <li><a href="/article/1940684192316715008.htm"
                           title="大模型呼叫中心场景分享之三十七:建筑行业的应用场景" target="_blank">大模型呼叫中心场景分享之三十七:建筑行业的应用场景</a>
                        <span class="text-muted"></span>

                        <div>大模型呼叫中心场景分享之三十七:建筑行业的应用场景作者:开源大模型呼叫中心系统FreeAICC一、项目前期咨询服务智能化1.24小时智能项目咨询台当潜在客户致电咨询商业综合体建设项目时:-需求精准识别:系统自动分析客户描述,识别"5万平米商业综合体""LEED认证""智慧建筑"等关键需求-方案即时生成:基于200+类似项目数据库,3分钟内生成初步方案框架-案例智能推荐:推送3个最匹配的已建成项目案</div>
                    </li>
                    <li><a href="/article/1940682299297296384.htm"
                           title="常见JAVA集合面试题(自用整理,持续更新)" target="_blank">常见JAVA集合面试题(自用整理,持续更新)</a>
                        <span class="text-muted"></span>

                        <div>一、简要介绍Java集合框架的整体架构1.Java集合框架主要分为两大接口体系:Collection和Map。2.Collection是单列集合的根接口,下面又有三个子接口,分别是List(有序、可重复)、Set(无序、不可重复)和Queue(队列)。3.Map是双列集合的根接口,用于存储键值对。4.以下是java集合的基础架构图5.Java集合框架的核心继承关系图(文本描述版)├─Collect</div>
                    </li>
                    <li><a href="/article/1940682299892887552.htm"
                           title="Step-by-Step Diffusion&Flow Model Notes" target="_blank">Step-by-Step Diffusion&Flow Model Notes</a>
                        <span class="text-muted">克斯维尔的明天_</span>
<a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/1.htm">机器学习</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/1.htm">深度学习</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a>
                        <div>Step-by-StepNotesFundamentalsofDiffusion生成模型的目标与扩散模型的基本思想生成模型的目标生成模型的目的是给定一组来自某个未知分布p∗(x)p^{*}(x)p∗(x)的独立同分布(i.i.d.)样本,构建一个采样器,能够近似地从相同的分布中生成新的样本。例如,假设我们有一组狗的图像训练集,这些图像来自某个潜在分布pdogp_{\text{dog}}pdog,我</div>
                    </li>
                    <li><a href="/article/1940680030644400128.htm"
                           title="支付宝小程序优化秘籍:生活号联动玩法" target="_blank">支付宝小程序优化秘籍:生活号联动玩法</a>
                        <span class="text-muted">zhuzhuyaolai</span>
<a class="tag" taget="_blank" href="/search/%E5%B0%8F%E7%A8%8B%E5%BA%8F/1.htm">小程序</a><a class="tag" taget="_blank" href="/search/%E7%94%9F%E6%B4%BB/1.htm">生活</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a>
                        <div>在竞争激烈的移动应用生态中,支付宝小程序要想脱颖而出,实现流量与用户留存的突破,与生活号的联动运营是一大有力法宝。据支付宝小程序官方团队统计,同时运营小程序和生活号的商家,小程序留存率相较单边运营小程序的商家平均高出70%。下面就为大家详细解析支付宝小程序与生活号的联动玩法。相互导流,构建流量互通桥梁新用户关注生活号,自动跳转小程序利用权益吸引用户关注生活号,在用户关注成功后,自动跳转到小程序领取</div>
                    </li>
                    <li><a href="/article/1940675366444134400.htm"
                           title="机器学习:集成算法的装袋法(Bagging):随机森林(Random Forest)" target="_blank">机器学习:集成算法的装袋法(Bagging):随机森林(Random Forest)</a>
                        <span class="text-muted">rubyw</span>
<a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/%E6%A6%82%E5%BF%B5%E5%8F%8A%E7%90%86%E8%AE%BA/1.htm">概念及理论</a><a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/1.htm">机器学习</a><a class="tag" taget="_blank" href="/search/%E7%AE%97%E6%B3%95/1.htm">算法</a><a class="tag" taget="_blank" href="/search/%E9%9A%8F%E6%9C%BA%E6%A3%AE%E6%9E%97/1.htm">随机森林</a>
                        <div>随机森林(RandomForest)是一种集成学习方法,通过构建多个决策树并结合其预测结果来提升模型的性能和稳定性。它由LeoBreiman于2001年提出,广泛应用于分类和回归任务。以下是随机森林的详细介绍,包括其基本概念、构建过程、优缺点及应用场景。基本概念随机森林是一种基于决策树的集成算法,通过生成多棵决策树,并将这些树的预测结果结合起来,以提高整体模型的预测准确性和稳定性。每棵决策树都是在</div>
                    </li>
                    <li><a href="/article/1940674357734993920.htm"
                           title="uni-app 多端开发中 AI 的集成与适配:一次开发,智能多端运行" target="_blank">uni-app 多端开发中 AI 的集成与适配:一次开发,智能多端运行</a>
                        <span class="text-muted">欧阳天羲</span>
<a class="tag" taget="_blank" href="/search/%E5%A4%A7%E5%89%8D%E7%AB%AF%E4%B8%8E/1.htm">大前端与</a><a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a><a class="tag" taget="_blank" href="/search/%E7%9A%84%E6%B7%B1%E5%BA%A6%E8%9E%8D%E5%90%88/1.htm">的深度融合</a><a class="tag" taget="_blank" href="/search/%23/1.htm">#</a><a class="tag" taget="_blank" href="/search/AI/1.htm">AI</a><a class="tag" taget="_blank" href="/search/%E4%B8%8E%E5%A4%A7%E5%89%8D%E7%AB%AF%E6%A1%86%E6%9E%B6%E7%BB%93%E5%90%88%E7%AF%87/1.htm">与大前端框架结合篇</a><a class="tag" taget="_blank" href="/search/uni-app/1.htm">uni-app</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E5%89%8D%E7%AB%AF/1.htm">前端</a>
                        <div>一、引言:uni-app与AI多端集成的背景在当今跨平台开发趋势下,uni-app凭借"一次编写,多端运行"的特性成为企业级应用开发的首选框架之一。随着人工智能技术的普及,将AI能力集成到多端应用中已成为提升用户体验的关键需求。然而,小程序、APP、Web等不同端的运行环境差异显著,如何实现AI功能的统一集成与高效适配成为开发难点。本文将系统讲解在uni-app框架中集成AI能力的完整方案,涵盖跨</div>
                    </li>
                    <li><a href="/article/1940674104734576640.htm"
                           title="大语言模型技术系列讲解:大模型应用了哪些技术" target="_blank">大语言模型技术系列讲解:大模型应用了哪些技术</a>
                        <span class="text-muted">知世不是芝士</span>
<a class="tag" taget="_blank" href="/search/%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B/1.htm">语言模型</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/1.htm">自然语言处理</a><a class="tag" taget="_blank" href="/search/chatgpt/1.htm">chatgpt</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%A8%A1%E5%9E%8B/1.htm">大模型</a>
                        <div>为了弄懂大语言模型原理和技术细节,笔者计划展开系列学习,并将所学内容从简单到复杂的过程给大家做分享,希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲,先列出大模型使用到了哪些技术,目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型(LLMs)在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要</div>
                    </li>
                    <li><a href="/article/1940673852094869504.htm"
                           title="森林的智慧:随机森林与集成学习的民主之道" target="_blank">森林的智慧:随机森林与集成学习的民主之道</a>
                        <span class="text-muted">田园Coder</span>
<a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E7%A7%91%E6%99%AE/1.htm">人工智能科普</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E7%A7%91%E6%99%AE/1.htm">科普</a>
                        <div>当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界,展示了“团结弱者为强者”的集成魅力时,另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”,但走的是一条与AdaBoost截然不同的路径:它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本,而是致力于创造尽可能多样化的模型,然后让这些模型平等地投票。它的核心哲学是:如果每</div>
                    </li>
                    <li><a href="/article/1940673724877434880.htm"
                           title="工具学习_CVE Binary Tool" target="_blank">工具学习_CVE Binary Tool</a>
                        <span class="text-muted"></span>

                        <div>1.工具概述CVEBinaryTool是一个免费的开源工具,可帮助您使用国家漏洞数据库(NVD)常见漏洞和暴露(CVE)列表中的数据以及Redhat、开源漏洞数据库(OSV)、Gitlab咨询数据库(GAD)和Curl中的已知漏洞数据来查找软件中的已知脆弱性。该工具有两种主要操作模式:二进制扫描程序:可帮助您确定哪些包可能已作为软件的一部分包含在内。该程序包括360检查器,扫描程序主要适用于常见的</div>
                    </li>
                    <li><a href="/article/1940670322218954752.htm"
                           title="大模型算法工程师面试宝典:精选面试题及参考答案全解析,助你备战AI算法工程师岗位!" target="_blank">大模型算法工程师面试宝典:精选面试题及参考答案全解析,助你备战AI算法工程师岗位!</a>
                        <span class="text-muted">大模型入门学习</span>
<a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86/1.htm">产品经理</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%95%B0%E6%8D%AE/1.htm">大数据</a><a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/1.htm">机器学习</a><a class="tag" taget="_blank" href="/search/%E7%A8%8B%E5%BA%8F%E5%91%98/1.htm">程序员</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%A8%A1%E5%9E%8B/1.htm">大模型</a><a class="tag" taget="_blank" href="/search/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%AD%A6%E4%B9%A0/1.htm">大模型学习</a>
                        <div>大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业,包括自然语言处理、机器翻译、内容创作和客户服务等,正成为未来商业环境的重要组成部分。截至目前大模型已超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关面试也是越来越卷。我今天给大家分享一篇大模型的面试题总结,内容较长,喜欢记得收藏、关注、点赞。ii.为什么会出现LLMs复读机问题?出现LLMs复读机问题可能</div>
                    </li>
                    <li><a href="/article/1940665154073063424.htm"
                           title="机器学习在智能金融风险评估中的应用:信用评分与欺诈检测" target="_blank">机器学习在智能金融风险评估中的应用:信用评分与欺诈检测</a>
                        <span class="text-muted">Blossom.118</span>
<a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E4%B8%8E%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">机器学习与人工智能</a><a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E4%BA%BA/1.htm">机器人</a><a class="tag" taget="_blank" href="/search/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/1.htm">机器学习</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/1.htm">人工智能</a><a class="tag" taget="_blank" href="/search/python/1.htm">python</a><a class="tag" taget="_blank" href="/search/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/1.htm">深度学习</a><a class="tag" taget="_blank" href="/search/sklearn/1.htm">sklearn</a><a class="tag" taget="_blank" href="/search/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89/1.htm">计算机视觉</a>
                        <div>在金融行业,风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展,金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用,特别是信用评分和欺诈检测方面的最新进展,并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分(一)传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型,如逻辑回归。这些方法</div>
                    </li>
                    <li><a href="/article/1940664397160574976.htm"
                           title="CentOS系统新手指导手册" target="_blank">CentOS系统新手指导手册</a>
                        <span class="text-muted">chanalbert</span>
<a class="tag" taget="_blank" href="/search/centos/1.htm">centos</a><a class="tag" taget="_blank" href="/search/linux/1.htm">linux</a><a class="tag" taget="_blank" href="/search/%E8%BF%90%E7%BB%B4/1.htm">运维</a>
                        <div>一、CentOS系统概述1.1CentOS的诞生与核心价值起源:CentOS(CommunityENTerpriseOperatingSystem)是基于RedHatEnterpriseLinux(RHEL)的开源发行版,由社区维护,提供与RHEL完全兼容的免费企业级Linux系统。特点:稳定性:通过长期支持(LTS)版本(如CentOS7/8)保证系统稳定性。企业级特性:适配服务器、云计算、虚拟</div>
                    </li>
                    <li><a href="/article/1940664397944909824.htm"
                           title="LLM---大语言模型技术研究报告" target="_blank">LLM---大语言模型技术研究报告</a>
                        <span class="text-muted"></span>

                        <div>摘要大语言模型(LLMs)已从技术突破走向产业规模化落地。2025年,全球LLMs进入“模型即服务”(MaaS)时代,参数量级突破万亿级,多模态能力、智能体协作、专业化细分成为主流趋势。中国大模型领域在DeepSeek、通义千问、讯飞星火等头部模型推动下,实现技术突破与场景创新。本报告基于截至2025年7月的最新数据,系统梳理LLMs的技术演进、应用场景、挑战与未来方向。一、大语言模型的演进与突破</div>
                    </li>
                                <li><a href="/article/33.htm"
                                       title="Spring的注解积累" target="_blank">Spring的注解积累</a>
                                    <span class="text-muted">yijiesuifeng</span>
<a class="tag" taget="_blank" href="/search/spring/1.htm">spring</a><a class="tag" taget="_blank" href="/search/%E6%B3%A8%E8%A7%A3/1.htm">注解</a>
                                    <div>用注解来向Spring容器注册Bean。 
  
需要在applicationContext.xml中注册: 
<context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。 
如:在base-package指明一个包    
<context:component-sc</div>
                                </li>
                                <li><a href="/article/160.htm"
                                       title="传感器" target="_blank">传感器</a>
                                    <span class="text-muted">百合不是茶</span>
<a class="tag" taget="_blank" href="/search/android/1.htm">android</a><a class="tag" taget="_blank" href="/search/%E4%BC%A0%E6%84%9F%E5%99%A8/1.htm">传感器</a>
                                    <div>android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件 
  
下面就以重力传感器为例; 
  
1,在onCreate中获得传感器服务 
  
private SensorManager sm;// 获得系统的服务
	private Sensor sensor;// 创建传感器实例

	@Override
	protected void </div>
                                </li>
                                <li><a href="/article/287.htm"
                                       title="[光磁与探测]金吕玉衣的意义" target="_blank">[光磁与探测]金吕玉衣的意义</a>
                                    <span class="text-muted">comsci</span>

                                    <div>      这是一个古代人的秘密:现在告诉大家 
 
      信不信由你们: 
 
      穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星 
 
      这就是为什么古代</div>
                                </li>
                                <li><a href="/article/414.htm"
                                       title="精简的反序打印某个数" target="_blank">精简的反序打印某个数</a>
                                    <span class="text-muted">沐刃青蛟</span>
<a class="tag" taget="_blank" href="/search/%E6%89%93%E5%8D%B0/1.htm">打印</a>
                                    <div>以前看到一些让求反序打印某个数的程序。 
比如:输入123,输出321。 
  
记得以前是告诉你是几位数的,当时就抓耳挠腮,完全没有思路。 
  
似乎最后是用到%和/方法解决的。 
  
而今突然想到一个简短的方法,就可以实现任意位数的反序打印(但是如果是首位数或者尾位数为0时就没有打印出来了) 
  
代码如下: 
	long num, num1=0;</div>
                                </li>
                                <li><a href="/article/541.htm"
                                       title="PHP:6种方法获取文件的扩展名" target="_blank">PHP:6种方法获取文件的扩展名</a>
                                    <span class="text-muted">IT独行者</span>
<a class="tag" taget="_blank" href="/search/PHP/1.htm">PHP</a><a class="tag" taget="_blank" href="/search/%E6%89%A9%E5%B1%95%E5%90%8D/1.htm">扩展名</a>
                                    <div>  
PHP:6种方法获取文件的扩展名 
  
1、字符串查找和截取的方法 
       1      
$extension 
= 
substr 
( 
strrchr 
( 
$file 
,  
'.' 
), 1);       
2、字符串查找和截取的方法二 
       1      
$extension 
= 
substr </div>
                                </li>
                                <li><a href="/article/668.htm"
                                       title="面试111" target="_blank">面试111</a>
                                    <span class="text-muted">文强chu</span>
<a class="tag" taget="_blank" href="/search/%E9%9D%A2%E8%AF%95/1.htm">面试</a>
                                    <div> 1事务隔离级别有那些 ,事务特性是什么(问到一次)
 2 spring aop 如何管理事务的,如何实现的。动态代理如何实现,jdk怎么实现动态代理的,ioc是怎么实现的,spring是单例还是多例,有那些初始化bean的方式,各有什么区别(经常问)
 3 struts默认提供了那些拦截器 (一次)
 4 过滤器和拦截器的区别 (频率也挺高)
 5 final,finally final</div>
                                </li>
                                <li><a href="/article/795.htm"
                                       title="XML的四种解析方式" target="_blank">XML的四种解析方式</a>
                                    <span class="text-muted">小桔子</span>
<a class="tag" taget="_blank" href="/search/dom/1.htm">dom</a><a class="tag" taget="_blank" href="/search/jdom/1.htm">jdom</a><a class="tag" taget="_blank" href="/search/dom4j/1.htm">dom4j</a><a class="tag" taget="_blank" href="/search/sax/1.htm">sax</a>
                                    <div>在平时工作中,难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案,哪个最适合我们呢?在这篇文章中,我对这四种主流方案做一个不完全评测,仅仅针对遍历 XML 这块来测试,因为遍历 XML 是工作中使用最多的(至少我认为)。   预 备   测试环境:   AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server </div>
                                </li>
                                <li><a href="/article/922.htm"
                                       title="wordpress中常见的操作" target="_blank">wordpress中常见的操作</a>
                                    <span class="text-muted">aichenglong</span>
<a class="tag" taget="_blank" href="/search/%E4%B8%AD%E6%96%87%E6%B3%A8%E5%86%8C/1.htm">中文注册</a><a class="tag" taget="_blank" href="/search/wordpress/1.htm">wordpress</a><a class="tag" taget="_blank" href="/search/%E7%A7%BB%E9%99%A4%E8%8F%9C%E5%8D%95/1.htm">移除菜单</a>
                                    <div>1 wordpress中使用中文名注册解决办法 
  1)使用插件 
  2)修改wp源代码 
     进入到wp-include/formatting.php文件中找到 
      function sanitize_user( $username, $strict = false </div>
                                </li>
                                <li><a href="/article/1049.htm"
                                       title="小飞飞学管理-1" target="_blank">小飞飞学管理-1</a>
                                    <span class="text-muted">alafqq</span>
<a class="tag" taget="_blank" href="/search/%E7%AE%A1%E7%90%86/1.htm">管理</a>
                                    <div>项目管理的下午题,其实就在提出问题(挑刺),分析问题,解决问题。 
今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。 
结合我自己经历写下心得 
 
对于公司选拔和培养项目经理的制度有什么毛病呢? 
1,公司考察,选拔项目经理,只关注技术能力,而很少或没有关注管理方面的经验,能力。 
2,公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 
3,公司对项目经理的工作缺乏进行指</div>
                                </li>
                                <li><a href="/article/1176.htm"
                                       title="IO输入输出部分探讨" target="_blank">IO输入输出部分探讨</a>
                                    <span class="text-muted">百合不是茶</span>
<a class="tag" taget="_blank" href="/search/IO/1.htm">IO</a>
                                    <div> 
 //文件处理  在处理文件输入输出时要引入java.IO这个包; 
/* 
1,运用File类对文件目录和属性进行操作 
2,理解流,理解输入输出流的概念 
3,使用字节/符流对文件进行读/写操作 
4,了解标准的I/O 
5,了解对象序列化 
*/ 
  
//1,运用File类对文件目录和属性进行操作 
  
//在工程中线创建一个text.txt</div>
                                </li>
                                <li><a href="/article/1303.htm"
                                       title="getElementById的用法" target="_blank">getElementById的用法</a>
                                    <span class="text-muted">bijian1013</span>
<a class="tag" taget="_blank" href="/search/element/1.htm">element</a>
                                    <div>        getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签,条件很简单,就是给每个标签分配一个ID号。 
       返回具有指定ID属性值的第一个对象的一个引用。 
       语法: 
&n</div>
                                </li>
                                <li><a href="/article/1430.htm"
                                       title="励志经典语录" target="_blank">励志经典语录</a>
                                    <span class="text-muted">bijian1013</span>
<a class="tag" taget="_blank" href="/search/%E5%8A%B1%E5%BF%97/1.htm">励志</a><a class="tag" taget="_blank" href="/search/%E4%BA%BA%E7%94%9F/1.htm">人生</a>
                                    <div>经典语录1:  
  哈佛有一个著名的理论:人的差别在于业余时间,而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论,你会发现,你的人生正在发生改变,坚持数年之后,成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息,看就看一些励志的影视或者文章,不要当作消遣;学会思考人生,学会感悟人生</div>
                                </li>
                                <li><a href="/article/1557.htm"
                                       title="[MongoDB学习笔记三]MongoDB分片" target="_blank">[MongoDB学习笔记三]MongoDB分片</a>
                                    <span class="text-muted">bit1129</span>
<a class="tag" taget="_blank" href="/search/mongodb/1.htm">mongodb</a>
                                    <div>MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题,另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题,MongoDB作为云计算时代的分布式数据库,大容量数据存储,高效并发的数据存取,自动容错等是MongoDB的关键指标。 
本篇介绍MongoDB的切片(Sharding) 
  1.何时需要分片 
&nbs</div>
                                </li>
                                <li><a href="/article/1684.htm"
                                       title="【Spark八十三】BlockManager在Spark中的使用场景" target="_blank">【Spark八十三】BlockManager在Spark中的使用场景</a>
                                    <span class="text-muted">bit1129</span>
<a class="tag" taget="_blank" href="/search/manager/1.htm">manager</a>
                                    <div>1. Broadcast变量的存储,在HttpBroadcast类中可以知道 
2. RDD通过CacheManager存储RDD中的数据,CacheManager也是通过BlockManager进行存储的 
3. ShuffleMapTask得到的结果数据,是通过FileShuffleBlockManager进行管理的,而FileShuffleBlockManager最终也是使用BlockMan</div>
                                </li>
                                <li><a href="/article/1811.htm"
                                       title="yum方式部署zabbix" target="_blank">yum方式部署zabbix</a>
                                    <span class="text-muted">ronin47</span>
<a class="tag" taget="_blank" href="/search/yum%E6%96%B9%E5%BC%8F%E9%83%A8%E7%BD%B2zabbix/1.htm">yum方式部署zabbix</a>
                                    <div>安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-</div>
                                </li>
                                <li><a href="/article/1938.htm"
                                       title="Hibernate4和MySQL5.5自动创建表失败问题解决方法" target="_blank">Hibernate4和MySQL5.5自动创建表失败问题解决方法</a>
                                    <span class="text-muted">byalias</span>
<a class="tag" taget="_blank" href="/search/J2EE/1.htm">J2EE</a><a class="tag" taget="_blank" href="/search/Hibernate4/1.htm">Hibernate4</a>
                                    <div>今天初学Hibernate4,了解了使用Hibernate的过程。大体分为4个步骤: 
①创建hibernate.cfg.xml文件 
②创建持久化对象 
③创建*.hbm.xml映射文件 
④编写hibernate相应代码 
在第四步中,进行了单元测试,测试预期结果是hibernate自动帮助在数据库中创建数据表,结果JUnit单元测试没有问题,在控制台打印了创建数据表的SQL语句,但在数据库中</div>
                                </li>
                                <li><a href="/article/2065.htm"
                                       title="Netty源码学习-FrameDecoder" target="_blank">Netty源码学习-FrameDecoder</a>
                                    <span class="text-muted">bylijinnan</span>
<a class="tag" taget="_blank" href="/search/java/1.htm">java</a><a class="tag" taget="_blank" href="/search/netty/1.htm">netty</a>
                                    <div>Netty 3.x的user guide里FrameDecoder的例子,有几个疑问: 
 1.文档说:FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 
 为什么每次有新数据到达时,都会调用decode方法? 
 2.Dec</div>
                                </li>
                                <li><a href="/article/2192.htm"
                                       title="SQL行列转换方法" target="_blank">SQL行列转换方法</a>
                                    <span class="text-muted">chicony</span>
<a class="tag" taget="_blank" href="/search/%E8%A1%8C%E5%88%97%E8%BD%AC%E6%8D%A2/1.htm">行列转换</a>
                                    <div>  
  
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) 
insert into tb values('三星' , '0-5' , 74) 
insert into tb values('三星' , '10-15' , 83) 
insert into tb values('苹果' , '0-5' , 93) 
</div>
                                </li>
                                <li><a href="/article/2319.htm"
                                       title="中文编码测试" target="_blank">中文编码测试</a>
                                    <span class="text-muted">ctrain</span>
<a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A0%81/1.htm">编码</a>
                                    <div>循环打印转换编码 
 

String[] codes = {
    "iso-8859-1",
    "utf-8",
    "gbk",
    "unicode"
};

for (int i = 0; i < codes.length; i++) {
    for (int j </div>
                                </li>
                                <li><a href="/article/2446.htm"
                                       title="hive 客户端查询报堆内存溢出解决方法" target="_blank">hive 客户端查询报堆内存溢出解决方法</a>
                                    <span class="text-muted">daizj</span>
<a class="tag" taget="_blank" href="/search/hive/1.htm">hive</a><a class="tag" taget="_blank" href="/search/%E5%A0%86%E5%86%85%E5%AD%98%E6%BA%A2%E5%87%BA/1.htm">堆内存溢出</a>
                                    <div>hive> select * from t_test where ds=20150323 limit 2; 
OK 
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 
  
问题原因: hive堆内存默认为256M 
  
这个问题的解决方法为: 
修改/us</div>
                                </li>
                                <li><a href="/article/2573.htm"
                                       title="人有多大懒,才有多大闲 (评论『卓有成效的程序员』)" target="_blank">人有多大懒,才有多大闲 (评论『卓有成效的程序员』)</a>
                                    <span class="text-muted">dcj3sjt126com</span>
<a class="tag" taget="_blank" href="/search/%E7%A8%8B%E5%BA%8F%E5%91%98/1.htm">程序员</a>
                                    <div>  
卓有成效的程序员给我的震撼很大,程序员作为特殊的群体,有的人可以这么懒,  懒到事情都交给机器去做 ,而有的人又可以那么勤奋,每天都孜孜不倦得做着重复单调的工作。 
  
在看这本书之前,我属于勤奋的人,而看完这本书以后,我要努力变成懒惰的人。 
不要在去庞大的开始菜单里面一项一项搜索自己的应用程序,也不要在自己的桌面上放置眼花缭乱的快捷图标</div>
                                </li>
                                <li><a href="/article/2700.htm"
                                       title="Eclipse简单有用的配置" target="_blank">Eclipse简单有用的配置</a>
                                    <span class="text-muted">dcj3sjt126com</span>
<a class="tag" taget="_blank" href="/search/eclipse/1.htm">eclipse</a>
                                    <div>1、显示行号  Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 
  
2、代码提示字符 Window ->Perferences,并依次展开 Java -> Editor -> Content Assist,最下面一栏 auto-Activation</div>
                                </li>
                                <li><a href="/article/2827.htm"
                                       title="在tomcat上面安装solr4.8.0全过程" target="_blank">在tomcat上面安装solr4.8.0全过程</a>
                                    <span class="text-muted">eksliang</span>
<a class="tag" taget="_blank" href="/search/Solr/1.htm">Solr</a><a class="tag" taget="_blank" href="/search/solr4.0%E5%90%8E%E7%9A%84%E7%89%88%E6%9C%AC%E5%AE%89%E8%A3%85/1.htm">solr4.0后的版本安装</a><a class="tag" taget="_blank" href="/search/solr4.8.0%E5%AE%89%E8%A3%85/1.htm">solr4.8.0安装</a>
                                    <div>转载请出自出处:
http://eksliang.iteye.com/blog/2096478  
      首先solr是一个基于java的web的应用,所以安装solr之前必须先安装JDK和tomcat,我这里就先省略安装tomcat和jdk了 
        
第一步:当然是下载去官网上下载最新的solr版本,下载地址</div>
                                </li>
                                <li><a href="/article/2954.htm"
                                       title="Android APP通用型拒绝服务、漏洞分析报告" target="_blank">Android APP通用型拒绝服务、漏洞分析报告</a>
                                    <span class="text-muted">gg163</span>
<a class="tag" taget="_blank" href="/search/%E6%BC%8F%E6%B4%9E/1.htm">漏洞</a><a class="tag" taget="_blank" href="/search/android/1.htm">android</a><a class="tag" taget="_blank" href="/search/APP/1.htm">APP</a><a class="tag" taget="_blank" href="/search/%E5%88%86%E6%9E%90/1.htm">分析</a>
                                    <div>点评:记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞,移动安全团队爱内测(ineice.com)发现了一个安卓客户端的通用型拒绝服务漏洞,来看看他们的详细分析吧。  
0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时,发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。  
针对序列化对象而出现的拒绝服务主要</div>
                                </li>
                                <li><a href="/article/3081.htm"
                                       title="HoverTree项目已经实现分层" target="_blank">HoverTree项目已经实现分层</a>
                                    <span class="text-muted">hvt</span>
<a class="tag" taget="_blank" href="/search/%E7%BC%96%E7%A8%8B/1.htm">编程</a><a class="tag" taget="_blank" href="/search/.net/1.htm">.net</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a><a class="tag" taget="_blank" href="/search/C%23/1.htm">C#</a><a class="tag" taget="_blank" href="/search/ASP.ENT/1.htm">ASP.ENT</a>
                                    <div>HoverTree项目已经初步实现分层,源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考:http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目,希望对你学习ASP.NET或者C#语言有帮助,如果你对</div>
                                </li>
                                <li><a href="/article/3208.htm"
                                       title="Google Maps API v3: Remove Markers 移除标记" target="_blank">Google Maps API v3: Remove Markers 移除标记</a>
                                    <span class="text-muted">天梯梦</span>
<a class="tag" taget="_blank" href="/search/google+maps+api/1.htm">google maps api</a>
                                    <div>Simply do the following: 
  
I. Declare a global variable: 
var markersArray = []; 
  
II. Define a function: 
function clearOverlays() {
  for (var i = 0; i < markersArray.length; i++ )</div>
                                </li>
                                <li><a href="/article/3335.htm"
                                       title="jQuery选择器总结" target="_blank">jQuery选择器总结</a>
                                    <span class="text-muted">lq38366</span>
<a class="tag" taget="_blank" href="/search/jquery/1.htm">jquery</a><a class="tag" taget="_blank" href="/search/%E9%80%89%E6%8B%A9%E5%99%A8/1.htm">选择器</a>
                                    <div>       1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40</div>
                                </li>
                                <li><a href="/article/3462.htm"
                                       title="基础数据结构和算法六:Quick sort" target="_blank">基础数据结构和算法六:Quick sort</a>
                                    <span class="text-muted">sunwinner</span>
<a class="tag" taget="_blank" href="/search/Algorithm/1.htm">Algorithm</a><a class="tag" taget="_blank" href="/search/Quicksort/1.htm">Quicksort</a>
                                    <div>Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t</div>
                                </li>
                                <li><a href="/article/3589.htm"
                                       title="如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作" target="_blank">如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作</a>
                                    <span class="text-muted">刘星宇</span>
<a class="tag" taget="_blank" href="/search/html/1.htm">html</a><a class="tag" taget="_blank" href="/search/Web/1.htm">Web</a>
                                    <div>今天在写一个flash广告代码的时候,因为flash自带的链接,容易被当成弹出广告,所以做了一个div层放到flash上面,这样链接都是a触发的不会被拦截,但发现flash一直处于div层上面,原来flash需要加个参数才可以。 
 
让flash置于DIV层之下的方法,让flash不挡住飘浮层或下拉菜单,让Flash不档住浮动对象或层的关键参数:wmode=opaque。 
 
方法如下: 
 </div>
                                </li>
                                <li><a href="/article/3716.htm"
                                       title="Mybatis实用Mapper SQL汇总示例" target="_blank">Mybatis实用Mapper SQL汇总示例</a>
                                    <span class="text-muted">wdmcygah</span>
<a class="tag" taget="_blank" href="/search/sql/1.htm">sql</a><a class="tag" taget="_blank" href="/search/mysql/1.htm">mysql</a><a class="tag" taget="_blank" href="/search/mybatis/1.htm">mybatis</a><a class="tag" taget="_blank" href="/search/%E5%AE%9E%E7%94%A8/1.htm">实用</a>
                                    <div>Mybatis作为一个非常好用的持久层框架,相关资料真的是少得可怜,所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法,希望能够对大家有所帮助。 
不少持久层框架对动态SQL的支持不足,在SQL需要动态拼接时非常苦恼,而Mybatis很好地解决了这个问题,算是框架的一大亮点。对于常见的场景,例如:批量插入/更新/删除,模糊查询,多条件查询,联表查询,</div>
                                </li>
                </ul>
            </div>
        </div>
    </div>

<div>
    <div class="container">
        <div class="indexes">
            <strong>按字母分类:</strong>
            <a href="/tags/A/1.htm" target="_blank">A</a><a href="/tags/B/1.htm" target="_blank">B</a><a href="/tags/C/1.htm" target="_blank">C</a><a
                href="/tags/D/1.htm" target="_blank">D</a><a href="/tags/E/1.htm" target="_blank">E</a><a href="/tags/F/1.htm" target="_blank">F</a><a
                href="/tags/G/1.htm" target="_blank">G</a><a href="/tags/H/1.htm" target="_blank">H</a><a href="/tags/I/1.htm" target="_blank">I</a><a
                href="/tags/J/1.htm" target="_blank">J</a><a href="/tags/K/1.htm" target="_blank">K</a><a href="/tags/L/1.htm" target="_blank">L</a><a
                href="/tags/M/1.htm" target="_blank">M</a><a href="/tags/N/1.htm" target="_blank">N</a><a href="/tags/O/1.htm" target="_blank">O</a><a
                href="/tags/P/1.htm" target="_blank">P</a><a href="/tags/Q/1.htm" target="_blank">Q</a><a href="/tags/R/1.htm" target="_blank">R</a><a
                href="/tags/S/1.htm" target="_blank">S</a><a href="/tags/T/1.htm" target="_blank">T</a><a href="/tags/U/1.htm" target="_blank">U</a><a
                href="/tags/V/1.htm" target="_blank">V</a><a href="/tags/W/1.htm" target="_blank">W</a><a href="/tags/X/1.htm" target="_blank">X</a><a
                href="/tags/Y/1.htm" target="_blank">Y</a><a href="/tags/Z/1.htm" target="_blank">Z</a><a href="/tags/0/1.htm" target="_blank">其他</a>
        </div>
    </div>
</div>
<footer id="footer" class="mb30 mt30">
    <div class="container">
        <div class="footBglm">
            <a target="_blank" href="/">首页</a> -
            <a target="_blank" href="/custom/about.htm">关于我们</a> -
            <a target="_blank" href="/search/Java/1.htm">站内搜索</a> -
            <a target="_blank" href="/sitemap.txt">Sitemap</a> -
            <a target="_blank" href="/custom/delete.htm">侵权投诉</a>
        </div>
        <div class="copyright">版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.
<!--            <a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank">京ICP备09083238号</a><br>-->
        </div>
    </div>
</footer>
<!-- 代码高亮 -->
<script type="text/javascript" src="/static/syntaxhighlighter/scripts/shCore.js"></script>
<script type="text/javascript" src="/static/syntaxhighlighter/scripts/shLegacy.js"></script>
<script type="text/javascript" src="/static/syntaxhighlighter/scripts/shAutoloader.js"></script>
<link type="text/css" rel="stylesheet" href="/static/syntaxhighlighter/styles/shCoreDefault.css"/>
<script type="text/javascript" src="/static/syntaxhighlighter/src/my_start_1.js"></script>





</body>

</html>