中生代技术

一文看全开源大语言模型汇总

转自分布式实验室

Alpaca/LLaMA（Meta/Stanford）

斯坦福 Alpaca：一个遵循指令的 LLaMA 模型。

LLaMA 网站：https://ai.facebook.com/blog/large-language-model-llama-meta-ai/

Alpaca 网站：https://crfm.stanford.edu/2023/03/13/alpaca.html

Alpaca GitHub：https://github.com/tatsu-lab/stanford_alpaca

能否用于商业用途：不能

以下是基于 Meta 的 LLaMA 项目或斯坦福大学的 Alpaca 项目的复制品或相关项目：

Alpaca.cpp

在你的设备上本地快速运行一个类似于 ChatGPT 的模型。下面的录屏并未加速，而是实际运行在一台配有 4GB 权重的 M2 MacBook Air 上。

GitHub：https://github.com/antimatter15/alpaca.cpp

Alpaca-LoRA

这个代码库包含了用低秩适应（LoRA）方法复现斯坦福 Alpaca 结果的代码。我们为树莓派（用于研究）提供了一个与 text-davinci-003 相似质量的 Instruct 模型，并且代码可以轻松地应用于 13b、30b 和 65b 模型。

GitHub：https://github.com/tloen/alpaca-lora

Demo：https://huggingface.co/spaces/tloen/alpaca-lora

AlpacaGPT4-LoRA-7B-OpenLLaMA

Hugging Face：https://huggingface.co/LLMs

LLMs Models：https://huggingface.co/LLMs

Baize

Baize 是一个使用低秩适应（LoRA）进行微调的开源聊天模型。它利用了由 ChatGPT 自我对话产生的 100,000 个对话数据。同时，我们还使用了 Alpaca 的数据来提高其性能表现。目前已经发布了 7B、13B 和 30B 的模型。

GitHub：https://github.com/project-baize/baize

Paper：https://arxiv.org/pdf/2304.01196.pdf

Cabrita

一款葡萄牙语微调的指令型 LLaMA 模型。

GitHub：https://github.com/22-hours/cabrita

Chinese-LLaMA-Alpaca

为了推动中文 NLP 社区大模型的开放研究，该项目开源了中文 LLaMA 模型和经过指令微调的 Alpaca 大型模型。这些模型在原始 LLaMA 的基础上，扩展了中文词汇表并使用中文数据进行二次预训练，从而进一步提高了对中文基本语义理解的能力。同时，中文 Alpaca 模型还进一步利用中文指令数据进行微调，明显提高了模型对指令理解和执行的能力。具体详情请参阅技术报告（崔、杨、姚，2023）。

GitHub：https://github.com/ymcui/Chinese-LLaMA-Alpaca

Chinese-Vicuna

一款基于 LLaMA 的中文遵循指令模型。

GitHub：https://github.com/Facico/Chinese-Vicuna

GPT4-x-Alpaca

GPT4-x-Alpaca 是一个经过 GPT4 对话与 GPTeacher 精细调整的 LLaMA 13B 模型。关于其训练和性能方面的资料相对较少。

Hugging Face：https://huggingface.co/chavinlo/gpt4-x-alpaca

gpt4-x-vicuna-13b

作为基础模型，采用了 https://huggingface.co/eachadea/vicuna-13b-1.1。对 Teknium 的 GPTeacher 数据集、未发布的 Roleplay v2 数据集、GPT-4-LLM 数据集以及 Nous Research Instruct 数据集进行了微调。大约包含 180，000 条来自 GPT-4 的指令，已清除所有 OpenAI 审查 /“作为 AI 语言模型” 等相关内容。

Hugging Face：https://huggingface.co/NousResearch/gpt4-x-vicuna-13b

GPT4All

这是一个训练助手式大语言模型的演示，基于 LLaMa，使用约 800k 个 GPT-3.5 Turbo 生成数据。

GitHub：https://github.com/nomic-ai/gpt4all

GitHub：https://github.com/nomic-ai/pyllamacpp

Review：https://www.youtube.com/watch?v=GhRNIuTA2Z0

GPTQ-for-LLaMA

使用 GPTQ 对 LLaMA 进行 4 位量化。GPTQ 是 SOTA 的单次权重量化方法。

GitHub：https://github.com/qwopqwop200/GPTQ-for-LLaMa

Koala

Koala 是基于 LLaMa 微调的语言模型。请查看下面 Blog，这篇文章介绍了下载、恢复 Koala 模型权重以及在本地运行 Koala 聊天机器人的过程。

Blog：https://bair.berkeley.edu/blog/2023/04/03/koala/

GitHub：https://github.com/young-geng/EasyLM/blob/main/docs/koala.md

Demo：https://chat.lmsys.org/?model=koala-13b

Review：https://www.youtube.com/watch?v=A4rcKUZieEU

Review：https://www.youtube.com/watch?v=kSLcedGSez8

llama.cpp

使用纯 C/C++ 实现 LLaMa 模型的推理过程。

GitHub：https://github.com/ggerganov/llama.cpp

支持三种模型：LLaMA、Alpaca 和 GPT4All

LLaMA-Adapter V2

LLaMA-Adapter：https://arxiv.org/pdf/2303.16199.pdf 和 LLaMA-Adapter V2：https://arxiv.org/pdf/2304.15010.pdf 已经发布。

GitHub：https://github.com/ZrrSkywalker/LLaMA-Adapter

Lit-LLaMA ️

LLaMA 独立实现，完全开源且遵循 Apache 2.0 许可证。这个实现是在 nanoGPT 的基础上构建的。

GitHub：https://github.com/Lightning-AI/lit-llama

OpenAlpaca

这是 OpenAlpaca 项目的代码仓库，旨在基于 OpenLLaMA 构建并分享一个指令跟随模型。与 OpenLLaMA 一样，OpenAlpaca 采用 Apache 2.0 许可证进行授权。该仓库包含以下内容：

用于微调模型的数据。
微调模型的代码。
微调模型的权重。
OpenAlpaca 的使用示例。

GitHub：https://github.com/yxuansu/OpenAlpaca

OpenBuddy：面向所有人的开放式多语言聊天机器人

OpenBuddy 是一个功能强大的开源多语言聊天机器人模型，旨在为全球用户提供无缝的英语、中文和其他语言的会话 AI 和多语言支持。该模型基于 Facebook 的 LLAMA 模型构建，通过微调扩展了词汇表、增加了常用字符和改进了令牌嵌入。

OpenBuddy 利用这些改进和多轮对话数据集提供了一个强大的模型，可以回答各种语言的问题并执行翻译任务。

GitHub：https://github.com/OpenBuddy/OpenBuddy

Pygmalion-7b

Pygmalion 7B 是一个对话模型，基于 Meta 的 LLaMA-7B 模型构建。这是版本 1。使用 Pygmalion-6B-v8-pt4 数据集的一个子集对模型进行了微调，对于熟悉该项目的人而言，这一点很重要。

Hugging Face：https://huggingface.co/PygmalionAI/pygmalion-7b

StableVicuna

我们自豪地介绍 StableVicuna，这是第一个通过强化学习从人类反馈中训练的大规模开源聊天机器人（RHLF）。StableVicuna 是 Vicuna v0 13b 的进一步指令微调和 RLHF 训练版本，而 Vicuna v0 13b 则是指令微调的 LLaMA 13b 模型。有兴趣的读者，可以阅读：https://vicuna.lmsys.org/

网站：https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

Hugging Face：https://huggingface.co/spaces/CarperAI/StableVicuna

Review：https://www.youtube.com/watch?v=m_xD0algP4k

StackLLaMA

这是一个在 Stack Exchange 上使用 RLHF 训练的 LLaMa 模型，使用了三种方法的组合：监督微调（SFT）、奖励 / 偏好建模（RM）和人类反馈的强化学习（RLHF），训练数据包括问题和答案。

网站：https://huggingface.co/blog/stackllama

The Bloke alpaca-lora-65B-GGML

对 changusung Alpaca-lora-65B 进行了 4 位和 2 位量化的 GGML 模型，以便在 CPU 上进行推理，同时使用 llama.cpp 实现。

Hugging Face：https://huggingface.co/TheBloke/alpaca-lora-65B-GGML

The Bloke’s StableVicuna-13B-GPTQ

这个代码仓库包含 CarterAI StableVicuna 13B 的 4 位 GPTQ 格式量化模型。这个模型的生成过程首先将上述代码仓库中的增量与原始的 Llama 13B 权重合并，然后使用 GPTQ-for-LLaMa 进行 4 位量化。

Hugging Face：https://huggingface.co/TheBloke/stable-vicuna-13B-GPTQ

The Bloke’s WizardLM-7B-uncensored-GPTQ

这些文件是 Eric Hartford “未经审查” 的 WizardLM 模型的 GPTQ 4 位模型文件，是使用 GPTQ-for-LLaMa 进行 4 位量化的结果。Eric 使用 WizardLM 方法对经过编辑的数据集进行了新的 7B 训练，该数据集删除了所有 “我很抱歉……” 类型的 ChatGPT 响应。

Hugging Face：https://huggingface.co/TheBloke/WizardLM-7B-uncensored-GPTQ

Vicuna（FastChat）

一款开源聊天机器人，能达到 ChatGPT 90% 的能力。

GitHub：https://github.com/lm-sys/FastChat

Review：https://www.youtube.com/watch?v=4VByC2NpV30

Vigogne

这个代码仓库包含使用 Hugging Face 的 PEFT 库提供的低秩适应（LoRA）方法，复现了斯坦福大学 Alpaca 的法语版本的代码。除了 LoRA 技术之外，我们还使用 bitsandbytes 提供的 LLM.int8() 来将预训练语言模型（PLMs）量化为 int8。将这两种技术结合起来，使我们能够在单个消费级 GPU（如 RTX 4090）上微调 PLMs。

GitHub：https://github.com/bofenghuang/vigogne

WizardLM

这是一个使用 Evol-Instruct 技术的指令跟随 LLM 模型，使得大型预训练语言模型能够遵循复杂的指令。

GitHub：https://github.com/nlpxucan/WizardLM

Review：https://www.youtube.com/watch?v=5IAxCL4dHWk

#02

BigCode StartCoder

BigCode 是一个开放的科学合作项目，旨在负责任地训练大语言模型，以应用于编码领域。你可以在主要网站上找到更多信息，也可以在 Twitter 上关注 BigCode。

在这个组织中，你可以找到这个合作项目的工件，包括 StarCoder，一个用于编码的最先进的语言模型，The Stack，可用的最大的预训练数据集，包含宽容的代码，以及 SantaCoder，一个参数达到 1.1B 的编码模型。

网站：https://huggingface.co/bigcode

Hugging Face：https://huggingface.co/spaces/bigcode/bigcode-playground

#03

BLOOM（BigScience）

BigScience大型开放科学开放获取多语言模型。

Hugging Face：https://huggingface.co/bigscience/bloom

Hugging Face Demo：https://huggingface.co/spaces/huggingface/bloom_demo

以下是 BLOOM 项目的复现或衍生项目：

BLOOM-LoRA

针对各种 Instruct-Tuning 数据集的低秩适应方法。

GitHub：https://github.com/linhduongtuan/BLOOM-LORA

Petals

使用分布式的 176B 参数的 BLOOM 或 BLOOMZ 生成文本，并对其进行微调以适应自己的任务。

GitHub：https://github.com/bigscience-workshop/petals

#04

Cerebras-GPT（Cerebras）

这是一系列开放、计算高效的大语言模型。Cerebras 开源了七个 GPT-3 模型，参数从 1.11 亿到 130 亿不等。这些模型使用了 Chinchilla 公式进行训练，创造了精度和计算效率的新标准。

网站：https://www.cerebras.net/blog/cerebras-gpt-a-family-of-open-compute-efficient-large-language-models/

Hugging Face：https://huggingface.co/cerebras

Review：https://www.youtube.com/watch?v=9P3_Zw_1xpw

#05

Flamingo（Google/Deepmind）

使用单一视觉语言模型处理多项任务。

网站：https://www.deepmind.com/blog/tackling-multiple-tasks-with-a-single-visual-language-model

以下是基于 Flamingo 项目的复现或衍生项目：

Flamingo — Pytorch

这是 Flamingo 项目的 Pytorch 实现，它是一种最先进的少样本视觉问答注意力网络。该实现包括 Perceiver Resampler（包括学习查询，以供键/值被关注，以及媒体嵌入），专门的掩码交叉注意力块，以及交叉注意力末端的 tanh 门控和相应的前馈块。

GitHub：https://github.com/lucidrains/flamingo-pytorch

OpenFlamingo

欢迎使用我们的 DeepMind Flamingo 模型的开源版本！在这个仓库中，我们提供了一个 PyTorch 实现，用于训练和评估 OpenFlamingo 模型。我们还提供了一个经过训练的初始 OpenFlamingo 9B 模型，该模型是在一个新的 Multimodal C4 数据集上训练的（即将推出）。有关详细信息，请参阅我们的博客文章。

GitHub：https://github.com/mlfoundations/open_flamingo

#06

FLAN（Google）

这个代码库包含用于生成指令调整数据集集合的代码。第一个数据集是原始的 Flan 2021，它记录在《Finetuned Language Models are Zero-Shot Learners》中，第二个数据集是扩展版本，称为 Flan Collection，它在《The Flan Collection: Designing Data and Methods for Effective Instruction Tuning》中描述，并用于生成 Flan-T5 和 Flan-PaLM。

GitHub：https://github.com/google-research/FLAN

以下是基于 FLAN 项目的复现或衍生项目：

FastChat-T5

我们很高兴地推出 FastChat-T5：这是一个紧凑而商业友好的聊天机器人！它是从 Flan-T5 微调而来，可用于商业应用，并且使用的参数比 Dolly-V2 少 4 倍，性能更好。

GitHub：https://github.com/lm-sys/FastChat#FastChat-T5

Hugging Face：https://github.com/lm-sys/FastChat/blob/main/fastchat/serve/huggingface_api.py

Flan-Alpaca

这个仓库包含代码，用于将 Stanford Alpaca 的合成指令微调方法扩展到已有指令微调模型（如 Flan-T5）。预训练模型和演示都可以在 HuggingFace 上获取。

GitHub：https://github.com/declare-lab/flan-alpaca

Flan-UL2

这是一个基于 T5 架构的编码器 - 解码器模型，名为 Flan-UL2。它使用了去年早些时候发布的 UL2 模型相同的配置，并使用了 “Flan” 提示微调和数据集合集进行微调。

Hugging Face：https://huggingface.co/google/flan-ul2

Review：https://www.youtube.com/watch?v=cMT3RzjawEc

#07

GALACTICA（Meta）

根据 Mitchell 等人（2018）的研究，本模型卡提供有关 GALACTICA 模型的信息，包括其训练方式和预期使用情况。有关模型的训练和评估的详细信息可以在发布的论文中找到：https://galactica.org/paper.pdf

GitHub：https://github.com/paperswithcode/galai/blob/main/docs/model_card.md

基于 GALACTICA 项目的复现或衍生项目：

Galpaca

这是在 Alpaca 数据集上微调的 30B GALACTICA 模型。

Hugging Face：https://huggingface.co/GeorgiaTechResearchInstitute/galpaca-30b

Hugging Face：https://huggingface.co/TheBloke/galpaca-30B-GPTQ-4bit-128g

#08

GLM（General Language Model）

GLM 是一个通用的语言模型，使用自回归填空目标进行预训练，可以在各种自然语言理解和生成任务上进行微调。

基于 GLM 项目的复现或衍生项目：

ChatGLM-6B

ChatGLM-6B 是基于通用语言模型（GLM）框架的开源双语言模型，具有 62 亿个参数。通过量化技术，用户可以在消费级图形卡上进行本地部署（在 INT4 量化级别下仅需要 6GB 的 GPU 内存）。

GitHub：https://github.com/THUDM/ChatGLM-6B

#09

GPT-J

GPT-J 是由 EleutherAI 开发的开源人工智能语言模型。GPT-J 在各种零样本下游任务上的表现与 OpenAI 的 GPT-3 非常相似，并且甚至可以在代码生成任务上胜过它。最新版本 GPT-J-6B 是一种基于数据集 The Pile 的语言模型。The Pile 是一个开源的 825 gibibyte 语言建模数据集，分为 22 个较小的数据集。GPT-J 的功能类似于 ChatGPT，尽管它不作为聊天机器人，只作为文本预测模型。

GitHub：https://github.com/kingoflolz/mesh-transformer-jax/#gpt-j-6b

Demo：https://6b.eleuther.ai/

以下是基于 GLM 项目的复现或衍生项目：

Dolly（Databricks）

Databricks 的 Dolly 是一个在 Databricks 机器学习平台上训练的大语言模型，它展示了一个两年前的开源模型（GPT-J）经过仅 30 分钟的针对 50k 个记录的专注语料库的微调后，可以展现出不同于基于其构建的基础模型的惊人高质量的指令跟随行为。我们认为这一发现非常重要，因为它表明了创建强大的人工智能技术的能力比以前意识到的要容易得多。

GitHub：https://github.com/databrickslabs/dolly

Review：https://www.youtube.com/watch?v=AWAo4iyNWGc

GPT-J-6B instruction-tuned on Alpaca-GPT4

这个模型是在 Alpaca 提示的 GPT-4 生成上使用 LoRA 进行微调的，共进行了 30，000 步（批量大小为 128），在四个 V100S 上花费了超过 7 小时的时间。

Hugging Face：https://huggingface.co/vicgalle/gpt-j-6B-alpaca-gpt4?text=My+name+is+Teven+and+I+am

GPT4All-J

此仓库包含了基于 GPT-J 构建的开源助手式大语言模型的演示、数据和训练代码。

GitHub：https://github.com/nomic-ai/gpt4all

Review：https://www.youtube.com/watch?v=5icWiTvDQS0

#10

GPT-NeoX

该代码库记录了 EleutherAI 在 GPU 上训练大规模语言模型的库。我们目前的框架基于 NVIDIA 的 Megatron 语言模型，并已经添加了 DeepSpeed 的技术以及一些新的优化技巧。我们的目标是将这个仓库作为一个集中且易于访问的地方，汇集大规模自回归语言模型训练技术，并加速大规模训练的研究。

GitHub：https://github.com/EleutherAI/gpt-neox

#11

h2oGPT

我们的目标是创建全球最好的开源 GPT！

GitHub：https://github.com/h2oai/h2ogpt

Hugging Face：https://huggingface.co/spaces/h2oai/h2ogpt-oasst1-256-6.9b-hosted

#12

HuggingGPT

HuggingGPT 是一个协作系统，由 LLM 作为控制器和众多来自 HuggingFace Hub 的专家模型作为协作执行者组成。

GitHub：https://github.com/microsoft/JARVIS

#13

Mosaic ML’s MPT-7B

MPT-7B 是一款 GPT 风格的模型，是 MosaicML 基础系列中的第一款模型。它是由 MosaicML 策划的数据集中的 1T 标记训练而成的，是开源的、商用可用的，并且在评估指标上等同于 LLaMa 7B。MPT 架构包含了所有最新的 LLM 建模技术 - 快闪式注意力（Flash Attention）实现高效率、Alibi 用于上下文长度的外推、以及稳定性改进来减轻损失的波动。基础模型和几个变体，包括一个 64K 上下文长度的微调模型都是可用的。

网站：https://www.mosaicml.com/blog/mpt-7b

GitHub：https://github.com/mosaicml/llm-foundry#mpt

Review：https://www.youtube.com/watch?v=NY0bLFqkBL0

#14

Nvidia NeMo（GPT-2B-001）

GPT-2B-001 是一种基于 transformer 的语言模型。GPT 是指一类类似于 GPT-2 和 3 的 transformer 解码模型，而 2B 则指可训练参数总数（20 亿）。该模型是使用 NeMo 在 1.1T 个标记上进行训练的。

Hugging Face：https://huggingface.co/nvidia/GPT-2B-001

#15

OpenAssistant Models

每个人都能使用的对话型人工智能。

网站：https://open-assistant.io/

GitHub：https://github.com/LAION-AI/Open-Assistant

Hugging Face：https://huggingface.co/OpenAssistant

#16

OpenLLaMA

在这个代码库中，我们发布了 Meta AI 的 LLaMA 大语言模型的开源复现版本，采用宽松许可证。在此版本中，我们发布了经过训练的 2000 亿标记的 7B OpenLLaMA 模型的公共预览版。我们提供了预训练的 OpenLLaMA 模型的 PyTorch 和 Jax 权重，以及评估结果和与原始 LLaMA 模型的比较。请继续关注我们的更新。

GitHub：https://github.com/openlm-research/open_llama

#17

Palmyra Base 5B（Writer）

Palmyra Base 主要使用英文文本进行预训练。请注意，仍然有一小部分非英语数据存在于通过 CommonCrawl 访问的训练语料库中。在模型的预训练过程中，采用了因果语言建模（CLM）目标。与 GPT-3 类似，Palmyra Base 是仅包含解码器的模型系列的成员。因此，它是通过自监督的因果语言建模目标进行预训练的。Palmyra Base 使用 GPT-3 的提示和一般实验设置，以便根据 GPT-3 进行评估。

Hugging Face：https://huggingface.co/Writer/palmyra-base

基于 Palmyra 项目的复现或衍生项目：

Camel 5B

介绍一下 Camel-5b，它是一个最先进的指令跟随大语言模型，旨在提供卓越的性能和多功能性。Camel-5b 基于 Palmyra-Base 的基础架构进行了优化，专门针对不断增长的先进自然语言处理和理解需求进行了设计。

Hugging Face：https://huggingface.co/Writer/camel-5b-hf

#18

Polyglot

这是一篇有关多语言平衡能力的大语言模型的介绍。已经发布了各种多语言模型，如 mBERT，BLOOM 和 XGLM。因此，有人可能会问：“为什么我们需要再次制作多语言模型？” 在回答这个问题之前，我们想问：“为什么世界各地的人们会用自己的语言制作单语言模型，即使已经有很多多语言模型了？” 我们想指出当前多语言模型的非英语语言性能不佳是最重要的原因之一。因此，我们希望制作具有更高非英语语言性能的多语言模型。这就是我们需要再次制作多语言模型并将它们命名为 “Polyglot” 的原因。

GitHub：https://github.com/EleutherAI/polyglot

#19

Pythia

跨时间和尺度解释自回归 Transformer。

GitHub：https://github.com/EleutherAI/pythia

基于 Pythia 项目的复现或衍生项目：

Dolly 2.0

Dolly 2.0 是一个使用 EleutherAI Pythia 模型家族作为基础、仅在新的高质量人类生成的指令追踪数据集上进行微调的 12B 参数语言模型，该数据集由 Databricks 员工进行了众包。

网站：https://www.databricks.com/blog/2023/04/12/dolly-first-open-commercially-viable-instruction-tuned-llm

Hugging Face：https://huggingface.co/databricks

GitHub：https://github.com/databrickslabs/dolly/tree/master/data

Review：https://www.youtube.com/watch?v=grEp5jipOtg

#20

Replit-Code

replit-code-v1-3b 是一个专注于代码补全的 27 亿因果语言模型。该模型是在 Stack Dedup v1.2 数据集的子集上训练的，训练混合包括以下 20 种语言，按标记数量降序排列：

Markdown、Java、JavaScript、Python、TypeScript、PHP、SQL、JSX、reStructuredText、Rust、C、CSS、Go、C++、HTML、Vue、Ruby、Jupyter Notebook、R、Shell

该模型的训练数据集包含总计 1750 亿个标记，重复使用 3 个时代，因此 replit-code-v1-3b 已经在 5250 亿个标记上进行了训练（每个参数大约 195 个标记）。

Hugging Face：https://huggingface.co/replit/replit-code-v1-3b

#21

The RWKV Language Model

RWKV 是一个可以并行运行的循环神经网络，其性能相当于 Transformer-level 的大语言模型（LLM），名称来自其四个主要参数：R、W、K 和 V，发音为 “RwaKuv”。

GitHub：https://github.com/BlinkDL

ChatRWKV：https://github.com/BlinkDL/ChatRWKV

Hugging Face Demo：https://huggingface.co/spaces/BlinkDL/ChatRWKV-gradio

RWKV pip package：https://pypi.org/project/rwkv/

Review：https://www.youtube.com/watch?v=B3Qa2rRsaXo

#22

Segment Anything

“Segment Anything Model（SAM）”能够根据输入的提示，例如点或框，产生高质量的对象掩模，并可用于生成图像中所有对象的掩模。它已经在一个包含 1100 万张图片和 11 亿个掩模的数据集上进行了训练，并在各种分割任务的零样本情况下表现出强大的性能。

网站：https://ai.facebook.com/blog/segment-anything-foundation-model-image-segmentation/

GitHub：https://github.com/facebookresearch/segment-anything

#23

StableLM

StableLM 是一种新的开源语言模型，其 Alpha 版本提供了 30 亿和 70 亿参数版本，之后还会推出 150 亿到 650 亿参数的模型。开发者可以自由地检查、使用和调整我们的 StableLM 基础模型，用于商业或研究目的，但需要遵守 CC BY-SA-4.0 许可协议的条款。

StableLM 是在建立在 The Pile 上的新实验数据集上训练的，数据集大小为原来的三倍，包含了 1.5 万亿个内容单元。这个数据集的丰富性使得 StableLM 在对话和编程任务方面表现出了出乎意料的高性能，尽管它的参数规模只有 3 到 7 亿（相比之下，GPT-3 有 1750 亿个参数）。

网站：https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models

GitHub：https://github.com/stability-AI/stableLM/

Hugging Face：https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

Review：https://www.youtube.com/watch?v=0uI7SoMn0Es

#24

Together’s RedPajama-INCITE 3B and 7B

我们发布了基于 RedPajama 数据集训练的第一批模型，包括 3B 和 7B 参数的基础模型，旨在尽可能精准地复制 LLaMA 模型的架构。此外，我们还发布了完全开源的指令调优和对话模型。

网站：https://www.together.xyz/blog/redpajama-models-v1

Hugging Face：https://huggingface.co/togethercomputer/RedPajama-INCITE-Base-3B-v1

#25

XGLM

XGLM 模型是在 “Few-shot Learning with Multilingual Language Models” 中提出的。

GitHub：https://github.com/facebookresearch/fairseq/tree/main/examples/xglm

Hugging Face：https://huggingface.co/docs/transformers/model_doc/xglm

#26

Other Repositories

couchpotato888

Hugging Face：https://huggingface.co/couchpotato888

crumb

Hugging Face：https://huggingface.co/crumb

Knut Jägersberg

Hugging Face：https://huggingface.co/KnutJaegersberg

LaMini-LM：来自大规模指令的多样化压缩模型群

LaMini-LM 是一系列小型、高效的语言模型，它们是从 ChatGPT 中提取并经过训练的，训练数据集包含 258 万条指令。我们尝试了不同的模型架构、大小和检查点，并在各种 NLP 基准测试和人类评估中广泛评估了它们的性能。

Paper：https://arxiv.org/abs/2304.14402

GitHub：https://github.com/mbzuai-nlp/LaMini-LM

Review：https://www.youtube.com/watch?v=TeJrG3juAL4&t=42s

Teknium

Hugging Face: https://huggingface.co/teknium

你可能感兴趣的:(语言模型,人工智能,自然语言处理)

谷歌准备斥资 230 亿收购网络安全初创公司 Wiz 网络研究观网络研究观谷歌
Alphabet正在就收购Wiz进行深入谈判，这将显著增强其安全能力。这将是谷歌母公司有史以来最大规模的收购。这是路透社根据匿名消息来源撰写的内容。目标收购金额为230亿美元，即211亿欧元。Wiz拥有实时检测和响应网络威胁的技术。通过实施人工智能，Wiz能够在短时间内吸引许多公司作为客户。Alphabet的收购目标定于2020年初。到2023年，Wiz的收入将达到3.5亿美元。当时，全球40%的
数学领域的跨时代进化与升级：从公理化到智能化的破茧之路夏末之花算法
作者：夏末之花|发布时间：2025-03-16|阅读量：10万+|点赞数：5.6万引言：数学的“破茧时刻”与文明跃迁人类历史上，数学的每一次重大突破都像一次“破茧时刻”，推动文明跨越式发展。从古希腊的几何公理化到牛顿的微积分，再到20世纪的计算机理论，数学始终是科学革命的基石。而在21世纪的今天，随着量子计算、人工智能、生物信息等技术的爆发，数学正迎来新一轮的进化与升级——从纯粹的逻辑工具，演变为
精准测试：软件开发中的高效质量保障利器霍格沃兹软件测试开发精准化测试测试用例安全性测试测试覆盖率模块测试 selenium 测试工具压力测试
全面解析软件测试开发：人工智能测试、自动化测试、性能测试、测试左移、测试右移到DevOps如何驱动持续交付在现代软件开发中，测试效率与测试质量直接影响产品竞争力。精准测试作为一项兼具效率与精度的创新测试方法，已经成为众多企业提升软件质量的重要手段。本篇文章围绕精准测试的落地实施、对质量指标的提升、数据统计与效果评估方法以及如何提高投入产出比进行全面解读，帮助企业掌握精准测试的价值与实践路径。精准测
提升敏感力，“工具人”破圈的唯一解！技能咖 GAI认证生成式人工智能认证人工智能
在当今这个日新月异的数字化时代，个人与组织面临着前所未有的挑战与机遇。随着科技的飞速发展，尤其是生成式人工智能（GenerativeAI）的兴起，职场生态正在发生深刻变革。如何在这场变革中提升敏感力，实现从“工具人”到行业佼佼者的跨越，成为了众多职场人士关注的焦点。本文将探讨提升敏感力的重要性，并引入生成式人工智能认证（GAI认证），为您揭示“工具人”破圈的唯一解。提升敏感力：职场竞争的关键什么是
新浪财经App喜娜AI助手通过大模型登记，已上线AI摘要和个股公告AI解读量子位
3月14日，官方发布的信息显示，新浪财经App喜娜AI助手近日已通过北京市生成式人工智能服务登记。目前，喜娜AI助手已上线两项创新功能：喜娜AI摘要和个股公告AI解读。这两项功能旨在通过先进的人工智能技术，提升用户对财经资讯和上市公司公告的理解与分析效率，这标志着AI技术在信息服务领域的又一重大突破。喜娜AI摘要：快速提炼财经资讯核心要点AI时代，资讯信息迎来爆炸性增长，用户每天都要面对海量资讯，
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
向量数据库 PieCloudVector 进阶系列丨打造以 LLM 为基础的聊天机器人
本系列前两篇文章深入探讨了PieCloudVector在图片和音频数据上的应用之后，本文将聚焦于文本数据，探索PieCloudVector对于文本数据的向量化处理、存储以及检索，并最终结合LLM打造聊天机器人的全流程。在自然语言处理任务中涉及到大量对文本数据的处理、分析和理解，而向量数据库在其中发挥了重要的作用。本文为《PieCloudVector进阶系列》的第三篇，将为大家介绍如何利用PieCl
模型微调：让AI更懂你的魔法棒带上一无所知的我 pytorch 人工智能 python
模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。今天，我们就来深入探讨模型微调的技术细节，让你也能像魔法师一样，轻松驾驭AI模型！什么是模型微调？模型微调是指在预训练模型的基础上，通过少量的特定任务数据进行训练，使模型更好地适应新任务的技术。预训练模型通常是基于大规模数据集（如Ima
【十自然语言处理项目实战】【10.2 数据收集与预处理】再见孙悟空_ #自然语言处理人工智能知识图谱 transformer 自然语言处理数据收集自然语言处理预处理自然语言处理项目
各位在数据泥潭里打滚的勇士们，今天咱们要聊的这个话题，就像学做川菜必须掌握的"火锅底料炒制法"——数据收集与预处理！这玩意儿看着像脏活累活，实则是决定你模型上限的生死关卡。作为一个曾把BERT训成人工智障的老司机，这就把五年掉坑经验熬成一锅十全大补汤！（戴上橡胶手套准备掏数据）一、数据收集的野路子：比盗墓还刺激的冒险1.1公开数据集寻宝图（附藏宝坐标）①正道的光：Kaggle（数据界的沃尔玛）：搜
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
当现代教育技术遇上仓颉---探秘华为仓颉编程语言与未来教育技术的接轨想成为高手499 华为服务器 php
引言随着人工智能、物联网、区块链等新兴技术的发展，编程语言的需求也在不断演化。据市场研究机构发布的数据显示，全球编程语言市场规模预计在未来五年内将以每年10%的速度增长。此外，越来越多的企业和高校正在积极推动基于分布式系统和硬件优化的新型语言开发，这进一步表明对高性能编程语言的需求日益旺盛。近年来，华为推出了自研编程语言“仓颉”，以其高效的语法设计、灵活的语义表达能力和强大的跨平台适配性能引发了编
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
复旦：过程奖励优化多模态推理大模型任我行大模型-模型训练人工智能自然语言处理语言模型论文笔记
标题：VisualPRM:AnEffectiveProcessRewardModelforMultimodalReasoning来源：arXiv,2503.10291摘要我们引入了VisualPRM，这是一种具有8B参数的高级多模态过程奖励模型（PRM），它通过Best-of-N（BoN）评估策略提高了现有多模态大型语言模型（MLLM）在不同模型尺度和族之间的推理能力。具体来说，我们的模型提高了三
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
AI学习指南RAG篇(24)-RAGFlow的社区与开源贡献俞兆鹏 AI学习指南人工智能
一、引言RAGFlow是一款基于深度文档理解的开源RAG（Retrieval-AugmentedGeneration，检索增强生成）引擎，旨在解决现有RAG技术在数据处理和生成答案方面的挑战。RAGFlow通过结合大型语言模型（LLMs）的强大生成能力和高效的信息检索系统，为用户提供了一种全新的交互体验。本文将鼓励读者参与到RAGFlow的开源社区中，共同推动技术的发展和创新。二、RAGFlow的
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
有了大模型为何还需要Agent智能体全栈你个大西瓜人工智能人工智能 AI Agent Agent 智能体 Agent 原理
一、什么是Agent？Agent（智能体）是一种能感知环境、自主决策、执行动作的智能实体，当它与大语言模型（如通义千问QWen、GPT）结合时，形成一种**“增强型AI系统”**。其核心架构如下：大脑（LLM）：负责语言理解、逻辑推理、知识问答等认知任务。感官（工具链）：通过API、传感器或数据库获取实时数据（如天气、股价）。手脚（执行器）：调用外部工具完成任务（如发送邮件、控制智能家居）。记忆（
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
DeepSeek智能政务大脑：城市服务知识库构建全指南——从RAG架构到民生场景落地实践 Coderabo DeepSeek R1模型企业级应用政务架构
DeepSeek赋能城市智慧升级：基于RAG架构的市民服务智能知识库构建全解一、需求分析与技术选型1.1市民服务场景需求市民服务智能知识库需要解决政务咨询效率低下、专业术语难理解、多轮对话能力弱等核心问题。系统需具备：自然语言理解能力（NLU）异构知识整合能力政策法规精准解读能力多轮对话上下文管理应急服务联动机制1.2DeepSeek技术栈选择基于DeepSeek-Large语言模型构建核心系统，
deepseek具体应用场景 ahyouxiang 人工智能
DeepSeek的具体应用场景非常广泛，涵盖了多个领域和行业。以下是基于证据的详细总结：金融领域DeepSeek在金融领域的应用表现突出，例如通过其大语言模型（如DeepSeekLLM67Bt）提供数学、逻辑推理等能力，帮助金融机构提升服务效率。此外，DeepSeek还被应用于智能安全体产品中，通过安全大模型实现个性化开发和优化。医疗领域在医疗领域，DeepSeek的技术被用于辅助诊断和患者记录管
DeepSeek 大模型落地成都高新区：科技赋能警务的创新变革 AGI大模型学习科技人工智能 DeepSeek 大模型 chatgpt 大模型应用 AI大模型
在科技飞速发展的当下，人工智能正以前所未有的速度融入各个领域，深刻改变着人们的生活与工作方式。公安领域也不例外，积极拥抱科技创新，成为提升警务效能、维护社会稳定的关键路径。全国第一例警用DeepSeek大模型落地成都高新区，这一突破性举措在警务智能化发展进程中具有里程碑意义，为公安工作带来了全方位的革新。一、警用DeepSeek大模型落地的时代背景近年来，国产AI蓬勃发展，不断涌现出令人瞩目的成果
五、AIGC大模型_09手动实现ReAct_Agent 学不会lostfound AI 人工智能 react_agent LangGraph Multi-Agent PlanAndExecute AIGC
0、前言在上一章节中，我们了解到：create_react_agent是LangGraph提供的一个预构建方法（fromlanggraph.prebuiltimportcreate_react_agent），它可以将语言模型（LLM）和一组工具（Tools）结合起来，创建一个能够根据用户输入自动调用工具的智能代理，这个代理可以根据用户的请求，决定是否需要调用某个工具，并将工具的输出反馈给用户这个函
大数据和人工智能概念全面解析就犯得上方法
一、大数据和人工智能大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义，大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求，使数据能够从量变到质变，真正产生价值
理解并使用基于n-gram重叠的示例选择器 shuoac easyui 前端 javascript python
在AI及自然语言处理任务中，选择与输入最相似的示例可以显著提升生成的质量和上下文相关性。本文将介绍如何使用NGramOverlapExampleSelector工具，通过n-gram重叠来筛选和排序示例，从而帮助实现这一目标。技术背景介绍n-gram重叠技术通过比较输入文本与示例文本在字符或词组上的相似度，计算一个介于0到1之间的分数来表示相似度。这个分数越高，表示文本间的重叠越大。NGramOv
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
Ai时代初期全球不同纬度的层级辐射现象龙胥伯人工智能
基于最新研究成果与行业动态，AI时代的"层级辐射"现象可被科学解构为以下六大维度，结合技术演进、产业实践和社会影响进行系统性分析：一、技术能力的层级跃迁模型效率革命DeepSeek研发的R1-Zero模型通过动态架构设计，将样本利用率提升40%以上，训练周期大幅缩短。这种技术突破推动AI从实验室走向规模化应用，在智能制造、生物医药等领域催生新生态。大语言模型的训练方式（预训练→多任务学习→强化学习
自定义Retriever的实现方法 vaidfl windows linux microsoft python
技术背景介绍在许多大语言模型（LLM）应用中，检索器（Retriever）用于从外部数据源获取信息。检索器的任务是根据用户查询检索相关的文档，这些文档通常被格式化为提示，供LLM使用，从而生成适当的响应，例如，根据知识库回答用户问题。核心原理解析要实现自定义的检索器，需要继承BaseRetriever类，并实现以下方法：_get_relevant_documents：获取与查询相关的文档，必需实现
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag