技术狂潮AI

Danswer 接入 Llama 2 模型｜免费在 Google Colab 上托管 Llama 2 API

一、前言

前面在介绍本地部署免费开源的知识库方案时，已经简单介绍过 Danswer《Danswer 快速指南：不到15分钟打造您的企业级开源知识问答系统》，它支持即插即用不同的 LLM 模型，可以很方便的将本地知识文档通过不同的连接器接入到 Danswer，然后实现本地基于知识库的语义检索。它是完全开源的（MIT 许可证）并且免费使用。

1.1、为什么选择 Danswer

默认设置下，Danswer 使用 OpenAI 的 GPT 系列模型，由于很多时候我们因为数据隐私问题需要在本地部署离线的知识库系统，需要接入本地开源的模型，今天本文将简单介绍下如何使用开源模型 Llama 2 接入 Danswer。

至于为什么选择 Danswer，简单啰嗦一下，更具体的信息可以访问官方文档：

它是完全开源的（MIT 许可证）并且免费使用。
允许您即插即用不同的 LLM 模型，例如 GPT、HuggingFace、GPT4All、Llama cpp，甚至自定义自托管模型。
具有开箱即用的关键功能，如文档访问控制、前端 UI、管理仪表板、轮询文档更新和灵活的部署选项。
与 Slack、GitHub、GoogleDrive 等其他工具的连接器的不错列表。

1.2、为什么选择 Llama 2

自从 Meta 公司发布了最新的 LLaMA 2 模型并且开源之后，在LLM领域掀起了一阵不小的浪潮，至少从各种排行榜和评估结果来看，Llama 2 在开源界要优于其它的产品，它击败了 Falcon-40B（之前最好的开源基础模型），与 GPT-3.5 相当，仅低于 GPT-4 和 PALM 2（均为闭源模型，分别由 OpenAI 和 Google 拥有）。

从以上排行榜不难看出，基本上整个列表大部分的开源模型都是由 Llama 2 衍生品组成的。

二、在 Google Colab 上托管 Llama 2 模型

Llama 2 型号有 3 种不同尺寸：7B、13B 和 70B 参数。700 亿参数版本需要多个 GPU，因此无法免费托管。在 13B 和 7B 版本中，13B 版本更强大，但需要一些压缩（量化或降低浮点精度）才能适合单个中档 GPU。幸运的是，Llama cpp 库使这变得相当简单。这里我们将以 Llama 2 13B量化模型来进行演示。

在开始之前，请确保在 Google Colab 上设置了 T4 GPU 运行时

2.1、安装依赖

运行 FastAPI 服务器所需的依赖项
通过 Ngrok 创建公共模型服务 URL 所需的依赖项
运行 Llama2 13B（包括量化）所需的依赖项

# 构建 Llama cpp
!CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install llama-cpp-python

# 如果出现依赖解析器的错误提示，可以忽略
!pip install fastapi[all] uvicorn python-multipart transformers pydantic tensorflow

# 这将在 Google Colab 实例中下载并设置 Ngrok 可执行文件
!wget https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip
!unzip -o ngrok-stable-linux-amd64.zip

Ngrok 用于通过公共 URL 访问 FastAPI 服务器。

用户需要创建一个免费账户并提供他们的身份验证令牌以使用 Ngrok。免费版本只允许一个本地隧道，并且身份验证令牌用于跟踪此使用限制。

在 Ngrok 设置页面上获取 Auth token，如图中红框所示

# https://dashboard.ngrok.com/signup
!./ngrok authtoken

2.2、创建 FastAPI 应用

这里提供了一个与 Llama 2 模型交互的 API。可以根据需要在下面的代码中更改模型版本。在这个演示示例中，我们将使用 130 亿参数版本，该版本经过微调以进行指令（聊天）跟随。尽管进行了压缩，但它仍然比 70 亿变体更强大。

%%writefile app.py
from typing import Any

from fastapi import FastAPI
from fastapi import HTTPException
from pydantic import BaseModel
from huggingface_hub import hf_hub_download
from llama_cpp import Llama
import tensorflow as tf

# 在 T4 GPU 上拟合 Llama2-13B 需要 GGML 模型
GENERATIVE_AI_MODEL_REPO = "TheBloke/Llama-2-13B-chat-GGML"
GENERATIVE_AI_MODEL_FILE = "llama-2-13b-chat.ggmlv3.q5_1.bin"

model_path = hf_hub_download(
    repo_id=GENERATIVE_AI_MODEL_REPO,
    filename=GENERATIVE_AI_MODEL_FILE
)

llama2_model = Llama(
    model_path=model_path,
    n_gpu_layers=64,
    n_ctx=2000
)

# 测试推理
print(llama2_model(prompt="Hello ", max_tokens=1))

app = FastAPI()

# 这里定义了端点所期望的数据 JSON 格式，根据需要进行更改
class TextInput(BaseModel):
    inputs: str
    parameters: dict[str, Any] | None

@app.get("/")
def status_gpu_check() -> dict[str, str]:
    gpu_msg = "Available" if tf.test.is_gpu_available() else "Unavailable"
    return {
        "status": "I am ALIVE!",
        "gpu": gpu_msg
    }

@app.post("/generate/")
async def generate_text(data: TextInput) -> dict[str, str]:
    try:
        params = data.parameters or {}
        response = llama2_model(prompt=data.inputs, **params)
        model_out = response['choices'][0]['text']
        return {"generated_text": model_out}
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

2.3、启动 FastAPI 服务器

由于需要下载模型并将其加载到 GPU 上，初始运行时间会很长。

注意：中断 Google Colab 运行时会发送 SIGINT 并停止服务器。

# 此单元格很快完成，因为它只需要启动服务器
# 服务器将开始下载模型，并需要一段时间才能启动
# 约 5 分钟
!uvicorn app:app --host 0.0.0.0 --port 8000 > server.log 2>&1 &

检查 server.log 日志以查看进度。在继续之前，请等待模型加载完成并使用下一个单元格进行检查。

# 如果看到 "Failed to connect"，那是因为服务器仍在启动中
# 等待模型下载完成和服务器完全启动
# 检查 server.log 文件以查看状态
!curl localhost:8000

2.4、使用 Ngrok 为 FastAPI 服务器创建公共 URL。

重要提示：如果您通过电子邮件创建了一个账户，请验证您的电子邮件，否则下面的两个单元格将无法正常工作。

如果您通过 Google 或 GitHub 账户注册，那就没问题了。

# 这将启动 Ngrok 并创建一个公共 URL。
from IPython import get_ipython
get_ipython().system_raw('./ngrok http 8000 &')

检查下一个单元格生成的 URL，它应该显示 FastAPI 服务器正在运行，并且 GPU 可用。

要访问模型的端点，只需在 URL 后面添加 /generate。

curl --location --request POST '/generate' \
--header 'Content-Type: application/json' \
--data-raw '{
    "inputs": "请介绍下 Danswer 如何接入 Llama 2 模型?",
    "parameters": {
        "temperature": 0.0,
        "max_tokens": 25
    }
}'

# 获取公共 URL
# 如果无法正常工作，请确保您已验证您的电子邮件。
# 然后再次运行上一个代码单元格和这个代码单元格。
!curl -s http://localhost:4040/api/tunnels | python3 -c "import sys, json; print(json.load(sys.stdin)['tunnels'][0]['public_url'])"

2.5、关闭服务

要关闭进程，请在一个新的单元格中运行以下命令：

!pkill uvicorn
!pkill ngrok

[Google Colab 代码]

https://colab.research.google.com/drive/1HhqGGzV-q1m0igdhpGt5Wmf8VmDiyIcn#scrollTo=liqVEsGfZPse

三、在 Danswer 中接入 Llama 2 模型

Danswer 可以通过 REST 请求向任意模型服务器发出请求。可以选择传入访问令牌。要自定义请求格式和响应处理，可能需要更新/重建 Danswer 容器。

3.1、部署 Danswer

Danswer 提供 Docker 容器，可以轻松部署在任何云上，无论是在单个实例上还是通过 Kubernetes。在本演示中，我们将使用 Docker Compose 在本地运行 Danswer。

首先拉去 danswer 代码：

git clone https://github.com/danswer-ai/danswer.git

接下来导航到部署目录：

cd danswer/deployment/docker_compose

Danswer 默认使用的模型是 GPT-3.5-Turbo，如果想使用开源的如 Llama 2 模型API，通过创建 .env 文件来覆盖一些默认值（针对 Linux 显示），将 Danswer 配置为使用新的 Llama 2 端点：

GEN_AI_MODEL_PROVIDER=custom  
GEN_AI_API_ENDPOINT=/generate

3.3、添加文档到 Danswer

这里我们将 Danswer 文档网站建立索引。只需要在Web连接器中添加文档URL地址即可。

3.4、从 Danswer 获取答案

单击 Danswer 徽标返回主页，现在您可以询问有关新索引文档的问题。

四、总结

本文主要介绍了如何在Google Colab上托管Llama 2模型，并将其接入Danswer。Danswer是一个开源的知识问答系统，支持不同的LLM模型，可以方便地将本地知识文档接入到Danswer，实现基于知识库的语义检索。

虽然使用 Google Colab 可以免费托管您的 LLM，但是需要注意以下几点：

Google Colab 更适用于开发目的，如果您想要永久端点，可能需要投资专用硬件，因为在一段时间不活动后，Google Colab 将回收实例。也可考虑在 HF 上托管。
免费套餐中不支持高端 GPU 如 A100。
在免费套餐中，每个会话最多只能申请 12 小时的实例。

五、References

[1] Danswer 代码：https://github.com/danswer-ai/danswer

[2] Danswer 文档：https://docs.danswer.dev/

你可能感兴趣的:(AI应用实战,AI工具实战,LLM应用实战,llama,Danswer,企业知识库,AI实战)

Vibe Coding开发微信小程序实战案例程序员陆通微信小程序 notepad++小程序 AI编程
在AI编程时代，人人都能编程。我以"个人记账助手"小程序为例，详细演示整个开发过程。项目概述项目名称：个人记账助手功能描述：用户可以记录日常收支，查看统计图表，管理账单分类技术栈：微信小程序原生开发+云开发开发方式：VibeCoding+AI辅助第一阶段：需求分析与架构设计与AI对话进行需求梳理开发者描述：我想开发一个微信小程序，功能是个人记账。用户可以：1.添加收入和支出记录2.选择消费分类（餐
Rust中struct、impl、trait、enum关系解析
在Rust中，struct、enum、impl和trait是面向对象编程的核心概念，它们协同工作以实现数据抽象、封装和多态。以下是详细解释及它们之间的关系：1.struct（结构体）作用：定义自定义数据类型，封装多个相关字段（数据）。特点：类似于其他语言中的"类"，但仅包含数据（不包含方法）。支持泛型、生命周期参数等。通过impl块添加方法。示例：structRectangle{width:u32
大神之路-起始篇 | 第13章.计算机科学导论之【文件结构】学习笔记全栈工程师修炼指南从业必看书籍专栏学习笔记
欢迎关注「WeiyiGeek」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：
Redis学习总结（15）——Redis 基本数据类型使用场景一杯甜酒 Redis Redis基本数据类型使用场景
一、StringStrings数据结构是简单的key-value类型，value其实不仅是String，也可以是数字.常用命令:set,get,decr,incr,mget等。应用场景：String是最常用的一种数据类型，普通的key/value存储都可以归为此类.即可以完全实现目前Memcached的功能，并且效率更高。还可以享受Redis的定时持久化，操作日志及Replication等功能。除
如何下载并安装 Windows Subsystem for Linux (WSL)
在当今的开发环境中，WindowsSubsystemforLinux(WSL)已经成为许多开发者的必备工具。它允许用户在Windows系统上无缝运行Linux发行版，结合了Windows的强大功能和Linux的灵活性。本文将详细介绍如何下载和安装WSL，帮助你快速上手。一、什么是WSLWSL是微软推出的一项功能，允许用户在Windows操作系统上运行Linux二进制可执行文件。它提供了对Linux
盟接之桥EDI软件助力制造企业提质增效的五大关键举措
在当今竞争激烈的制造业环境中，企业面临着前所未有的挑战。如何在降低成本的同时提高效率，成为制造企业生存与发展的关键。盟接之桥EDI（电子数据交换）软件正是为应对这一挑战而生，通过五个核心优势帮助企业实现降本增效的目标。1.简化部署与集成，实现无缝对接传统上，企业在尝试整合新的软件系统时，往往面临复杂的部署过程和高昂的时间成本。然而，盟接之桥EDI软件以其简洁的部署流程脱颖而出。它能够迅速地与现有的
MyISAM 与 InnoDB 有什么区别？如何选择？ tsxchen 数据库 mysql
MyISAM不支持事务和外键，适合读多写少的场景；InnoDB支持事务、外键和行级锁定，适合高并发写操作。选择时根据应用需求决定：需要事务和高并发写入时选InnoDB，读多写少时可选MyISAM。一、核心区别对比特性InnoDBMyISAM事务支持✅完整ACID事务（原子性、一致性等）❌不支持事务锁机制行级锁（高并发写入性能优）表级锁（写操作阻塞全表）外键约束✅支持外键，保障数据完整性❌不支持外键
pytorch官方文档60分钟入门笔记 xiaodidadada 机器学习
文章目录1.张量（Tensors）定义张量张量操作2.自动求导（autograd）变量Variable3.神经网络4.训练一个分类器载入数据5.数据并行day63参考：官方文档https://blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU加快
vue3导出 excel、word 满楼、 excel word javascript
importaxiosfrom'axios'import{http}from'@/plugins/axios'import{useMessage}from'naive-ui'constmessage=useMessage()constinstance=axios.create({responseType:'arraybuffer',onDownloadProgress:function(Progr
Prompt 精通之路（四）- AI 赋能：10 个超实用的 Prompt 模板，覆盖写作、编程、学习和办公程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt 学习 Prompt模板 AI工作流 ChatGPT应用生产力工具
Prompt精通之路：系列文章导航第一篇：[本文]AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：AI赋能：10个超实用的Prompt模板，覆盖写作、编程、学习和办公第五篇：构建你的“AI指令系统”：超越简单提问的CRISPE
MAC 多应用切换技巧，单应用切换技巧
在Mac上，有几种快捷键可以帮助你快速切换应用程序窗口：1.Command(⌘)+Tab-这是最常用的快捷键，用于在打开的应用程序之间进行循环切换。按住Command键不放，然后反复按下Tab键可以选择下一个应用程序。当你松开Command键时，会激活选中的应用程序。-如果你在切换过程中改变了主意，可以在保持Command键按下的同时，使用Shift键反向选择。2.Command(⌘)+`（反引号
轻量级FTP服务器应用——开箱即用 antzou 办公软件效率工具 FTP eclipse rcp
文章目录背景目标实现下载背景快速搭建测试环境程序员在开发文件上传/下载、FTP集成等功能时，需要快速验证代码逻辑，但连接生产环境或公共测试服务器存在风险且效率低下。环境隔离与安全性在本地或内网启动专属FTP服务，避免污染公共环境，同时防止敏感测试数据外泄。低成本资源占用无需部署完整的FTP服务软件（如vsftpd、FileZillaServer），通过轻量级嵌入式方案节省系统资源。自定义配置灵活性
API，异常 qq_42822008
API:应用程序编程接口，即jdk文档手册，里面以类的形式提供了很多常用的功能。常用的包与类：java.lang包：因为常用，所以不需要导包字符串，线程java.util包:数组工具类，日期，集合等java.net包:网络相关的类型java.io包:输入输出类型java.math包：数学应用的相关类型打包工具:javadoc(1)使用命令提示符界面：类信息中没有声明包，即使用默认包javadoc-
YII2配置SQLSERVER 大智001
php5.3以后，没有对sqlserver的支持的动态链接文件了，要php支持sqlserver。记住下面两个链接：https://github.com/Microsoft/msphpsql1.根据要求下载SRV32.EXE文件。（Php5.5以上的可以安装SQL）https://www.microsoft.com/en-us/download/details.aspx?id=20098将其安装到
多租户多会话隔离存储架构的完整实现方案敲键盘的小夜猫大语言模型 python langchain python 人工智能
导读：在构建企业级AI应用的道路上，多租户隔离和会话管理往往成为架构师们面临的核心难题。当系统需要同时服务数百乃至数千个用户时，如何确保用户数据的完全隔离？如何让每个用户的多个对话会话保持独立运行而互不干扰？这篇文章通过深入剖析LangChain框架中的history_factory_config机制，为你展示了一套完整的多租户多会话隔离存储方案。文章不仅详细解析了ConfigurableFiel
Ubuntu/Linux运行安卓全攻略海洋月亮 ubuntu linux android docker scrapy
Ubuntu中使用scrcpy进行Android投屏，当我们手头没开发板没有屏幕的时候，就可以借助ADB和scrcpy进行投屏，很方便:A.这里展示如何在Ubuntu中使用scrcpy+adb+docker方案运行手机Android系统B.使用的模拟器方案基于redroid,能够非常简单方便地在任何Linux上运行Android模拟器C.测试环境:Ubuntu24.04D.需要用到的工具:scrc
DeepSeek打破AI天花板：MoE架构+RL推理，效率提升5倍的底层逻辑 m0_74825409 面试学习路线阿里巴巴人工智能架构
文章目录一、引言二、MoE架构：高效计算的核心支撑（一）MoE架构概述（二）DeepSeekMoE架构的创新点（三）MoE架构的代码实现示例三、RL推理：智能提升的关键驱动（一）RL推理概述（二）R1的训练流程（三）RL推理中的关键技术（四）RL推理的代码实现示例四、MoE架构与RL推理的结合：效率提升的奥秘（一）计算效率的提升（二）推理能力的增强（三）整体性能的飞跃五、结论与展望《DeepSee
Linux 系统运行 Android 应用的几种方案云水木石 linux android 运维服务器
这几年，国产操作系统替代正在有条不紊地进行中。但生态是绕不过去的一道坎，指望应用厂商一下子完成国产系统适配也不现实。之前介绍过使用Wine运行Windows应用的方案，减少了国产系统应用偏少的难题。比如我在办公室使用最多的企业微信，一直没有开发Linux版本，就是通过Wine运行的。除了Windows应用，还有新的目标，那就是手机应用。这些年移动互联网蓬勃发展，手机app从数量上已经远远超过桌面应
【vue组件库搭建07】Vitest单元测试 Eric⠀ 从零搭建组件库 vue.js 单元测试前端
vitest官网vue-test-utils我们的测试框架选择的是Vitest和vue-test-utils。两者的关系为：Vitest提供测试方法：断言、Mock、SpyOn等方法。vue-test-utils:挂载和渲染组件：VueTestUtils允许您在隔离中挂载组件，这意味着您可以测试单个组件而不必担心其子组件或需要完整的Vue应用环境。它还支持浅层挂载，其中子组件被存根，使测试更快并且
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（下） Allen_Lyb 数智化医院2025 人工智能健康医疗数据库矩阵
医疗边缘AI的市场趋势医疗边缘AI市场正经历着显著的增长，根据市场研究公司的数据，2024年的边缘AI市场价值为125亿美元，估计在2025至2034年之间，由于各部门越来越多地采用边缘装置，CAGR为24.8%。保健、制造业、零售业和汽车业的企业拥有综合边缘计算解决方案[36]。这一增长趋势表明，边缘AI技术正在各行各业得到广泛应用，其中医疗保健是一个重要的应用领域。2023年全球边缘人工智能市
spring mvc详解 Jessysong spring mvc详解
http://blog.csdn.net/chichengit/article/details/12098111
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
深入剖析AI大模型：关于模型训练 chilavert318 熬之滴水穿石人工智能
今天说的是模型训练，在AI模型里，它是点亮智慧星辰的关键引擎。今天将围绕开源预训练模型的使用、数据与模型的集成、模型的部署管理，以及大规模模型的可扩展性与效率提升展开，带大家开启一场深入浅出的模型训练实战之旅。一、使用开源预训练模型1、如何利用开源模型（如BERT、GPT）进行微调开源预训练模型就像是已经搭建好框架的摩天大楼，BERT、GPT等模型便是其中声名赫赫的标志性建筑。它们经过海量数据的“
RAG技术栈详解：构建智能问答系统的核心组件认知超载 AI 人工智能
本文深度剖析RAG（Retrieval-AugmentedGeneration）技术栈的核心构成，助你快速搭建企业级知识增强系统一、RAG技术架构全景图二、核心组件技术选型1.检索模块（Retriever）向量数据库主流选择：Pinecone、Milvus、Qdrant、Weaviate新兴势力：ChromaDB（开源轻量级）、腾讯云向量数据库嵌入模型（Embedding）OpenAItext-e
微调 || RAG，项目落地怎么选？LLM应用选型指南，适用场景全解析认知超载 AI 人工智能
基本定义微调：是指利用更小、更具针对性的数据集对经过预先训练的大语言模型进一步训练的过程。在这个过程中，模型基于新数据集修改权重和参数，学习特定于任务的模式，同时保留来自最初预训练模型的知识。RAG：即检索增强生成，是将检索大量外部知识的过程与文本生成结合在一起的一种方法。它会从大型外部数据库中检索与输入问题相关的信息，将这些信息作为上下文提供给大语言模型，辅助其生成回答。微调适用场景1.特定领域
是真是假？飞算JavaAI如何帮助开发者减少无效劳动？飞算JavaAI开发助手人工智能开发语言 java ide 大数据
在软件开发这一充满挑战与创新的领域中，开发者们时常面临着繁琐而复杂的工作流程。从最初的需求理解阶段开始，他们就需要投入大量的时间和精力去深入剖析客户的需求，确保每一个细节都被准确捕捉并转化为可实施的功能点。这一过程往往充满了反复沟通与确认，稍有不慎就可能导致后续的开发偏离轨道。紧接着，复杂的设计工作接踵而至，开发者需要运用专业的知识和丰富的经验，将需求转化为清晰、可行的设计方案，这其中包括了架构规
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
颠覆传统！飞算JavaAI：一键自动化开发流程，复制粘贴从此成为传说！飞算JavaAI开发助手自动化 java 人工智能开发语言
在软件开发的漫长历史中，程序员们长期被繁琐的流程所困扰。从理解业务需求，到设计接口、搭建架构，再到一行行地敲下代码，每一个环节都充满了挑战和艰辛。而复制粘贴，这个看似便捷的操作，却也常常伴随着代码冗余、错误传播等隐患，更无法从根本上解决开发效率低下的问题。然而，飞算JavaAI的横空出世，犹如一场科技风暴，彻底颠覆了传统的开发模式，让一键自动化开发流程成为现实，也让复制粘贴彻底成为了过去式的传说。
MapReduce01：基本原理和wordCount代码实现冬至喵喵大数据 mapreduce
本篇文章中，笔者记录了自己对于MapReduce的肤浅理解，参考资料主要包括《大数据Hadoop3.X分布式处理实战》和网络视频课程。下文介绍了MapReduce的基本概念、运行逻辑以及在wordCount代码示例。一、MapReduce概述1.概述google为解决其搜索引擎中的大规模网页数据的并行化处理问题，设计了MapReduce，在发明MapReduce之后首先用其重新改写了搜索引擎中we
Gartnet《Solution Path for Implementing Hybrid Cloud Applications With On-Premises Data》学习心得架构师学习成长之路大数据架构
一、引言随着企业数字化转型的深入，混合云架构逐渐成为一种中长期的现实选择。软件架构师们在将应用逻辑迁移到云端的同时，往往面临着数据层难以同步迁移的困境。Gartner的这份报告《SolutionPathforImplementingHybridCloudApplicationsWithOn-PremisesData》为我们提供了一条实施混合云应用的清晰路径，涵盖了从迁移策略的确定、应用与数据层的整
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他