Collin_NLP

Ubuntu12.04下moses的安装与测试Ubuntu

12.04 AMD64 运⾏行于VMware fusion 5.0.3

Boost 1.48.0

1.Boost的安装(可参考官⽅方⺴⽹网站http://www.boost.org)由于Moses编译需要boost和其他依赖库⽂文件,所以需要⾸首先安装Boost Library.⾸首先需要安装⼀一些依赖包:
apt-get install python-dev

apt-get install libbz2-dev #如果编译出现错误:bzlib.h: No suchfile or directory

下载boost 1.48.0,在终端解压到/home/apple中,执⾏行以下命令:$./bootstrap.sh
$./b2--prefix=/home/apple/boost-bin/ --libdir=/home/apple/boost-bin/lib64 --layout=tagged link=static,shared threading=multiinstallprefix后⾯面可以指定你⾃自⼰己希望安装boost的路径。若不指定,则使⽤用系统默认路径:/usr/local/include

2.安装GIZA++
下载GIZA++v1.0.7: http://giza-pp.googlecode.com/files/giza-pp-v1.0.7.tar.gz
$tar xzvf giza-pp-v1.0.7.tar.gz
$cd giza-pp
$make
经过这⼀一步会⽣生成⼏几个可执⾏行⽂文件,位于~/giza-pp/GIZA++-v2/GIZA++, ~/giza-pp/GIZA++-v2/snt2cooc.out and ~/giza-pp/mkcls-v2/mkcls. 需要把它们拷⻉贝到⼀一个moses可以找到的路径下:
$cd ~/mosesdecoder
$mkdir tools
$cp ~/giza-pp/GIZA++-v2/GIZA++ ~/giza-pp/GIZA++-v2/snt2cooc.out ~/giza-pp/mkcls-v2/mkcls tools

3.安装srilm
⾸首先,安装依赖的软件包:
1.C/C++ compiler:编译器gcc 3.4.3及以上版本,本机实验环境为gcc 4.5.22.GNU make:构建和管理⼯工程的⼯工具,解释Makefile⾥里的指令,描述了整个⼯工程所有⽂文件的编译顺序和编译规则。这⾥里是为了控制 SRILM 的编译和安装
3.GNU gawk:GNU所做的awk程序语⾔言。对于⽂文字资料的修改,对⽐比,抽取等处理,使⽤用c或passcal等不⽅方便且费时,awk 能够以很短的程序完成。这⾥里是处理SRILM⾥里的⼀一些脚本⽂文件
4.GNU gzip:使⽤用C语⾔言编写的⼀一种解压缩软件。这⾥里是为了使 SRILM 能够处理.Z和.GZ后缀的压缩⽂文件5.bzip2:数据压缩软件,压缩效率更⾼高。这⾥里是使SRILM能处理.bz2后缀的压缩⽂文件6.P7zip:数据压缩软件。这⾥里是使SRILM能处理7-Zip的压缩⽂文件
7.csh:Unix shell的⼀一种

I <安装>本机环境:

下载SRILM安装包:

链接:http://www.speech.sri.com/projects/srilm/download.html,创建安装的⺫⽬目录,并把压缩包解压到该⺫⽬目录。我的安装⺫⽬目录是:/home/apple/srilm修改makefile⽂文件
1.找到:# SRILM = /home/speech/stolcke/project/srilm/devel,另起⼀一⾏行输⼊入 SRILM 的安装路径 SRILM = $(PWD)

2.找到:MACHINE_TYPE := $(shell $(SRILM)/sbin/machine-type),在其前加#注释掉,并另起⼀一⾏行输⼊入:MACHINE_TYPE := i686-m64。3.需要同时修改sbin/machine-type,将其中对应位置改为 set MACHINE_TYPE =i686-m64

1.编译 SRILM
make World
2.修改环境变量
运⾏行命令 export PATH=/home/srilm/bin/i686-m64:/home/srilm/bin:$PATH

3.测试
编译通过不等于编译成功,必须利⽤用 SRILM 提供的测试模块进⾏行测试,进⼊入 SRILM根⺫⽬目录
make test
注:SRILM 从1.5.10开始,test ⽂文件已不在主⺫⽬目录下,⽽而是分别位于 lm flmlattice下
需要等待⼀一段时间,如果出现多是 IDENTICAL,就证明 SRILM 编译成功了!

4.安装moses在编辑Moses之前⼀一定要安装所有的依赖包,否则⽆无法编译通过,请安装以下软件包:$sudo apt-get install autoconf automake texinfo zlib1g zlib1g-devzlib-bin zlibc libtool libboost-all-dev libxmlrpc-c3-dev build-essential
apt-get install mpi-default-dev #安装mpi库
apt-get install libicu-dev #⽀支持正则表达式的UNICODE字符集

安装完成这些依赖包后,下⾯面进⾏行Moses的编译:下载moses.这⾥里使⽤用了moses-smt-mosesdecoder-388f5a2.zip
编译moses:
$nohup ./bjam -j1 --with-srilm=/home/apple/srilm --with-boost=/home/apple/boost-bin >& log.m &
./bjam -jx.其中x说明是⼏几核的可以加快处理速度,另外两个参数分别指定srilm和boost的安装位置。
可以查看log⽇日志⽂文件看是否在编译过程中存在错误。

注意:Moses编译不成功往往都是由于依赖包没有安装完整,⽐比如boost库没有装好。II<测试流程>

在完成上述的环境搭建过程后,就可以开始完成测试的流程。

1.准备语料要训练翻译系统,我们需要平⾏行语料(翻译成两种语⾔言的⽂文本),⽽而且必须是已经句⼦子对⻬齐的。有很多这样的语料可供选择,我们将选取⼀一个有130000句的⼩小的语料库,在home/apple下创建corpus⽂文件夹,执⾏行:

 cd
 mkdir corpus
 cd corpus

 wget http://www.statmt.org/wmt12/training-parallel.tgz

tar zxvf training-parallel.tgz在~/corpus/training⺫⽬目录下可以看到europarl和news-commentary⽂文件,有多种语⾔言可供选择。我们将构建⼀一个法语到英语的翻译系统,使⽤用news-coommentary语料库。当然你也可以使⽤用其他语⾔言的语料库。
要准备数据,⾸首先执⾏行如下步骤:
a.tokenisation 这⼀一步会在词汇、标点之间插⼊入空格。
b.truecasing 每句话的第⼀一个词将转换为最合适的⼤大⼩小写状态。
c.cleaning 过⻓长的句⼦子和空句⼦子将会被除去,因为它们可能导致训练过程中的⼀一些错误,同时错误对⻬齐的句⼦子也被除去了。

分词(tokenisation)的执⾏行过程:~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en < ~/corpus/

training/news-commentary-v7.fr-en.en  \
     > ~/corpus/news-commentary-v7.fr-en.tok.en

 ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l fr < ~/corpus/
training/news-commentary-v7.fr-en.fr  \

     > ~/corpus/news-commentary-v7.fr-en.tok.fr

下来要改变⼤大⼩小写状态,⾸首先truecaser需要经过训练来抽取⽂文本的统计信息:~/mosesdecoder/scripts/recaser/train-truecaser.perl --model ~/corpus/truecase-model.en --corpus \

     ~/corpus/news-commentary-v7.fr-en.tok.en
 ~/mosesdecoder/scripts/recaser/train-truecaser.perl --model ~/

corpus/truecase-model.fr --corpus  \
     ~/corpus/news-commentary-v7.fr-en.tok.fr

trucase需要使⽤用Moses中的另⼀一个脚本⽂文件:~/mosesdecoder/scripts/recaser/truecase.perl --model ~/corpus/

truecase-model.en < ~/corpus/news-commentary-v7.fr-en.tok.en  \
    > ~/corpus/news-commentary-v7.fr-en.true.en

 ~/mosesdecoder/scripts/recaser/truecase.perl --model ~/corpus/
truecase-model.fr < ~/corpus/news-commentary-v7.fr-en.tok.fr  \

> ~/corpus/news-commentary-v7.fr-en.true.fr最后我们进⾏行clean,把句⼦子⻓长度限制在80词以内:~/mosesdecoder/scripts/training/clean-corpus-n.perl ~/corpus/news-commentary-v7.fr-en.true fr en \

    ~/corpus/news-commentary-v7.fr-en.clean 1 80

2.训练语⾔言模型
语⾔言模型(language model)⽤用来保证翻译输出的流畅度,其实就是让翻译出来的话更像是⺫⽬目标语⾔言⼈人说的⾃自然语⾔言。⺫⽬目前有多种训练语⾔言模型的⽅方法可供使⽤用,⽐比如SRILM和IRSTLM,本实验中选⽤用SRILM。具体的安装过程已经在上⾯面讲过。下⾯面将⽤用SRILM训练⼀一个3元语⾔言模型,使⽤用kndiscount平滑⽅方法,命令如下:
mkdir ~/lm
cd ~/lm

./ngram-count -text news-commentary09.fr-en.clean.en -lm news-commentary09.fr-en.lm.en -order 3 -interpolate -kndiscount 参数说明:
-text:要训练的⽂文本,⼀一⾏行⼀一句

-lm:输出⽂文件名

-order n:语⾔言模型的元数
-unk:未登录词,默认是移除未登录词
-wbdiscount:平滑
-interpolate:插值
⾄至此,语⾔言模型训练完成。如此训练的到的语⾔言模型在真正使⽤用的时候会载⼊入速度会⽐比较慢,为此,我们需要将它⼆二进制化:

~/mosesdecoder/bin/build_binary news-commentary09.fr-en.lm.ennews-commentary09.fr-en.blm.en
可以测试⼀一下语⾔言模型:
$echo "is this an English sentence ?" | ~/mosesdecoder/bin/querynews-commentary09.fr-en.blm.en

3.训练翻译模型下⾯面开始了主要的步骤,这⼀一步会使⽤用GIZA++进⾏行词语对⻬齐,短语抽取和打分,构建词汇重排表并创建Moses配置⽂文件:moses.ini。
mkdir ~/working
cd ~/working

 nohup nice ~/mosesdecoder/scripts/training/train-model.perl  -
root-dir train -corpus ~/corpus/news-commentary09.fr-en.clean \

   -f fr -e en -alignment grow-diag-final-and -reordering msd-
bidirectional-fe  \

-lm 0:3:$HOME/lm/news-commentary09.fr-en.blm.en:8 -external-bin-dir ~/mosesdecoder/tools >& training.out &如果你的电脑有多核处理器,可以使⽤用-cores参数指定核⼼心数⺫⽬目来加快并⾏行处理速度。

这⼀一步会占⽤用2⼩小时左右时间。结束后会在~/working/train/model⺫⽬目录下⽣生成moses.ini配置⽂文件。你需要使⽤用这个配置⽂文件进⾏行解码。同样,为了加快处理速度,需要先把短语表和重排序表进⾏行⼆二进制转化;其次,还有⼀一个问题就是moses对于各种模型的分配权重并没有得到最优化,你可以查看Moses.ini⽂文件看到它们的默认权重被设置为0.2,0.3这样的数值。为了优化权重,我们需要调整权重,这⼀一步通常会花掉很⻓长的时间。

4.调整权重这是整个过程最慢的⼀一部。调整权重需要⼀一部分开发集语料,可以从http://www.statmt.org/wmt12/dev.tgz下载到语料,并在~/corpus⺫⽬目录下进⾏行解压。我们将使⽤用news-test2008进⾏行调整权重,⾸首先需要对原始语料进⾏行分词、⼤大⼩小写转化。

cd ~/corpus

 ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en < dev/news-
test2008.en > news-test2008.tok.en

 ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l fr < dev/news-
test2008.fr > news-test2008.tok.fr

 ~/mosesdecoder/scripts/recaser/truecase.perl --model truecase-
model.en < news-test2008.tok.en > news-test2008.true.en

 ~/mosesdecoder/scripts/recaser/truecase.perl --model truecase-
model.fr < news-test2008.tok.fr > news-test2008.true.fr

现在可以开始调整权重了(可以干些别的事情,因为这⼀一步我花了将近6个⼩小时^.^):
cd ~/working
nohup nice ~/mosesdecoder/scripts/training/mert-moses.pl ~/corpus/news-test2008.true.fr ~/corpus/news-test2008.true.en \

  ~/mosesdecoder/bin/moses  train/model/moses.ini --mertdir ~/
mosesdecoder/bin/ &> mert.out &

经过tuning,会在~/working/mert-work/moses.ini⽣生成新的配置⽂文件。

5.测试⼀一下翻译的效果为了让这个过程更加快速,如上所述,需要将⼆二进制化的短语表和词汇重排序表的位置告诉给moses.可以如下操作:

 mkdir ~/working/binarised-model
 cd ~/working
 ~/mosesdecoder/bin/processPhraseTable -ttable 0 0 train/model/

phrase-table.gz -nscores 1 -out binarised-model/phrase-table
 ~/mosesdecoder/bin/processLexicalTable -in train/model/

reordering-table.wbe-msd-bidirectional-fe.gz -out binarised-model/
reordering-table

把moses.ini⽂文件拷⻉贝到~/working.binarised-model⺫⽬目录下。然后打开moses.ini⽂文件修改其中的路径参数:
找到0 0 0 5 /home/bhaddow/working/train/model/phrase-table.gz修改为:1 0 0 5 /home/bhaddow/working/binarised-model/phrase-table找到0-0 wbe-msd-bidirectional-fe-allff 6 /home/bhaddow/working/train/model/reordering-table.wbe-msd-bidirectional-fe.gz

修改为0-0 wbe-msd-bidirectional-fe-allff 6 /home/bhaddow/working/binarised-model/reordering-table
现在翻译过程将⾮非常迅速:
apple@ubuntu:~/working$ echo "faire revenir les militants sur leterrain et convaincre que le vote est utile ." | ~/mosesdecoder/bin/moses -f binarised-model/moses.ini

Defined parameters (per moses.ini or switch):

"     config: binarised-model/moses.ini

"     distortion-file: 0-0 wbe-msd-bidirectional-fe-allff 6 /home/
apple/working/binarised-model/reordering-table

```
"     distortion-limit: 6
```
```
"     input-factors: 0
```

"     lmodel-file: 8 0 3 /home/apple/lm/news-commentary09.fr-
en.blm.en

```
"     mapping: 0 T 0
```

"     ttable-file: 1 0 0 5 /home/apple/working/binarised-model/
phrase-table

```
"     ttable-limit: 20
```

"     weight-d: 0.0682203 0.0955797 0.00663694 0.022609 0.0597706
0.101574 0.0816536

```
"     weight-l: 0.099719
```

"     weight-t: 0.0467871 0.0649766 0.0496845 0.107051 0.0467517

"     weight-w: -0.148986
Loading lexical distortion models...have 1 models
Creating lexical reordering...
weights: 0.096 0.007 0.023 0.060 0.102 0.082
binary file loaded, default OFF_T: -1
Start loading LanguageModel /home/apple/lm/news-commentary09.fr-
en.blm.en : [1.000] seconds

Finished loading LanguageModels : [1.000] seconds
Start loading PhraseTable /home/apple/working/binarised-model/
phrase-table : [1.000] seconds
filePath: /home/apple/working/binarised-model/phrase-table
Finished loading phrase tables : [1.000] seconds
IO from STDOUT/STDIN
Created input-output object : [1.000] seconds
Translating line 0  in thread id 140033287264000
Translating: faire revenir les militants sur le terrain et
convaincre que le vote est utile .

reading bin ttable
size of OFF_T 8
binary phrasefile loaded, default OFF_T: -1
binary file loaded, default OFF_T: -1
Collecting options took 0.580 seconds
Search took 1.200 seconds
bring activists on the ground and convince that the vote is
useful .
BEST TRANSLATION: bring activists on the ground and convince that
the vote is useful . [111111111111111]  [total=-9.637] <<0.000,
-13.000, 0.000, -3.348, 0.000, 0.000, -4.486, 0.000, 0.000,
-77.057, -9.337, -21.849, -5.445, -14.024, 6.999>>
Translation took 1.210 seconds
Finished translating

6.运⾏行解码器并且测试BLEU值现在,你可能需要知道这个翻译系统的实际性能的量化指标如何,这就需要我们使⽤用另⼀一个test集。我选⽤用了newstest2011,如前所述,需要先进⾏行token和truecase:

cd ~/corpus

 ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en < dev/
newstest2011.en > newstest2011.tok.en

 ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l fr < dev/
newstest2011.fr > newstest2011.tok.fr

 ~/mosesdecoder/scripts/recaser/truecase.perl --model truecase-
model.en < newstest2011.tok.en > newstest2011.true.en

 ~/mosesdecoder/scripts/recaser/truecase.perl --model truecase-
model.fr < newstest2011.tok.fr > newstest2011.true.fr

cd ~/working

 ~/mosesdecoder/scripts/training/filter-model-given-input.pl
filtered-newstest2011 mert-work/moses.ini ~/corpus/
newstest2011.true.fr  \

  -Binarizer ~/mosesdecoder/bin/processPhraseTable

下⾯面⽤用测试集测试⼀一下解码器,然后运⾏行bleu脚本:
nohup nice ~/mosesdecoder/bin/moses -f ~/working/filtered-newstest2011/moses.ini < ~/corpus/newstest2011.true.fr \

   > ~/working/newstest2011.translated.en 2> ~/working/
newstest2011.out &

 ~/mosesdecoder/scripts/generic/multi-bleu.perl -lc ~/corpus/
newstest2011.true.en < ~/working/newstest2011.translated.en

最终我得到如下结果:
BLEU = 18.97, 56.0/24.9/12.9/7.2 (BP=1.000, ratio=1.022,hyp_len=76434, ref_len=74753)

⼀一些有价值的参考⺴⽹网⻚页:
配置boost http://www.boost.org/doc/libs/1_53_0/more/getting_started/unix-variants.htmlhttp://blog.sina.com.cn/s/blog_8588208901015o9b.html安装moses教程http://mynoteweb.com/node/13358(其中⼏几步解压参数需要修改)http://www.leexiang.com/how-to-run-moses
SRILM训练语⾔言模型http://blog.csdn.net/zhoubl668/article/details/7759042

后端开发技巧：提升代码质量与系统性能 wenbin_java java spring boot maven mybatis
引言后端开发是构建高效、稳定应用的核心环节。无论是处理复杂的业务逻辑，还是优化系统性能，后端开发者都需要掌握一系列技巧和最佳实践。本文将分享一些实用的后端开发技巧，帮助你提升代码质量、优化系统性能并确保应用的安全性。1.提升代码质量的技巧1.1遵循编码规范统一风格：使用工具（如Checkstyle、ESLint）确保代码风格一致。命名规范：变量、函数、类名应具有描述性，避免使用缩写。1.2模块化与
主成分回归（PCR）与特征值因子筛选：从理论到MATLAB实战青橘MATLAB学习多元分析回归 matlab 线性代数数学建模算法
内容摘要：本文深入解析主成分回归（PCR）的原理与MATLAB实现，结合Hald水泥数据案例对比PCR与普通回归的性能差异。详细讲解特征值筛选策略（累积贡献率、交叉验证），并提供单参数估计优化方法。通过完整代码与可视化结果，助力读者掌握高维数据建模与多重共线性处理技巧。关键词：主成分回归特征值筛选多重共线性MATLAB实现交叉验证—1.主成分回归（PCR）概述主成分回归（PrincipalComp
编程基础-算法研究-算法题周陽讀書算法基础个人经验可供分享算法
没想到工作几年后还要考算法题目遂研究记录目录0.简介1.丑数1.1题目1.2要点1.2.1丑数如何判别1.2.2后续丑数如何找到1.2.3结尾th,nd,st规律1.2.4完整可参考代码2大斐波那契数2.1题目2.2要点2.2.1范围超界2.3完整参考代码2.4延伸：C语言计算100的阶乘2.5其他细节点3迷宫问题3.1迷宫问题13.2迷宫问题20.简介一些技巧：~scanf#include{in
《Spring Boot + MySQL高性能应用实战：性能优化技巧与最佳实践》扣丁梦想家 Spring spring boot mysql 后端
目录应用性能优化概述环境搭建与技术栈选择数据库设计优化SpringBoot与MySQL集成优化4.1使用JPA/Hibernate的性能优化4.2连接池的配置与优化4.3分页与查询优化MySQL性能优化5.1索引优化5.2查询缓存与慢查询分析应用性能监控与日志总结与最佳实践应用性能优化概述在高性能应用的构建过程中，我们不仅需要关注数据库性能，还要从以下几个方面进行优化：数据库设计优化：合理设计表结
解密AI创作：提升Prompt提示词的提问技巧 chiikawa&q 人工智能 prompt
文章目录AI创作的核心：提示词Prompt的重要性1.什么是提示词工程？1.1提示词的工作原理1.2高薪提示词工程师的现实1.3谁能胜任提示词工程师？2.提示词编写技巧3.常见的提示词框架3.1CO-STAR框架3.2BORKE框架4.提示词的实际应用5.提示词资源网站6.AIGC领域的发展与应用7.生成式AI实验示例AI创作的核心：提示词Prompt的重要性在深入探索AI内容创作时，提示词成为与
轻松获取京东商品信息：商品详情API接口使用教程 lovelin+vI7809804594 API学习大数据 python json 爬虫后端数据库开发
在电子商务的繁荣时代，商品信息的准确性和实时性对于商家、消费者以及各类电商平台来说至关重要。京东，作为中国领先的电商平台之一，其商品信息更是蕴含着巨大的商业价值和市场洞察。本文将为您详细介绍如何使用京东商品详情API接口，轻松获取京东上的商品信息，并分享一些实用的技巧和注意事项，帮助您更好地利用这一强大工具。一、京东商品信息的重要性京东商品信息不仅包括了商品的基本属性（如名称、价格、规格、图片等）
Python 文本处理神器：textwrap 模块深度解析 tekin Python 编程秘籍库 python 开发语言 Python 文本处理 textwrap 模块深度解析
Python文本处理神器：textwrap模块深度解析在Python编程中，处理文本是一项常见任务，比如自动换行、填充文本、缩短文本等。textwrap模块就像是一个贴心助手，专门用来解决这些问题。本文将带你深入了解textwrap模块的各种功能，通过丰富的示例代码和清晰的讲解，让你轻松掌握它的使用技巧，提升文本处理能力。文章目录Python文本处理神器：textwrap模块深度解析一、`text
《 C++ 点滴漫谈：二十八》看不见的战场：C++ 内存布局与性能优化终极秘籍！ Lenyiin 编程显微镜 c++内存布局 Lenyiin
摘要C++的内存布局是理解程序执行机制和优化性能的核心内容。本文深入探讨了C++程序的内存分布，包括栈区、堆区、全局/静态区和代码段的特点与作用，剖析了内存对齐规则与填充对性能的影响，并结合面向对象编程和现代C++特性的内存管理方法，全面解析了语言的内存操作模式。通过详细的调试技巧和案例分析，本文还探讨了常见内存问题及其解决方案，如内存泄漏和越界访问等。本博客旨在帮助开发者掌握C++内存布局的基础
如何用对提示词？快速解锁大模型的隐藏能力人工智能
你是否留意到，有人借助AI高效完成工作甚至实现盈利，然而大部分人却仅用AI获取一些无关紧要的内容。为何会出现这种差异呢？究其原因，主要在于与AI沟通技巧的不同。无论使用何种模型，提示词的编写技巧都具有通用性。接下来，本文将详细介绍如何编写prompt（提示词），从而与大模型实现更有效的沟通。一、提示词的构成首先，我们来剖析一个prompt所应包含的关键信息：任务（指令）：明确需要完成的任务以及期望
两天速通力扣HOT100[DAY2] (55~100) WynnLu 算法 leetcode c++
两天速通力扣HOT100[DAY2](55~100)本题解旨在以最简单的语言总结hot100各题思路，为每一题提供一个思考入口，但想要手撕出来，需要自己认真推理细节。目录回溯55~62二分查找63~68栈69~73堆74~76贪心77~80动态规划81~90多维动态规划91~95技巧96~10055、全排列思路回溯基本思想：DFS+状态还原面对前方n种选择的时候，循环选择其中一种，做出对应的改变并
让 LLM 来评判 | 设计你自己的评估 prompt 人工智能llmprompt
设计你自己的评估prompt这是让LLM来评判系列文章的第三篇，敬请关注系列文章:基础概念选择LLM评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示通用prompt设计建议我总结的互联网上通用prompt的通用设计原则如下:任务描述清晰:YourtaskistodoX(你的任务是X).YouwillbeprovidedwithY(你拿到的信息是Y).评估标准精细，评分
清华大学：DeepSeek+DeepResearch 让科研像聊天一样简单（86 页 PDF）伟贤AI之路 AI技术 pdf
第一弹：《DeepSeek：从入门到精通（100页PDF）》第二弹：《DeepSeek如何赋能职场应用？从提示语技巧到多场景应用》第三弹：《普通人如何抓住DeepSeek红利？》现在是《DeepSeek+DeepResearch让科研像聊天一样简单》PDF阅读地址：https://tcnsnwj3d31i.feishu.cn/wiki/CkbJw0pm5i5uAEkiijrcGGHrnGhPDF中
【创作话题】Wireshark插件开发实用技巧分享热爱分享的博士僧 wireshark 测试工具网络
开发Wireshark插件能够极大地扩展Wireshark的功能，使其能够解析和分析特定协议的数据包。以下是一些实用技巧，帮助您更高效地进行Wireshark插件开发：1.熟悉Lua脚本语言Wireshark支持使用Lua脚本语言来编写插件。Lua是一种轻量级的脚本语言，易于学习且功能强大，非常适合用于快速原型设计和开发Wireshark插件。掌握Lua的基本语法、数据结构（如表）以及如何在Lua
深入探索Python嵌套字典：查找与遍历技巧 Python老吕 python Python嵌套字典 Python列表嵌套字典排序 Python字典嵌套列表取值 Python遍历多层嵌套字典 Python列表嵌套字典遍历 Python列表嵌套字典查找
深入探索Python嵌套字典：查找与遍历技巧文章由来深入探索Python嵌套字典：查找与遍历技巧1.引言Python字典的重要性嵌套字典的概念2.嵌套字典基础什么是嵌套字典创建和访问嵌套字典创建嵌套字典访问嵌套字典修改嵌套字典注意事项3.遍历嵌套字典编写函数遍历嵌套字典打印所有键值对及其路径注意事项4.寻找特定键值对定义问题：在嵌套字典中找到特定键实现递归搜索函数注意事项5.代码示例展示遍历嵌套字
你好，我是冴羽，我写了一套《前端大佬成长之路》
你好，我是冴羽。这么正式的开头说明我有了一个大动作。是的，我创建了自己的知识星球：“冴羽·前端大佬成长之路”。重点一：新的一年，我会在知识星球更新一套“前端大佬成长之路”的课程。包含目标规划篇、学习方法篇、前端学习篇、个人管理篇、职场发展篇、面试技巧篇、健康养生篇共7大篇章、40节文章。总结了我近十年的工作生活经验，让大家少走一些弯路，节省一些时间。重点二：但是帮助你全面成长，一套课程是不够的，必
最全面的 Markdown 语法参考手册 markdown
全面掌握Markdown：本教程详细介绍了Markdown的基本语法和扩展语法，包括标题、段落、列表、代码、链接、图片等，并提供实用技巧，助您快速上手，高效创建结构化文档。无论您是编写文档、笔记、博客，还是进行内容创作，都能从中获益。同时，本手册还涵盖了CommonMark规范，助您了解Markdown的底层原理。文章目录Markdown基本语法标题(Headings)")段落(Paragraph
【总结分析篇】DeepSeek 百问百答：你想知道的关于 DeepSeek 的一切，都在这里！再见孙悟空_ 【2025 AI学习从零单排系列】deepSeek DeepSeek AI AI编程 AI写作人工智能
DeepSeek作为一款强大的AI工具，最近可是火得不行！你是不是也对它充满好奇，想一探究竟？别急，这篇博客就为你准备了100个关于DeepSeek的问题和解答，从基本功能到使用技巧，从应用场景到未来展望，一次性满足你的所有好奇心产品基础1.DeepSeek是什么？它是一款融合深度思考与联网搜索的智能工具，能帮你快速处理信息、解决问题。2.谁开发的DeepSeek？由专业的研发团队打造，致力于为用
Shell编程详解一快乐骑行^_^ 大数据 Shell shell编程详解
Shell编程详解1.Shell2.history3.别名alias4.管道符重定向5.&6.jobs7.fg8.bg9.命令之间用；分割10.命令之间用&&分割11.命令之间用||分割12.花括号{}使用技巧13.变量14.通过read命令设置变量15.set和unset16.变量的作用范围17.环境变量18.PATH19.位置变量20.变量的展开与替换21.数组22.算数运算23.bc命令高级
微信小程序开发中的本地存储与数据持久化 master_chenchengg 微信小程序知识点微信小程序小程序移动端微信
微信小程序开发中的本地存储与数据持久化本地存储的重要性：提升微信小程序性能的秘密武器入门指南：如何使用微信小程序的本地存储API实战演练：实现数据持久化的最佳实践优化体验：本地缓存与数据同步策略安全第一：保护敏感数据的技巧跨端一致：确保本地存储在不同设备上的表现未来趋势：探索新兴存储技术在小程序中的应用在移动互联网时代，用户期望应用能够在离线状态下依然保持功能的完整性。对于微信小程序而言，本地存储
一文搞懂！不同笔记本 SSH 远程连接服务器全攻略 a小胡哦 ssh 服务器运维
在如今数字化办公和开发的大环境下，使用SSH远程连接服务器是很多技术人员必备技能。无论是MacBook、Windows笔记本还是Linux系统的笔记本，掌握SSH远程连接，都能极大提升工作效率。本文将详细介绍不同笔记本使用SSH远程连接服务器的用处、优点以及实用技巧，特别是在数据传输方面。一、SSH远程连接服务器的用处（一）远程管理与操作无需直接在服务器物理终端上操作，通过SSH可以在世界任何角落
《日程管理技巧与工具推荐：如何让日程管理更有趣？》
日历应用现在手机和电脑上都有日历应用，像Google日历、苹果日历，这些都挺好用的。你可以把重要的日期、会议、活动都添加进去，还能设置提醒，到时间了就会通知你，绝对不会错过任何重要的事儿。而且这些日历应用还能同步到多个设备上，不管你用手机还是电脑，随时随地都能查看自己的日程。[]()任务管理工具任务管理工具就更厉害了，它能帮你把任务分解成具体的步骤，设置优先级、截止日期，还能实时更新任务状态。比如
Spring Boot从入门到精通：一站式掌握企业级开发一位卑微的码农 spring boot 后端 java
前言SpringBoot作为Java领域最流行的微服务框架，凭借其约定优于配置的理念和快速启动的特性，极大简化了Spring应用的初始搭建和开发过程。本文将带你从零开始系统学习SpringBoot，最终实现精通级应用开发，涵盖核心原理、实战技巧及性能优化。一、SpringBoot入门篇1.SpringBoot简介核心优势：自动配置、内嵌服务器（Tomcat/Jetty）、Starter依赖简化适用
【星云 Orbit-F4 开发板】03f. 按键玩法六：按住一个独立按键不松手的加速匀速触发智木芯语【星云 Orbit-F4 开发板】单片机 stm32 嵌入式硬件
【星云Orbit-F4开发板】03f.按键玩法六：按住一个独立按键不松手的加速匀速触发引言在嵌入式系统中，按键不仅是输入设备，还可以通过检测按键的持续状态来实现复杂的控制逻辑。本文将详细介绍如何使用STM32F407的GPIO引脚检测按键的长按状态，并通过HAL库实现加速匀速触发功能。通过本教程，读者将能够掌握独立按键的长按检测方法以及加速匀速触发的实现技巧。硬件准备在开始编程之前，确保您已经准备
有效使用DeepSeek-R1的7大技巧：提升AI助手效能的秘诀小李独爱秋 Deepseek AIGC AI编程 prompt
在数字化浪潮中，AI助手已经成为我们不可或缺的伙伴。DeepSeekR1作为一款功能强大的AI助手，其高效性和灵活性备受用户青睐。然而，如何更好地利用DeepSeekR1，发挥其最大效能呢？本文将结合实际案例，分享7大有效的R1使用技巧，帮助你像CSDN大牛一样高效利用AI助手。技巧1：提出明确的要求技巧阐述：在与DeepSeekR1交互时，清晰明确的表达是关键。避免使用模糊不清的描述，这样可以减
Xftp 文件传输效率倍增术：私藏秘籍，打造极速文件传输通道！清水白石008 开发环境开发语言学习笔记 macos
Xftp文件传输效率倍增术：私藏秘籍，打造极速文件传输通道！在日常的软件开发、系统管理以及数据处理工作中，文件传输是不可或缺的环节。而Xftp，作为一款强大而专业的SFTP、FTP文件传输客户端，凭借其卓越的性能、丰富的功能和友好的用户界面，成为了无数专业人士的首选。你是否还在为文件传输速度慢、操作繁琐、安全性低而烦恼？你是否渴望掌握Xftp的高级技巧，大幅提升文件传输效率，让工作事半功倍？今天，
实战讲解，原来是用 SpringBoot 实现策略模式可以这么简单 java小浩 java spring boot 开发语言
一、介绍一说起策略设计模式，相比大家都不陌生，在实际的业务开发中，合理的使用设计模式来编程，可以让代码阅读起来层次感更强，同时扩展性也会得到提升！最近看同事的代码时候，学到了一个小技巧，在某些场景下合理的使用策略模式还是非常有用的，在此分享一下给大家。二、代码实践在介绍SpringBoot中如何实现策略设计模式之前，我们先简单的回顾一下策略模式的设计思路。以编写一个简单的程序计算器，代码如下！首先
java23种设计模式-观察者模式千里码！设计模式后端技术 #Java 设计模式观察者模式
观察者模式（ObserverPattern）学习笔记编程相关书籍分享：https://blog.csdn.net/weixin_47763579/article/details/145855793DeepSeek使用技巧pdf资料分享：https://blog.csdn.net/weixin_47763579/article/details/1458840391.模式定义行为型设计模式，定义对象间
java23种设计模式-中介者模式千里码！设计模式后端技术 #Java 设计模式中介者模式
中介者模式（MediatorPattern）学习笔记编程相关书籍分享：https://blog.csdn.net/weixin_47763579/article/details/145855793DeepSeek使用技巧pdf资料分享：https://blog.csdn.net/weixin_47763579/article/details/1458840391.模式定义行为型设计模式，通过定义一
Navicat Premium 16/17 安装包（Win/Mac）支持M系列芯片可视化数据库管理工具吃汤圆的抹香鲸 macos windows postgresql 数据库 mysql sql
目录下载链接:https://pan.baidu.com/s/1faPBE6hZPwjVOErTLiy6oA?pwd=1234提取码:1234一、环境部署与基础配置1.1双版本安装指南1.2中文汉化配置二、数据库管理核心功能2.1多协议连接方案2.2数据迁移与同步三、高阶开发技巧3.1智能SQL编辑器3.2可视化查询构建3.3数据模型设计四、效率革命：15个杀手级技巧4.1快捷键矩阵4.2自定义工
【MySQL】左连接右连接内连接与Hash连接、子查询原理与实战（MySQL专栏启动）小二上酒8 mysql 哈希算法数据库后端 java
本文导读本文介绍MySQL数据库中的左连接、右连接、内连接与Hash连接的工作原理，并分析子查询与JOIN的不同，根据本文所学提供一些工作中需要掌握的实战技巧。一、MySQL数据库JOIN连接在多个表上创建索，并且多个表JOIN和子查询语句相对比较困难。许多开发人员不自觉地认为JOIN会降低SQL的性能效率，因此他们将多表SQL拆分为单表查询，认为这会影响SQL执行的效率，原因是开发人员不了解JO
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

Ubuntu12.04下moses的安装与测试Ubuntu

你可能感兴趣的:(技巧)