上野123

商品情感分析

介绍

比赛链接：
https://www.heywhale.com/home/competition/609cc718ca31cd0017835fdc
内含4个数据集：
商品信息.csv (product_information.csv)
商品类别列表.csv (product_cls.csv)
训练集.csv (product_train.csv)
测试集.csv (product_test.csv)

准备数据

训练集.csv(product_train.csv)

bert可以处理的语料

我们首先将product_train.csv处理成bert能处理的语料product_review_train_bert.csv。
代码如下：

import csv
with open('data/product/product_train.csv','rt',encoding='utf-8') as f1,\
        open('data/product/product_review_train_bert.csv','wt',encoding='utf-8') as f2:
    reader = csv.reader(f1)
    for num, i in enumerate(reader):
        if num == 0:
            continue
        str1 = list(i[4]+i[5])
        str1.insert(int(len(str1)/2),'\n')
        text = "".join(str1)
        print(text)
        writer = csv.writer(f2)
        writer.writerow([text])

product_train.csv:

数据ID,用户ID,商品ID,评论时间戳,评论标题,评论内容,评分
TRAIN_0,300212.0,PRODUCT_60357,1282579200,刚到!!!!!!!!,"刚刚收到,2天我晕,一般快递最快到我们这要3天呢,赞个!!!   包装台简单了,说明书看不懂。 瓶子半透明。   问了官方,说卓越也是他们的合作伙伴,正品放心。",4.0
TRAIN_1,213838.0,PRODUCT_354315,1305561600,很好的一本书,不过这本书没有赠送什么代金券。体现不出以前的正版图书送网站学习代金券的特点。,5.0
TRAIN_2,1045492.0,PRODUCT_192005,1357747200,二手手机,"很负责任的说一句,亚马逊给我发过来的手机绝对是二手的!!",1.0
TRAIN_3,587784.0,PRODUCT_1531,1305129600,送的光盘不行,"这本书内容很好,就是送的光盘不行。这次重新订购了一套,期望发过来的光盘能用",4.0
TRAIN_4,1244067.0,PRODUCT_324528,1285689600,很实用,"很实用的一本书,非常喜欢!",5.0
TRAIN_5,3361.0,PRODUCT_4163,1346256000,关于书籍的包装,"书籍本身没有问题,货物的包装实在不敢恭维。不知出于何种考虑,先前的纸盒包装现在换成了塑料袋,拍下的两本精装书拿到手居然卷了边,超级郁闷。以此种方式来降低成本,实在不足取。省下的只是仨瓜俩枣,失去的却是人们的信任。",4.0

product_review_train_bert.csv:
"刚到!!!!!!!!刚刚收到,2天我晕,一般快递最快到我们这要3天呢,赞个!!!   包装
台简单了,说明书看不懂。 瓶子半透明。   问了官方,说卓越也是他们的合作伙伴,正品放心。"

"很好的一本书不过这本书没有赠送什么代金券。体
现不出以前的正版图书送网站学习代金券的特点。"

"二手手机很负责任的说一句,亚马逊
给我发过来的手机绝对是二手的!!"

"送的光盘不行这本书内容很好,就是送的光盘不
行。这次重新订购了一套,期望发过来的光盘能用"

"很实用很实用的一
本书,非常喜欢!"

train.csv(训练)

然后将训练集.csv中70000条数据分为train.csv（50000条）,dev.csv（10000条）,test.csv(10000条)
注意： 标签要从0开始
部分代码：

with open('data/product/product_train.csv','rt',encoding='utf-8') as f1,\
        open('data/product/product_review_train_train.csv','wt',encoding='utf-8') as f2,\
        open('data/product/product_review_train_dev.csv','wt',encoding='utf-8') as f3,\
        open('data/product/product_review_train_test.csv','wt',encoding='utf-8') as f4:
    reader = csv.reader(f1)
    for num, i in enumerate(reader):
        if num<=50000:
            if num == 0:
                tgt = 'label'
                text = 'text_a'
            else:
                tgt = str(int(float(i[-1])))
                text = i[4] + i[5]
            str1 = tgt + '\t' + text + '\n'
            writer = csv.writer(f2)
            f2.write(str1)
        elif num>50000 and num<=60000:
            if num == 50001:
                tgt = 'label'
                text = 'text_a'
            else:
                tgt = str(int(float(i[-1])))
                text = i[4] + i[5]
            str2 = tgt + '\t' + text + '\n'
            writer = csv.writer(f3)
            f3.write(str2)
        else:
            if num == 60001:
                tgt = 'label'
                text = 'text_a'
            else:
                tgt = str(int(float(i[-1])))
                text = i[4] + i[5]
            str3 = tgt + '\t' + text + '\n'
            writer = csv.writer(f4)
            f4.write(str3)

label	text_a
3	刚到!!!!!!!!刚刚收到,2天我晕,一般快递最快到我们这要3天呢,赞个!!!   包装台简单了,说明书看不懂。 瓶子半透明。   问了官方,说卓越也是他们的合作伙伴,正品放心。
4	很好的一本书不过这本书没有赠送什么代金券。体现不出以前的正版图书送网站学习代金券的特点。
0	二手手机很负责任的说一句,亚马逊给我发过来的手机绝对是二手的!!
3	送的光盘不行这本书内容很好,就是送的光盘不行。这次重新订购了一套,期望发过来的光盘能用
4	很实用很实用的一本书,非常喜欢!
3	关于书籍的包装书籍本身没有问题,货物的包装实在不敢恭维。不知出于何种考虑,先前的纸盒包装现在换成了塑料袋,拍下的两本精装书拿到手居然卷了边,超级郁闷。以此种方式来降低成本,实在不足取。省下的只是仨瓜俩枣,失去的却是人们的信任。

dev.csv(验证)

label	text_a
4	L'OREAL PARIS巴黎欧莱雅多效修复去屑洗发露400mlL'OREAL PARIS巴黎欧莱雅多效修复去屑洗发露400ml,老婆一直用这个牌子,还行吧
0	你如果阻止我评论,我会奉陪到底。我想告诉你的是,在维权的路上我从没败下阵来。 我退货的款为什么还不到我的银行卡上?已经一个多月了。我之前发的商品评论3次,为什么都被你们删去了?卓越你是大公司还是小作坊?前天客服谢亮答应给我把钱转到银行卡上,为什么现在还不到?你耍弄顾客? SKIN79钻石闪耀系列钻石光泽BB霜SPF25/PA++/40g 我选择货到付款免运费,你为什么要用我退货的钱,还要扣我运费?
4	适合小学生的适合小学生的小说,不错
3	好货值,但是使用起来有些麻烦,还要申请一个电信号码
4	很喜欢很喜欢,三层不锈钢奶锅,用料很足,但是有些重....总体很美观
2	比较一般,笼统,随便看看的就行,不要期望它能给多大启发。比较一般,笼统,随便看看的就行,不要期望它能给多大启发。

test.csv(测试)

label	text_a
4	很精致帮朋友买的 很精致的书 朋友很喜欢
3	还行,看了一遍本来想看英文版的,没找到合适的,这本又降了一点价,就看了中文版的。 书里图片很少,每一章节开头一小张,全黑白。 书里讲得不光是 这只叫杜威的猫的事情,很大程度上算是 图书馆馆长(养杜威的主要负责人)的叙述,所以包含了一些她自己的事情。 可以看一下,看一遍不觉得难受(既没有读不下去的难受,也没有感动到难受),但是也没有激起看第二遍的欲望。
1	用后非常干!!!如题,在夏天用过的时候还是会脱皮,坚持用完一半,之后扔了……
2	预装WIN8略鸡肋本身看机子配置不错,性价比高才买,之前用的几个本子都是thinkpad,还是相信其质量。不过预装的win8用不习惯,考虑到毕竟是花钱买的正版系统,且看网上说这款机子改装别的系统比较麻烦,我还是磨合着用win8吧,目前运行以前xp时代的老游戏,没出太大问题,遗憾的是win8太耗资源,在这种配置的机子上跑不起来。机子预装的软件都没什么用,全删了。本身硬盘只有一个分区,不太习惯,我自己又重新分了一下区。另外无线网卡的驱动有问题,老掉线,说是跟win8没兼容好,重新更新驱动后解决问题。散热还不错,运行游戏没觉得很烫。不过这款机子是没有小键盘区的,对于经常玩游戏的来说,没有小键盘还是有些不方便,建议可买同配置的e530。机子上的触控鼠标板不太好使,没用几次就发出咯吱咯吱的声音,因为缝隙太大,似乎有杂物卡进去了,好在我平时几乎不用这个触控板,不好使也无所谓。
3	2~3M/s,就这速度吧。发货速度很快。外观看起来还行,速度就那么回事吧。包装要是取消纸盒是不是更环保?
1	ZTE 中兴买了10多天了。前五天的时候打点话老是自动关机,这几天好像没事了。问了客服要检测我嫌太麻烦。几百的东西,没那必要。
4	无论世间如何喧嚣,它就在那里,安安静静无疑说,这是迄今读过的最没有佐料的历史书。 所有的历史里,都是被人收拾过的,或者加了盐,或者加了味精,或者穿了衣服。 这是一本纯粹的历史书,一本关于物的历史。 特别推荐第1号木乃伊,第12乌尔旗,第25号克罗伊金币,第49号新罗瓦当,第61号刘易斯棋子,第100号太阳能灯具与充电器。 重点推荐第65号泰诺仪式用椅,第80号八里尔银币。 他们一直在那里,无论世间多么喧嚣,他们始终安安静静,一言不发。 这才是真正的历史书。
1	为何我只给2颗星的评价?从小学4年级开始就看言情作品,至今也有十余载了。看文的数量与质量也不断在提高。月沉吟一作,个人感觉,他的文笔不差,不差。在某一方面,譬如说某些场景的描写,在文字间都让人回归到作者的文章主题——是,我看的是一部战乱四起,爱恨缠绕的文,我也知道,女主角身兼数任,但是她坚毅的个性使得她得到了作者文下各个人物的怜爱。可惜的是,看评价的各位亲,你们发现问题没——仅仅的,我只是认知了这部作品的思路,它的走向,而却完全没有融入里面的起起伏伏。作者的场景描写不错,但是她缺乏的是在人物状态的描写。不是说没有描写,而是,描写依旧生硬稚嫩,正如我刚才所说,我只知道女主角的伟大情操,但是,看完了,作为读者的我,是没有本应存在的心痛难熬、怅然若失的感觉的。当场景与人物的描写不能同步时,真真很难让人对一部作品做出华丽得令人光华的赞美。所以我——不认为卿妃这部作品是上乘之品。话说回来,月沉吟也是卿妃刚出道的作品罢了,来日方长,假以时日,卿妃的文字将会更加成熟。2星,与君共勉的成绩罢。
4	我想你了。  我爱你,某人。我想念你了,你知道吗? 是一本用朴实的文字让我们心灵颤动的青春回忆录。

测试集.csv (product_test.csv)

对测试集.csv进行处理

test_nolabel.csv

代码如下：

with open('data/product/product_test.csv','rt',encoding='utf-8') as f1,\
        open('data/product/test_nolabel.csv','wt',encoding='utf-8') as f2:
    reader = csv.reader(f1)
    for num, i in enumerate(reader):
        if num == 0:
            text = 'text_a'
        else:
            text = i[4] + i[5]
        str1 =  text + '\n'
        writer = csv.writer(f2)
        f2.write(str1)

text_a
东西不错大三元之一 东西看上去不错,包装也都很好,关键是价格比京东便宜很多。 还没试过,回去试一下。 不足是不能开增票。比较遗憾
这么丰富的经历没写出来这么丰富的经历没写出来,对于我们以后上哪玩挺有帮助,作为游记一般吧。
很喜欢 支持离歌 支持饶雪漫~~很喜欢 支持离歌 支持饶雪漫~~
内容空洞,不值得买内容很空洞,有炫富意味,其它的倒还真没看出什么所以然来。很后悔买了这本书。完全想废纸一样。
爱自己多一点这个书的内容总的来说不错的,书名有点夸张,但看了内容后,发现真的很实实在在的,一点也不夸大。本人特别喜欢后面部分关于鼓舞的内容。一个女人天生长得美人见人爱,而长得不好看的有很多人都自卑,于是总想方设法运用各种化妆品来装饰自己,以此来让别人喜欢自己。看了这个书的内容,很感动,并不是说她的观点如何的好,而是这样的观点出在减肥书上,不漂亮没关系,对自己自信一点,对周围的人更关心一点,你也可以由内而外变得越来越美丽,每天给自己一个小小的肯定,对自己说OK。

使用bert目标任务预训练

预处理

词典文件的格式是一行一个单词，我们使用谷歌提供的包含21128个中文字符的词典文件models/google_zh_vocab.txt
预处理阶段需要指定模型的目标任务（–target）：

python3 preprocess.py --corpus_path corpora/product_review_train_bert.csv --vocab_path models/google_zh_vocab.txt \
                      --dataset_path dataset_product.pt --processes_num 8 --target bert

预处理非常耗时，使用多个进程可以大大加快预处理速度（–processes_num）。默认的分词器为 --tokenizer bert 。原始文本在预处理之后被转换为pretrain.py的可以接收的输入，dataset_product.pt。

预训练

然后下载Google中文预训练模型google_zh_model.bin，并将其放在 models 文件夹中。接着加载Google中文预训练模型，在书评语料上对其进行增量预训练。预训练模型由词向量层，编码层和目标任务层组成。因此要构建预训练模型，我们应明确指定模型的词向量层（–embedding），编码器层（–encoder 和 --mask）和目标任务层（–target）的类型。

python3 pretrain.py --dataset_path dataset_product.pt --vocab_path models/google_zh_vocab.txt \
                    --pretrained_model_path models/google_zh_model.bin \
                    --output_model_path models/product_review_train_model.bin \
                    --world_size 1 --gpu_ranks 0 \
                    --total_steps 5000 --save_checkpoint_steps 1000 --batch_size 8 \
                    --embedding word_pos_seg --encoder transformer --mask fully_visible --target bert

mv models/product_review_train_model.bin-5000 models/product_review_train_model.bin

–mask 指定注意力网络中使用的遮罩类型。BERT使用双向语言模型，句子中的任意一个词可以看到所有词的信息，因此我们使用 fully_visible 遮罩类型。BERT模型的词向量层是word（token）、position、segment向量的求和，因此我们使用 --embedding word_pos_seg 。默认情况下，配置文件为 models/bert/base_config.json 。配置文件指定了模型的超参数。请注意，pretrain.py输出的模型会带有记录训练步数的后缀（–total_steps），这里我们可以删除后缀以方便使用。
运行结果：

微调

然后，我们在下游分类数据集上微调预训练模型，我们使用 pretrain.py 的输出product_review_train_model.bin：

python3 finetune/run_classifier.py --pretrained_model_path models/product_review_train_model.bin \
                                   --vocab_path models/google_zh_vocab.txt \
                                   --train_path datasets/product_review/train_train.csv \
                                   --dev_path datasets/product_review/train_dev.csv \
                                   --test_path datasets/product_review/train_test.csv \
                                   --output_model_path models/finetune_product_train_model.bin \
                                   --epochs_num 3 --batch_size 8 \
                                   --embedding word_pos_seg --encoder transformer --mask fully_visible

微调后的模型的默认路径是models/finetuned_model.bin,
注意到我们在微调阶段可以使用 --output_model_path 指定微调后的模型的输出路径。

Test set evaluation.
Confusion matrix:
tensor([[ 216,   65,   25,    6,    7],
        [  58,  124,   73,   10,    2],
        [  84,  189,  600,  307,   87],
        [   5,   14,  243,  731,  382],
        [  44,   14,  177, 1419, 5117]])
Report precision, recall, and f1:
Label 0: 0.677, 0.531, 0.595
Label 1: 0.464, 0.305, 0.368
Label 2: 0.474, 0.537, 0.503
Label 3: 0.532, 0.296, 0.380
Label 4: 0.756, 0.915, 0.828
Acc. (Correct/Total): 0.6789 (6788/9999)

预测结果

之后我们利用微调后的分类器模型进行预测：

python3 inference/run_classifier_infer.py --load_model_path models/finetune_product_train_model.bin \
                                          --vocab_path models/google_zh_vocab.txt \
                                          --test_path datasets/product_review/test_nolabel.csv \
                                          --prediction_path datasets/product_review/prediction.csv \
                                          --labels_num 5 \                         
                                          --embedding word_pos_seg --encoder transformer --mask fully_visible

prediction.csv:

label
4
2
4
0
4
4
4

提升

数据增强

我们发现数据中标签为0，1的样本很少，通过NLP中一些简单的数据增强技术：

同义词替换（SR: Synonyms Replace）：不考虑stopwords，在句子中随机抽取n个词，然后从同义词词典中随机抽取同义词，并进行替换。
随机插入(RI: Randomly Insert)：不考虑stopwords，随机抽取一个词，然后在该词的同义词集合中随机选择一个，插入原句子中的随机位置。该过程可以重复n次。
随机交换(RS: Randomly Swap)：句子中，随机选择两个词，位置交换。该过程可以重复n次。
随机删除(RD: Randomly Delete)：句子中的每个词，以概率p随机删除。
重新设置每条原始语句增强的语句数为4。每条语句中将会被改变的单词数占比0.1。将标签为0,1,的样本进行数据增强。增强后的总数据量由70000到91776条。将数据打乱product_train_aug_shuffle02.csv。
1.把数据处理成bert可以处理的数据product_aug_bert02.csv
2.将55000条作为train，18000作为dev,18776作为test，生成product_aug_train02.csv，product_aug_dev02.csv，product_aug_test02.csv

预处理:

python3 preprocess.py --corpus_path corpora/product_aug_bert02.csv --vocab_path models/google_zh_vocab.txt \
                      --dataset_path dataset_product_aug02.pt --processes_num 8 --target bert

预训练:

python3 pretrain.py --dataset_path dataset_product_aug02.pt --vocab_path models/google_zh_vocab.txt \
                    --pretrained_model_path models/google_zh_model.bin \
                    --output_model_path models/product_train_model_aug02.bin \
                    --world_size 1 --gpu_ranks 0 \
                    --total_steps 5000 --save_checkpoint_steps 1000 --batch_size 8 \
                    --embedding word_pos_seg --encoder transformer --mask fully_visible --target bert

mv models/product_train_model_aug02.bin-5000 models/product_train_model_aug02.bin

微调:

python3 finetune/run_classifier.py --pretrained_model_path models/product_train_model_aug02.bin \
                                   --vocab_path models/google_zh_vocab.txt \
                                   --train_path datasets/product_review/product_aug_train02.csv \
                                   --dev_path datasets/product_review/product_aug_dev02.csv \
                                   --test_path datasets/product_review/product_aug_test02.csv \
                                   --output_model_path models/finetune_product_train_model_aug02.bin \
                                   --epochs_num 3 --batch_size 8 \
                                   --embedding word_pos_seg --encoder transformer --mask fully_visible

运行结果：

Test set evaluation.
Confusion matrix:
tensor([[2540,  151,   60,   17,   13],
        [ 136, 2127,  140,   19,   13],
        [ 119,  362,  834,  440,  143],
        [  22,   21,  476, 1321,  988],
        [  73,   12,  175, 1622, 6951]])
Report precision, recall, and f1:
Label 0: 0.913, 0.879, 0.896
Label 1: 0.874, 0.796, 0.833
Label 2: 0.439, 0.495, 0.466
Label 3: 0.467, 0.386, 0.423
Label 4: 0.787, 0.857, 0.821
Acc. (Correct/Total): 0.7336 (13773/18775)

预测结果:

python3 inference/run_classifier_infer.py --load_model_path models/finetune_product_train_model_aug02.bin \
                                          --vocab_path models/google_zh_vocab.txt \
                                          --test_path datasets/product_review/test_nolabel.csv \
                                          --prediction_path datasets/product_review/prediction_aug02.csv \
                                          --labels_num 5 \
                                          --embedding word_pos_seg --encoder transformer --mask fully_visible

prediction_aug02.csv:

label
3
2
4
0
4
4
3
4

提交到比赛结果却并不理想（0.6606）

在eda这篇论文（ Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks）中

Should I use EDA if I’m using a pre-trained model such as BERT or ELMo? 
Models that have been pre-trained on massive datasets probably don’t need EDA.

因此我怀疑使用数据增强却没有得到理想的结果的原因可能是论文中所说的在大量数据集上预先训练好的模型可能不需要EDA。

dropout(0.5)

预训练

python3 pretrain.py --dataset_path dataset_product.pt --vocab_path models/google_zh_vocab.txt \
                    --pretrained_model_path models/google_zh_model.bin \
                    --output_model_path models/product_review_train_model.bin \
                    --world_size 1 --gpu_ranks 0 --dropout 0.5 \
                    --total_steps 5000 --save_checkpoint_steps 1000 --batch_size 8 \
                    --embedding word_pos_seg --encoder transformer --mask fully_visible --target bert

预测结果

python3 inference/run_classifier_infer.py --load_model_path models/finetune_product_train_model_dropout.bin \
                                          --vocab_path models/google_zh_vocab.txt \
                                          --test_path datasets/product_review/test_nolabel.csv \
                                          --prediction_path datasets/product_review/prediction_dropout.csv \
                                          --labels_num 5 \                         
                                          --embedding word_pos_seg --encoder transformer --mask fully_visible

使用transfomer之外的编码器

BERT参数量大，计算较慢。我们希望加速模型的同时让模型仍然在下游任务上有好的表现。这里我们选择2层LSTM编码器来替代12层Transformer编码器。我们首先下载2层LSTM编码器的预训练模型cluecorpussmall_lstm_lm_model.bin。这个预训练模型在CLUECorpusSmall语料上训练了50万步

mv models/cluecorpussmall_lstm_lm_model.bin-500000 models/cluecorpussmall_lstm_lm_model.bin

微调

python3 finetune/run_classifier.py --pretrained_model_path models/cluecorpussmall_lstm_lm_model.bin \
                                   --vocab_path models/google_zh_vocab.txt --config_path models/rnn_config.json \
                                   --train_path datasets/product_review/train_train.csv \
                                   --dev_path datasets/product_review/train_dev.csv \
                                   --test_path datasets/product_review/train_test.csv \
                                   --output_model_path models/finetune_product_lstm_lm_model.bin \
                                   --learning_rate 1e-3 --batch_size 8 --epochs_num 3 \
                                   --embedding word --remove_embedding_layernorm --encoder lstm --pooling mean

Test set evaluation.
Confusion matrix:
tensor([[ 217,   85,   45,   12,   13],
        [  32,   79,   39,    5,    2],
        [  88,  186,  514,  264,   69],
        [  15,   25,  326,  754,  411],
        [  55,   31,  194, 1438, 5100]])
Report precision, recall, and f1:
Label 0: 0.583, 0.533, 0.557
Label 1: 0.503, 0.195, 0.281
Label 2: 0.459, 0.460, 0.459
Label 3: 0.492, 0.305, 0.377
Label 4: 0.748, 0.912, 0.822
Acc. (Correct/Total): 0.6665 (6664/9999)

预测结果：

python3 inference/run_classifier_infer.py --load_model_path models/finetune_product_lstm_lm_model.bin \
                                          --vocab_path models/google_zh_vocab.txt \
                                          --config_path models/rnn_config.json \
                                          --test_path datasets/product_review/test_nolabel.csv \
                                          --prediction_path datasets/product_review/prediction_lstm.csv \
                                          --labels_num 5  \
                                          --embedding word --remove_embedding_layernorm --encoder lstm --pooling mean

提交比赛得分：0.6583

如何使用Langchain加载AZLyrics网页到可用文档格式 dgay_hua langchain python
##技术背景介绍在处理歌词数据时，尤其是从网页上获取歌词文本内容，用于自然语言处理或文本分析是常见的需求。AZLyrics是一个提供歌词的主要平台，为我们提供了大量的歌词数据。如果我们可以将这些网页内容自动加载到结构化的文档格式中，将极大地提升我们处理和分析歌词的效率。##核心原理解析Langchain提供了一种简单的方式来将网页内容转换为可用的文档格式。通过使用其文档加载器（DocumentLo
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用Titan Takeoff进行高效的自然语言处理模型推理 scaFHIO 自然语言处理人工智能 python
在自然语言处理(NLP)领域，每一家企业都在寻求更高效的模型训练和推理解决方案。TitanML的平台通过训练、压缩和推理优化帮助企业构建和部署更佳、更小、更便宜、更快速的NLP模型。特别是其推理服务器TitanTakeoff，使得在本地硬件上轻松部署大语言模型(LLMs)成为可能。技术背景介绍TitanTakeoff是TitanML提供的一项服务，它允许用户在本地硬件上运行推理工作负载。支持大多数
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
When Large Language Models Meet Speech: A Survey on Integration Approaches UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
主要内容研究背景：大语言模型（LLMs）在自然语言处理领域取得显著进展，其与语音的融合具有广泛应用前景，但缺乏相关集成方法的综述。文章将语音与LLMs集成方法分为基于文本、基于潜在表示和基于音频令牌三大类。集成方法基于文本的集成：通过级联集成、LLM重打分和LLM生成式错误纠正等方式，利用文本作为LLMs的输入和输出，处理语音相关任务，但存在信息损失和准确性与多样性平衡的问题。基于潜在表示的集成：
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
【零基础入门】一篇弄懂nn.Sequential以及ModuleList的使用（呕心沥血版）十二月的猫 PyTorch深度学习 pytorch 零基础入门
个人主页：十二月的猫-CSDN博客系列专栏：《PyTorch科研加速指南：即插即用式模块开发》CSDN博客十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Sequential类的使用2.1序列容器简单注入2.2序列容器字典注入2.3序列容器函数注入2.4序列容器修改2.5序列容器删除3.nn.ModuleList()的使用3.1定义模型3.2使用模型4.总结1.前言《
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
端到端的NLP框架（Haystack） deepdata_cn NLP 自然语言处理人工智能
Haystack是一个端到端的NLP框架，专门用于构建基于文档的问答系统，是实现RAG的理想选择。它提供了数据预处理、文档存储、检索和生成等一系列组件，支持多种语言模型和检索器。提供可视化界面，方便用户进行配置和调试；支持多模态数据，可处理文本、图像等多种类型的数据；具有可扩展性，可根据需求添加自定义组件。2020年在自然语言处理技术快速发展，对高效、易用且灵活的端到端NLP框架需求日益增长的背景
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio