adnb34g

hanlp分词工具应用案例：商品图自动推荐功能的应用

本篇分享一个hanlp分词工具应用的案例，简单来说就是做一图库，让商家轻松方便的配置商品的图片，最好是可以一键完成配置的。

先看一下效果图吧：

商品单个推荐效果：匹配度高的放在最前面

这个想法很好，那怎么实现了。分析了一下解决方案步骤：

1、图库建设：至少要有图片吧，图片肯定要有关联的商品名称、商品类别、商品规格、关键字等信息。

2、商品分词算法：由于商品名称是商家自己设置的，不是规范的，所以不可能完全匹配，要有好的分词库来找出关键字。还有一点，分词库要能够自定义词库，最好能动态添加。如果读者不知道什么是分词，请自行百度，本文不普及这个。

3、推荐匹配度算法：肯定要最匹配的放在前面，而且要有匹配度分数。商家肯定有图库没有的商品，自动匹配的时候，不能随便配置不相关的图片。

先说明一下，本文企业没有搜索引擎之类的工具，所以本质就靠的是数据库检索。

首页让我们先分析一下图库，下面是图库的设置界面。

让我们先贴一下图库的表结构

CREATE TABLE `wj_tbl_gallery` (

`gallery_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',

`fileid` int(11) NOT NULL COMMENT '文件服务器上的文件ID',

`ptype` tinyint(4) NOT NULL DEFAULT '0' COMMENT '图片类型，0 点歌屏点餐图片',

`materialsort` varchar(50) DEFAULT NULL COMMENT '商品分类',

`materialbrand` varchar(50) DEFAULT NULL COMMENT '商品品牌',

`materialname` varchar(100) NOT NULL COMMENT '商品名称',

`material_spec` varchar(50) DEFAULT NULL COMMENT '商品规格',

`material_allname` varchar(200) DEFAULT NULL COMMENT '商品完整名称',

`status` tinyint(4) NOT NULL DEFAULT '0' COMMENT '状态，0正常，1停用，2删除',

`updatedatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',

`keyword` varchar(200) DEFAULT NULL COMMENT '商品关键字，用逗号隔开',

`bstorage` tinyint(4) NOT NULL DEFAULT '0' COMMENT '关键字是否入库 0没有，1有',

PRIMARY KEY (`gallery_id`),

KEY `idx_fileid` (`fileid`)

) ENGINE=InnoDB AUTO_INCREMENT=435 DEFAULT CHARSET=utf8 COMMENT='图库信息表';

数据示例：

简单说一下material_allname是干什么用的呢，主要就是拼接商品名称、规则、关键字字段。用来写sql的时候比较方便。关键字字段是干什么用的呢，作用有两个。1是商品可能有多个名字，补充名称的。二是给分词库动态添加词库。图库简单说到这。

再说一下分词库，笔者选择的是开源的汉语言分词库-hanlp分词工具

优点是词库大，有词性分析，可以自定义词库。缺点当然也有，就是不支持数据库方法动态读取词库。后面说一下我自己的解决办法。

上代码：

分词代码,这时差会去掉一些没用字符。

图5

我们分词，就是调用SegmentUtils.segmentTerm(materialname);

动态添加词库方法：

private void addCustomerDictory(){

Integer max = galleryRepository.getMaxGallery();

if(CommonUtils.isNotEmpty(max) && max > 0 && max > SegmentUtils.CACHE_GALLERY_ID){

int oldid = SegmentUtils.CACHE_GALLERY_ID;

SegmentUtils.CACHE_GALLERY_ID = max;

List gallery = galleryRepository.getGallery(oldid,max);

if(CommonUtils.isNotEmpty(gallery)){

Map dicMap = new HashMap<>();

for(String w : gallery){

if(CommonUtils.isNotEmpty(w)){

String[] array = w.split(",");

if(CommonUtils.isNotEmpty(array)){

for(String item : array){

String value = item.trim();

if(CommonUtils.isNotEmpty(value)){

dicMap.put(value, true);

}

Set keys = dicMap.keySet();

if(CommonUtils.isNotEmpty(keys)){

SegmentUtils.insertCustomDictory(keys);

}

/**

* 获取关键字

* @author deng

* @date 2019年3月13日

* @param galleryId

* @return

@Query("select keyword from Gallery a where galleryId > ?1 and galleryId<=?2 and a.keyword !='' and bstorage=0")

public List getGallery(int bgalleryId, int egalleryId);

@Cacheable(value = CacheConstants.CACHE_GALLERY, keyGenerator = CacheConstants.KEY_GENERATOR_METHOD)

@Query(value = "select gallery_id from wj_tbl_gallery a where a.keyword !='' and bstorage=0 order by gallery_id desc limit 1", nativeQuery = true)

public Integer getMaxGallery();

说一下解决思路，由于hanlp文档上没有看到从mysql上动态添加词库方法，只有CustomDictionary.insert能动态添加单个实例词库，系统如果重启，就要重新添加。我就想出一个办法，就是分词的时候，查一下类的保存的最大图库表的主键是什么，如果跟数据库一样，就不动态添加。如果小于图库的主键，就把没有的那一段用CustomDictionary.insert添加进去。系统一般不重启，如果重启就在分词的时候重新添加一下。查询数据库当然都有缓存，编辑图库的时候，把对应缓存清除一下。这种方式也能支持分布式环境，多个实例都是一样处理的。每过一段时间，就把图库表的关键字词库搞成文件的词库，避免动态添加太多，占用太多内存。自定义词库其实是很重要的，任何分词库都不可能包含所有的词库，而分词算法是根据词库来展开的，可以说词库决定了分词结果的准确性。

让我们看一下分词的效果

商品名称为”雪碧（大）“的分词结果雪碧/nz, 大/a ,其中nz表示专有词汇，a表示形容词。

再看一下不理想的分词结果：

商品品名称:”蕾芙曼金棕色啤酒“,类别名称:啤酒,

分词结果:蕾/ng,芙/n,曼/ag,金/ng,棕色/n,啤酒/nz

很明显，分词结果不理想，蕾芙曼金棕色其实是一个商品名，不能分开。怎么办呢，这时候动态添加词汇功能就派上用场了。

再图库关键字时差添加蕾芙曼金棕色啤酒，保存一下，再看一下分词效果：

物品名称:蕾芙曼金棕色啤酒,类别名称:啤酒,分词结果:蕾芙曼金棕色/nz,啤酒/nz

蕾芙曼金棕色被分到了一起，达到预期效果，这其实就是 CustomDictionary.insert(data, "nz 1024");再起作用。hanlp具体API功能，请参考官方文档，本文就不介绍了。

最后重头戏来了，商品图片匹配度分析。作者就是采用了mysql的sql词句的方法搞定了，其实就用到了LOCATE函数，很简单。SQL示例如下

SELECT gallery_id, fileid, materialname, material_allname, score

, ROUND(score / 4 * 100, 0) AS rate

FROM (

SELECT a.gallery_id, a.fileid, materialname, material_allname

, IF(LOCATE('雪碧', a.material_allname), 2, 0) + IF(LOCATE('大', a.material_allname), 1, 0) + IF(LOCATE('饮料', a.material_allname), 1, 0) AS score

FROM wj_tbl_gallery a

WHERE a.STATUS = 0

AND (a.material_allname LIKE '%雪碧%'

OR a.material_allname LIKE '%大%'

OR a.material_allname LIKE '%饮料%')

) b

ORDER BY score DESC, materialname

LIMIT 0, 8

执行结果：

可以看出gallery_id是第一条，它的rate的是75，满分是100，匹配度蛮高的。

说一下匹配度算法原则，如果完全匹配就是1百分，肯定就上了。然后去除某些关键字后，也匹配上了就是90分。最后采用分词算法，按照1百分打分，其中如果高于50分，可以算基本匹配，自动配置图片的时候，就可以当成匹配成功。总体原则就是匹配词汇越多，分数越多。但是两个字的词汇，和5个字的词汇，分数是不一样的。还有词性，专属词汇理论上应该比形容词分数高。详见下面的calculateWeight代码，自己体会了。

public List> queryList(String searchstr, int pagenumber, int pagesize, String materialsortname,

List segmentList) {

String name = "%" + searchstr + "%";

// 先简单搜索，完全匹配100分

List> list = queryList(name, pagenumber, pagesize, 100);

if (CommonUtils.isEmpty(list)) {

searchstr = searchstr.replaceAll("\\s", "");

String regEx = "(特价)|(/)|(\$)|(\$)|(（)|(）)|(\\d+ml)|(买.送.)|(/)|(\\*)";

searchstr = searchstr.replaceAll(regEx, "");

if (CommonUtils.isNotEmpty(searchstr)) {

name = "%" + searchstr + "%";

// 简单过滤 90分

list = queryList(name, pagenumber, pagesize, 90);

}

// 剩下分词靠计算

if (CommonUtils.isEmpty(list)) {

if (CommonUtils.isNotEmpty(segmentList)) {

list = queryListTerm(pagenumber, pagesize, segmentList, materialsortname);

}

// 如果只有分类，先定10分

else if (CommonUtils.isNotEmpty(materialsortname))

list = queryList(materialsortname, pagenumber, pagesize, 10);

}

return list;

}

private List> queryList(String name, int pagenumber, int pagesize, int rate) {

String sql = "SELECT\n" + " a.gallery_id,\n" + " a.fileid,a.material_allname,a.materialname \n, " + rate

+ " rate FROM\n" + " wj_tbl_gallery a\n" + "WHERE\n"

+ " a.material_allname LIKE :searchstr and a.status = 0 order by length(materialname) LIMIT :pagenumber,:pagesize ";

Dto param = new BaseDto();

param.put("searchstr", name).put("pagenumber", pagenumber * pagesize).put("pagesize", pagesize);

return namedParameterJdbcTemplate.queryForList(sql, param);

private List> queryListTerm(int pagenumber, int pagesize, List segmentList,

String materialsortname) {

Dto param = new BaseDto();

StringBuffer sb = new StringBuffer();

StringBuffer wsb = new StringBuffer(" (");

// 总权重

int tw = 0;

if (CommonUtils.isNotEmpty(segmentList)) {

for (int i = 0; i < segmentList.size(); i++) {

String str = segmentList.get(i).word;

int w = SegmentUtils.calculateWeight(segmentList.get(i));

str = StringUtils.escapeMysqlSpecialChar(str);

tw += w;

sb.append("if(LOCATE('").append(str).append("', a.material_allname),").append(w).append(",0) ");

wsb.append(" a.material_allname like '%").append(str).append("%' ");

if (i < segmentList.size() - 1) {

sb.append(" + ");

wsb.append(" or ");

}

// 类别单独处理，目前权重较低

// 表示字符串是否为空

int emptylen = 3;

if (CommonUtils.isNotEmpty(materialsortname)) {

if (sb.length() > emptylen) {

sb.append(" + ");

wsb.append(" or ");

}

tw += SegmentUtils.DWEIGHT;

materialsortname = StringUtils.escapeMysqlSpecialChar(materialsortname);

sb.append(" if(LOCATE('").append(materialsortname).append("', a.material_allname),")

.append(SegmentUtils.DWEIGHT).append(",0) ");

wsb.append(" a.material_allname like '%").append(materialsortname)

.append("%' ");

}

if (sb.length() > emptylen) {

sb.append(" as score ");

wsb.append(") ");

String scoreSelect = sb.toString();

String scorewhere = wsb.toString();

String sql = "select gallery_id,fileid,materialname,material_allname,score,ROUND(score/" + tw

+ "*100, 0) rate from (SELECT " + " a.gallery_id, "

+ " a.fileid,materialname,material_allname, " + scoreSelect + " FROM "

+ " wj_tbl_gallery a " + "WHERE " + " a.status = 0 and " + scorewhere

+ " ) b order by score desc ,materialname LIMIT " + pagenumber * pagesize + "," + pagesize;

param.put("pagenumber", pagenumber * pagesize).put("pagesize", pagesize);

logger.debug("商家搜索图库的SQL语句是{}", sql);

List> list = namedParameterJdbcTemplate.queryForList(sql, param);

if (CommonUtils.isNotEmpty(list)) {

return list;

}

/**

* 计算分词权重

* @author deng

* @date 2019年6月21日

* @param term

* @return

public static int calculateWeight(Term term) {

// 汉字数

int num = countChinese(term.word);

// 大于3个汉字，权重增加

int value = num >= 3 ? 2 + (num - 3) / 2 : DWEIGHT;

// 专属词，如果有两个字至少要最小分是2分

if (term.nature == Nature.nz && value <= DWEIGHT) {

value = DWEIGHT + 1;

}

return value;

}

总结一下，本文介绍的商品图片推荐和自动匹配方法，可以看出来是相当简单的，本质就是mysql的like%% 优化来的，依赖sql语句和hanlp分词库，做法简单，但是能满足专门商品的匹配，适合小图库。自然比不上大公司搞的搜索引擎来的效率高，仅供参考。

查看图片附件

常见商业问题及其金刚解药琪言瑾语
周二（11月9日）早5：00，第26期能断金刚读书会，我们开始共读《能断金刚》第13期：第七章《因果关联》——常见“商业问题”及其“金刚解药”。（第6-9问题：书100-102页）。本次共读的核心内容如下：1.商业问题6：公司的员工和管理阶层人员似乎总是在闹意见。商业问题7：你老是对你的生意伙伴心生不满；不论你如何改变他们，你们之间总是一再地发生争执。金刚解药6/7：你必须小心谨慎，绝对不要发表任
GIF动画制作工具 GiftedMotion：开源与定制悦闻闻
本文还有配套的精品资源，点击获取简介：GiftedMotion是一款开源的GIF动画制作工具，它允许用户导入多张图片或视频片段来创建动画，并支持多种编辑选项，如帧速率调整、色彩调整和过渡效果添加。源代码的开放性使得开发者能够深入研究和定制软件，增加了可扩展性和社区支持。该工具在社交媒体、教育和娱乐等多个领域的应用展示了其广泛的实用价值，并为学习编程和图像处理提供了实践平台。1.GIF动画制作工具介
光缆弹性模量计算_光纤光缆布线基础知识及系统设计 weixin_39542111 光缆弹性模量计算
光纤作为高带宽、高安全的数据传输介质被广泛应用于各种大中型网络之中。由于线缆和设备造价昂贵，光纤大多只被用于网络主干，即应用于垂直主干子系统和建筑群子系统的系统布线，实现楼宇之间以及楼层之间的连接，目前也应用于对传输速率和安全性有较高要求的水平布线子系统。一、光纤1、光及其特性：1)光是一种电磁波可见光部分波长范围是：390~760nm(毫微米)。大于760nm部分是红外光，小于390nm部分是紫
Matlab实现的二维框架非线性动力学求解器：几何非线性应用悦闻闻
本文还有配套的精品资源，点击获取简介：二维框架非线性动力学求解器Matlab工具用于分析复杂结构在动态载荷作用下的行为，特别是在几何非线性效应显著的情况下。求解器采用Newmark方法进行数值积分，并通过多个Matlab脚本文件，如Newmark_Nonlinear.m和Analysis.m等，实现从加载条件到结果可视化的一系列计算流程。用户可以通过各种分析功能和示例深入了解结构在动态载荷下的响应
力量 hard_d724
力量来自内心，强大的人有颗大于别人的心脏，这是有科学根据的。美国调研小组做过实验，经历过重大事件的人的心脏实际大于正常人的一倍不止。家家有本难念的经，你若克服便是在修行路上。有个朋友叫小A，她的原生家庭非常的糟糕，她每天早出晚归地工作着。她的母亲是个刀子嘴，同时带有精神暴力。她母亲很在乎她，甚至希望她每天晚上早点睡觉，但是母亲不会说话，不会交流，总是凶神恶煞地一通训斥。小A隔三差五受到母亲的语言攻
2022-06-07 星期二晴计划，寄快递 lemon家的小苹果
很喜欢看别人的计划，别人的目标，每每看一次，就会在心里多一分冲劲。但是不知道自己是否也能像他们一样成为自己想要的样子。或许能，或许不能。不过确实，现在是不能，很多东西我的确做的不够多。别人计划安排的很好，做的估计也很好吧！所以在最后的成绩单上，他们GPA一如既往的高，人也一如既往的优秀。我也必须给自己一个明确的计划，每天都要做些什么事，事先安排好。虽然不读书了，但是人生还是要过得精彩的。女生力气大
盒子心i_af0a
使用width来设置盒子内容区的宽度使用height来设置盒子内容区的高度width和height只是设置的盒子内容区的大小，而不是盒子的整个大小，盒子可见框的大小由内容区，内边距和边框共同决定为元素设置边框:要为一个元素设置边框必须指定三个样式border-width:边框的宽度border-color:边框颜色border-style:边框的样式使用border-width可以分别指定四个边框
ros订阅相机深度信息_基于深度相机 RealSense D435i 的 ORB SLAM 2
相比于上一篇文章，这里我们将官方给的rosbag数据包替换为来自深度相机的实时数据。之所以选择IntelRealSense这款深度相机，仅仅是因为它是最容易买到的。。。在京东上搜“深度相机”，符合要求的几乎都是这个系列的。具体到D435i这个型号，它可以提供深度和RGB图像，而且带有IMU，未来如果我们继续做视觉+惯导的SLAM也够用了。深度相机RealSenseD435i简介Intel官方给出了
读名老中医之路笔记（一）岳美中：无恒难以做医生 weixin_33937499
岳美中：无恒难以做医生岳美中先生虽然处于流离颠沛的年代中，通过不断的刻苦学习，终成一代名医。岳老从《衷中参西录》、《歌头汤诀》、《药性赋》一路走到《伤寒论》《金匮要略》，后又学习唐代祛疾利器《千金》、《外台》等书，他的读书经验：一、对中华古典文化的学习，培养读书的能力和习惯二、读书宁涩勿滑，对经典著作每个字句要读懂掌握，强调对经典著作熟读甚至必须背诵三、自学必当知道自己的短处，每个人都有他的优点，
从零开始：Android自定义相机应用开发全解析悦闻闻
本文还有配套的精品资源，点击获取简介：本文深入探讨了在Android平台上开发自定义相机应用的核心技术要点，包括权限申请、创建预览界面、掌握CameraAPI、初始化相机、设置预览回调、拍照和视频录制、处理相机事件、界面交互设计、兼容性测试及性能优化。通过逐步实践这些知识点，开发者可以定制出符合特定需求的相机应用，并确保其在多种Android设备上的表现。1.Android自定义照相机权限与界面创
人脸数目统计系统实现：基于OpenCV和C++的人脸识别
本文还有配套的精品资源，点击获取简介：本项目介绍如何利用OpenCV库和C++语言开发一个人脸识别系统，用于统计图像中的人脸数量。内容涵盖人脸识别的基本原理、关键步骤及技术细节，包括使用Haar级联分类器进行人脸检测，并通过C++编程实现从图像处理到人脸统计的全过程。1.人脸识别基本原理与步骤人脸识别技术已经在安全验证、智能家居、社交媒体等多个领域得到了广泛应用。其基本原理是通过分析人脸图像中的特
Java Swing组件鼠标拖拽功能实现悦闻闻
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何在JavaSwing中实现鼠标拖拽功能，这是一个构建桌面应用程序的常见需求。文章深入探讨了涉及的事件处理、组件交互和GUI设计方面，包括MouseListener和MouseMotionListener接口的具体应用。实现拖拽功能的关键步骤和方法被详尽地讲解，包括鼠标事件的记录、拖拽距离的计算和组件状态的更新。同时，还涉及了数据传输、事件传播
国内能赚钱的10大网络平台声优配音圈
以下是国内能赚钱的10大平台：兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。淘宝：淘宝是国内最大的电商平台之一，拥有庞大的用户群体和丰富的商品资源，可以通过开店、代销、推广等方式赚取佣金。微信公众号：微信公众号是国内最大的社交媒
偏爱嚯呀怪
你是我的偏爱，我的玫瑰，只愿赠予你。我或许爱玩，但你一定是拽着风筝线的人。无论身处何地，我只愿忠诚于你。我见过繁多的爱意，或深情或痴缠。不是没有羡慕过他人，但我始终无法说服自己去将就。直到遇到他，我才明白什么是心动。我从未想过一见钟情会落到我身上。初次见面是在泰山。登入山门，我步伐轻盈地往前走，猝不及防被人拍了拍肩膀。一位大妈笑容灿烂的向我介绍她的儿子，询问你一会是否能跟她儿子结个伴爬山，她儿子还
Docker-Compose配置文件docker-compose.yml详解高压锅_1220 docker docker docker-compose 容器配置文件容器
一份标准的docker-compose.yml文件应该包含version、services、networks三大部分，其中最关键的就是services和networks两个部分。Compose和Docker兼容性：Compose文件格式有3个版本,分别为1,2.x和3.x目前主流的为3.x其支持docker1.13.0及其以上的版本#目前主流的为3.x其支持docker1.13.0及其以上的版本,
Github库镜像到本地私有Gitlab服务器 Thinbug 版本控制 github gitlab
上一节我们看了如何架设自己的Gitlab服务器，今天我们看怎么把Github库转移到自己的Gitlab上。首先登录github，进入自己的库复制地址。克隆镜像库在本地新建一个文件夹在文件夹执行CMD指令[email protected]:thinbug/A.git–mirror参数就是拉取镜像库。拉取结束，进入目录：cdA.git我们可以看到这个库是这样的。添加远程库通过
模型上下文协议(MCP)详解 Edward.W 计算机基础工具 python python 网络协议 js go
MCP(ModelContextProtocol)是一种专门为AI模型交互设计的标准化协议，它定义了模型与客户端之间上下文管理的通用规范。以下是MCP的全面介绍：一、MCP协议概述MCP(ModelContextProtocol)是一种轻量级、语言无关的通信协议，旨在解决AI模型交互中的上下文管理问题。它提供了一套标准化的方法来创建、维护和销毁交互上下文，特别适合需要状态保持的AI应用场景。核心设
加班卡卡002
今天，起风了。有的树熬过了冬天的天寒地冻，没能挺过春寒料峭，开始乔装打扮自己，鸡蛋花露出了光秃秃的枝干，紫薇树也染红了叶子，小叶榄仁树上金黄的叶子纷纷飘落而下，有种秋天萧条的感觉，真是别有一番风味。可是，今天是惊蛰啊！路上，黄木风铃开得正艳，成了九龙大道最美的风景。一片片黄色的花瓣，没有一片叶子，大自然真神奇。今天主要是到学校计算参加职称评审的分数。一天下来，主要有以下几点感受：首先，不管参加什么
中韩医美市场观察及政策法律分析（下） This_is_刘小白
通过本文您将了解以下内容～一、什么是医美二、全球医美发展现状及发展格局三、为什么选择韩国作为研究对比的国家四、中韩医美市场观察五、中韩医美政策立法对比分析以下是正文～上篇已经跟大家介绍了什么是医美，全球医美发展现状及发展格局是什么样的状况以及对于中韩医美市场的观察。下篇将跟大家介绍韩国医美产业快速发展、成熟的动因，中韩两国在医美立法监管层面的异同以及两国在医美广告法律制度上的差异。一、韩国医美产业
Realsense D435i 使用说明
D435i驱动安装及ROS使用Ubuntu16.04适配https://blog.csdn.net/lemonxiaoxiao/article/details/107834936过程中遇到fatalerror;需要添加标签。使用下面网址的博客解决了。https://blog.csdn.net/xuzhengzhe/article/details/135407342最终如下：target_compi
运动会绽放的微笑yf
秋高气爽，凉风习习。在这美好的季节里，我校秋季运动会的“战幕”拉开了。别看它小，它却是我们盼望以久的一次盛会。因为那热闹，激烈的比赛情景，给我们带来了无限的欢乐，留下了深刻的印象。18日下午，我们早早的来到学校，同学们个个都穿着不同的衣服来到操场上举行运动会，参加本次活动的有学校领导、国旗手、校旗手、乐队成员、彩旗队成员、运动员和教师队。我们乐队的人都干着不同的事，一首好听的乐曲就展现出来了。开幕
CodeFoeces-377A ss5smi
题目原题链接：A.Maze题意给出一个n*m的表，#表示墙，.表示路。现要填充k个X。要求填充后的路也是一个整体。参考了其他作者的思路。利用dfs。如果需要填充k个，有t个路，那么只要不填充t-k个就可以。代码#includeusingnamespacestd;chars[505][505];intvis[505][505]={0};intmov[4][2]={0,1,0,-1,1,0,-1,0}
2022-05-10 以琳_c61b
用文字记录生活（5月10日）少年嘲笑孔乙己，中年活成孔乙己。不知道何时鬓角已染霜？那个爱做梦的少年已活成了当年妈妈的模样。喜欢一个人静静地听庄稼地里的虫鸣，喜欢一个人在地里拔草，喜欢一个人在田间劳作。这是成熟的标志还是喜欢独处的“病态”？我无从得知，我只知道，每当我在田间一个人静静地劳作时，我的心情是愉悦的，我的精神是抖擞的，我观看世间万物都是美好的。开始种地已三年整了，曾经年少到地里就想回家，母
算法训练营Day12 二叉树part01
一、二叉树的递归遍历每次写递归，都按照这三要素来写，可以保证大家写出正确的递归算法！确定递归函数的参数和返回值：确定哪些参数是递归的过程中需要处理的，那么就在递归函数里加上这个参数，并且还要明确每次递归的返回值是什么进而确定递归函数的返回类型。确定终止条件：写完了递归算法,运行的时候，经常会遇到栈溢出的错误，就是没写终止条件或者终止条件写的不对，操作系统也是用一个栈的结构来保存每一层递归的信息，如
日更77：妈妈要远行小玄鸟
十岁玄鸟/文俗话说：“儿行千里母担忧。”而我却要说：“母行千里儿担忧。”妈妈今天要出差，要独自一个人坐动车去厦门。于是，我一放学就帮妈妈收拾行李。妈妈把衣服折叠好，我帮妈妈一件一件放入行李箱，并且摆得整整齐齐。妈妈的行李中一半是衣服，还有一半是书。以前妈妈出门，都会带上我，可是这次的行程中，没有我，也没有姨姨。所以，我有点不放心妈妈，我开始叮嘱妈妈一些注意事项。如坐火车的时候，不能带易燃易爆物品；
半夜姐姐屋进小偷，男子抓捕时捅死小偷，是正当防卫吗？如何处罚一丝不苟的法律人
“半夜姐姐屋里进了小偷，姐姐妹妹都在家，我抓小偷，是正当防卫？抓的过程中虽然小偷死了，但是也不能判我11年？”凌晨4时小偷蒙面进入男子姐姐房中，被发现后，小偷躲到床底，男子找到小偷后，欲抓住小偷，遭到反抗，男子持刀捅了小偷腹部致死。这天凌晨4时许，被害人李涛蒙面潜入王强家中盗窃财物。王强和父亲、姐姐、妹妹正在家中睡觉。李涛进入住在二楼的姐姐王红的房间翻找东西时惊醒了姐姐王红，被王红喝问后跑出去，王
高质量发展正当时党员干部责无旁贷 wyzzb123
习近平总书记在广东考察时强调，要坚决贯彻党中央战略部署，坚持新发展理念，坚持高质量发展，进一步解放思想、大胆创新、真抓实干、奋发进取。推动广东高质量发展，党员干部队伍建设至关重要，组织建设是党的建设的重要基础，每一名党员干部与高质量发展息息相关，密不可分。“不积跬步，无以至千里”，我国实现高质量发展的道路上，一砖一瓦都来之不易，每一名党员干部都是高质量发展主动力。走高质量发展道路，应坚定理想信念。
基于MATLAB的空时编码技术(源码+万字报告+部署讲解等) 炳烛之明科技 matlab 人工智能网络通信仿真
目录基于MATLAB的空时编码技术论文IIAbstractIII第1章绪论11.1选题的背景与选题意义11.1.1选题的背景11.1.2选题的意义21.2论文现状21.3主要内容5第2章空时编码技术72.1空时分组码72.2空时网格码102.3分层空时码112.4三种码及空时分组码优点12第三章STBC空时分组码123.1基本原理123.2编码方法153.2.1两发多收天线系统的空时分组编码方法1
那时西东小黄日记
出考场的那刻，将暮未暮正如彼时的我们，将散未散图片发自App在下一次霞光布满的时候我们已各奔东西图片发自App那一刻，我们看着这方天地祈祷着，再见时，无问西东
Django母婴商城项目实践（十一）- 用户信息模块之用户登录注册 ITB业生 Django 数据库 django sqlite javascript 后端
11用户信息模块1、背景项目babys的用户信息模块分为：用户账户登录页面和个人中心页面，用户登录和注册在用一个页面实现，如果用户不存在，则执行注册操作，反之则执行登录操作；个人中心页面显示用户的基本信息和订单信息，而且订单信息需要设置分页展示。2、内置User实现登录注册由于Django内置了用户管理功能，即Auth认证系统，而且具有灵活的扩展性，因此可以满足多方面的开发需求。创建项目时，Dja
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

hanlp分词工具应用案例：商品图自动推荐功能的应用

你可能感兴趣的:(hanlp分词工具应用案例：商品图自动推荐功能的应用)