- Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10)
刘悦的技术分享
人工智能深度学习pythonmecab自然语言处理
日语因为存在假名,会导致翻译软件进行翻译时机翻味道过重的问题,比如積ん読(つんどく)这个词,大多数软件会翻译成:堆积的读,但其实是明明买了书却不读,光放着的意思。有时候也需要单独查句子中的单词释义来理解句子的意思,但一看下去全是假名,无法像中文或者英文那样进行简单的分词操作。本次我们基于Python3.10的三方库Mecab来对日语进行分词和词性分析。安装和配置Mecab首先下载最新的Mecab0
- Ubuntu离线安装 MySQL 5.7
球球罐罐
#关系型数据库ubuntumysql
一、所需环境操作系统:Ubuntu20.04数据库:MySQL5.7.34网络情况:内网服务器,无法访问互联网资源二、提前下载所需以来及安装包1、所需依赖包(1)libmecab2http://archive.ubuntu.com/ubuntu/pool/universe/m/mecab/libmecab2_0.996-1.2ubuntu1_amd64.deb(2)libaio1http://ar
- mysql全文索引_Mysql全文索引
无声远望
mysql全文索引
简介1).MySQL中的全文索引是FultLeXT类型的索引。2).全文索引只能用于InnoDB或MyISAM表,只能为CHAR、VARCHAR、TEXT列创建。3).在MySQL5.7.6中,MySQL提供了支持中文、日文和韩文(CJK)的内置全文ngram解析器,以及用于日文的可安装MeCab全文解析器插件4).当创建表时,可以在CREATETABLE语句中给出FULLTEXT索引定义,或者稍
- Ubuntu 20.04 安装 mysql 8
mixboot
ubuntuubuntumysql
apt-getupdateapt-cachesearchmysql|grep'^mysql'apt-cachesearchmysql-server-8aptinstall-ymysql-serverupdate-alternatives:using/var/lib/mecab/dic/ipadic-utf8toprovide/var/lib/mecab/dic/debian(mecab-dicti
- Mecab使用方法总结
冰霜icefrost
日语mecab
Mecab1,Mecab是什么Mecab是用于进行日语形态素解析的开源工具,官网是http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html不过,国内好像是不能访问了。2,使用方法3,设置字典的encode。1)查看当前的encode.$mecab-P|grepconfig-charset2)个性字典encode的方法参考:http://q
- 基于python+window10下的mecab安装配置
hannah2sah
#python
说明由于工作中需要进行一些日语的词频分析,但是数据量在50万条数据;最开始使用了一款日语词频统计软件,尝试用5万条数据进行处理,发现处理时间在3个小时左右,由于数据量比较大,按照5万条数据处理的话需要花费2-3天时间,故采用了python进行日语的词频分析,希望处理数据量以及速度能够快一些吧如果你需要处理的数据量在万行以下的话,可以采用下面链接里面的软件链接:https://pan.baidu.c
- windows10+py36+MeCab安装总结
星青星晴
简要介绍下我的环境;windows10+python36+anconda,由于最近要用到日文分词,所以在网上找了一些日文分词工具,比较流行的就是MeCab了,但是网上的安装教程一言难尽……,综合各种教程于一身终于给摸索出来了哈哈1.下载MeCab.exe安装程序(1)下载地址:官方地址http://taku910.github.io/mecab/(双击mecab-0.996.exe,选择字符集,u
- Ubuntu16.04 deb安装 mysql 5.7.25(无网络情况)
UMF_士弘
前期准备:依赖包查询地址:https://pkgs.org/(在搜索框中搜索所需要的deb包)依赖包libmecab2:64位:http://archive.ubuntu.com/ubuntu/pool/universe/m/mecab/libmecab2_0.996-1.2ubuntu1_amd64.deb32位:http://archive.ubuntu.com/ubuntu/pool/uni
- 日语分词开源项目MeCab在mac平台的试用
czs_0_0_0_0
简介MeCab是用C++开发,针对日语的开源分词引擎。MeCab一词是日语めかぶ的谐音,是作者最爱吃的东西。目前最新版本为0.996安装以下为MeCab与词典的下载地址:https://taku910.github.io/mecab/#downloadmac上MeCab的安装方法如下:cdmecab-X.X./configuremakemakechecksudomakeinstall安装完后需要安
- 日语分词工具mecab安装配置以及使用
A_You
MeCab介绍mecab是基于CRF的一个日文分词系统,代码使用c++实现,基本上内嵌了CRF++的代码,同时提供了多种脚本语言调用的接口(python,perl,ruby等).整个系统的架构采用通用泛化的设计,用户可以通过配置文件定制CRF训练中需要使用的特征模板。甚至,如果你有中文的分词语料作为训练语料,可以在该架构下按照其配置文件的规范定制一个中文的分词系统。日文NLP界有几个有名的开源分词
- 用Keras构造日文的神经网络语言模型
GjZr
keras深度学习神经网络语言模型NLP
摘要本文介绍了语言模型,并介绍如何用MeCab和Keras实现一个日文的神经网络语言模型。(为什么是日文呢?纯属作者兴趣)基于神经网络的语言模型依据Wikepedia,语言模型的定义是“句子们的概率分布”。给定一个长度为m的句子,则可以有概率P(w1,...,wm)P(w_1,...,w_m)P(w1,...,wm)由条件概率公式有P(w1,...wm)=∏i=1mP(wi∣w1,...wi−1)
- Mecab-ko 韩文分词器安装与使用
升职哦
Mecab-ko韩文分词器安装与使用环境信息:Linux:centos7(debian编译碰到了好多依赖问题,需要一个个调试)Docker也是同样的问题,推荐使用centos7镜像1.前置依赖安装#编译依赖安装yuminstall-ygccgcc-c++wgetautomakeautoconfautogen2.mecab-ko编译安装mecab-ko:基础库mecab-ko-dic:字典库meca
- python注释汉语_中文词性标注
weixin_39589241
python注释汉语
虽然是愚人节,但是这个不是愚人节玩笑,最近花了一些时间在MeCab身上,越发喜欢这个来自岛国的开源分词系统,今天花了一些时间训练了一个更适用的模型和词典,打包提供给大家使用,因为数据和词典涉及到一些版权问题,所以打包文件里只是mecab用于发布的二进制词典和模型文件,目前在macos和linuxubuntu系统下测试无误,其他系统请自行测试使用:使用前请按上述文档安装mecab,下载这个中文分词模
- python中文-Python中文分词
weixin_37988176
虽然是愚人节,但是这个不是愚人节玩笑,最近花了一些时间在MeCab身上,越发喜欢这个来自岛国的开源分词系统,今天花了一些时间训练了一个更适用的模型和词典,打包提供给大家使用,因为数据和词典涉及到一些版权问题,所以打包文件里只是mecab用于发布的二进制词典和模型文件,目前在macos和linuxubuntu系统下测试无误,其他系统请自行测试使用:使用前请按上述文档安装mecab,下载这个中文分词模
- 我爱自然语言处理网文章汇总
wowdd1
nlp
斯坦福大学深度学习与自然语言处理第三讲:高级的词向量表示斯坦福大学深度学习与自然语言处理第二讲:词向量斯坦福大学深度学习与自然语言处理第一讲:引言用MeCab打造一套实用的中文分词系统(三):MeCab-Chinese用MeCab打造一套实用的中文分词系统(二)中英文维基百科语料上的Word2Vec实验HMM相关文章索引PRML读书会第十四章CombiningModelsPRML读书会第十三章Se
- Ubuntu安装软件时报错(报错:dpkg: 处理软件包 xxx (--configure)时出错: 依赖关系问题 - 仍未被配置)
咕咕鸡的智慧
linuxubuntu报错
Ubuntu安装软件时报错报错:dpkg:处理软件包······(–configure)时出错:依赖关系问题-仍未被配置。报错信息:done!update-alternatives:使用/var/lib/mecab/dic/ipadic-utf8来在自动模式中提供/var/lib/mecab/dic/debian(mecab-dictionary)dpkg:依赖关系问题使得hplip的配置工作不能
- NLP分词-Jieba分词与腾讯云,百度云NLP分词对比
HiWoo
在自然语言处理技术里,分词是重要的一环。而搜索引擎,Ai,等技术也都需要分词这一环。开源的分词软件有Jieba,许多项目使用它进行分词,可以自定义词库。对中文,英文等语言都可以进行分词。还有个专门针对日文的分词软件MeCab。这里对Jieba和腾讯云,百度云NLP都测试了下。理论上腾讯云和百度云分词会比Jieba默认词库分词的更好!因为他们数据多,训练的词库会更加精确。可是百度云的分词爆出历史遗留
- 用MeCab打造自己的分词器(三)
hjx5200
自然语言处理
如何增量训练MeCab。一、准备词典和分词后的语料。词典的格式在第一次初始训练的时候已经讲过,是csv格式,以逗号隔开。形式如:1123项,0,0,0,0,0,0义演,0,0,0,0,0,0佳酿,0,0,0,0,0,0沿街,0,0,0,0,0,0老理,0,0,0,0,0,0三四十岁,0,0,0,0,0,0解波,0,0,0,0,0,0统建,0,0,0,0,0,0蓓蕾,0,0,0,0,0,0李佑生,0
- 用MeCab打造自己的分词器(二)
hjx5200
自然语言处理
按照用MeCab打造自己的分词器(一)操作,已经安装好了MeCab。接下来安装指定方式组织语料、词典和配置文件,打造自己的分词系统。利用backoff2005中微软研究院的中文分词语料来训练一个简单的分词系统,逐步深入完成我们的总目标。当前目录为$WordSeg,下载微软的语料到当前目录下,解压,并创建msr_mecab_test目录。~/Project/WordSeg$lsicwb2-datai
- 用MeCab打造自己的分词器(一)
hjx5200
自然语言处理
希望能打造满足项目需要的分词器,然后利用这个分词器,来对收集的垂直领域语料进行分词。在此基础上训练词向量,供后续的功能使用。理想的需求是已有大量的语料可供训练或者说转换不那么复杂,同时支持词典添加和增量模型训练两种方式。通过“我爱自然语言处理”网站上推荐的MeCab,比较符合需要。准备根据站长的博文一步步操作,利用MeCab构建分词器。他在这篇博文提到的坑,前面几个都没遇到编译都很顺利,可能我的系
- mecab安装
cjzyb
PythonNLP
UbuntuInstalldependencies#InstallJava1.7orup$sudoapt-getinstallg++openjdk-7-jdkpython-devpython3-devInstallKoNLPy$pipinstallkonlpy#Python2.x$pip3installkonlpy#Python3.xInstallMeCab(optional)$sudoapt-g
- 分词器
Crystalajj
日语单个句子分词%echo"MeCabで形態素解析を行うとこうなる."|/Users/admin/Documents/mecab/bin/mecab-Owakati整个文件分词%/Users/admin/Documents/mecab/bin/mecabINPUT-oOUTPUT-Owakatimecab参数配置mecab安装很棒的总结(日文)mecab配置文件中文ExecuteTokenizat
- 中文分词组件
bbzz2
NLP
1.下载mecab-chinesedic-binary,放在MeCabbin目录下,具体参考:详细详细可参考《用MeCab打造一套实用的中文分词系统》cmd运行命令:mecab-dmecab-chinesedic-binarywakatiwiki.zh.text.jian-owiki.zh.text.jian.seg-b10000000其中,wiki.zh.text.jian是一个中文数据集,wi
- gWaei 3.6.0 发布,英日词典
wa
gWaei 是一个 Gnome 的英日词典
gWaei 3.6.0 发布了,改进记录:
This version features a rewritten backend that is much much cleaner.
It supports searching stroke ranges (s1-2, for example).
mecab is now used
- 我爱自然语言处理网文章汇总
wowdd1
斯坦福大学深度学习与自然语言处理第三讲:高级的词向量表示斯坦福大学深度学习与自然语言处理第二讲:词向量斯坦福大学深度学习与自然语言处理第一讲:引言用MeCab打造一套实用的中文分词系统(三):MeCab-Chinese用MeCab打造一套实用的中文分词系统(二)中英文维基百科语料上的Word2Vec实验HMM相关文章索引PRML读书会第十四章CombiningModelsPRML读书会第十三章Se
- ubuntu安装日文分词软件MeCab及其Python插件
python
1、从官网上下载三个包:http://taku910.github.io/mecab/mecab-0.996mecab-0.996.tar.gzmecab-ipadic-2.7.0-20070801mecab-ipadic-2.7.0-20070801.tar.gzmecab-python-0.996mecab-python-0.996.tar.gz2、按照官网说的安装在安装mecab-ipadi
- Mecab使用方法总结
binglingshuang
mecab
Mecab1,Mecab是什么Mecab是用于进行日语形态素解析的开源工具,官网是 http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html不过,国内好像是不能访问了。2,使用方法3,设置字典的encode。 1)查看当前的encode. $mecab-P|grepconfig-charset 2)个性字典encode的方法参考: h
- 用MeCab解决日文汉字的排序问题
chain2012
####要对一份Excle存在的上K条由日语汉字组成的书名按50音排序。1.尝试直接用中文系统环境下的Excle直接排序(Windows也应该是针对每个字符对应的编码顺序进行排序的。明显地看假名排在汉字前面)2.尝试用日语操作环境下的Excle排序功能(貌似非日语环境下输入的内容无法提取假名)3.尝试用C#的本地化排序[↗](http://stackoverflow.com/questions/6
- 搜索引擎Senna
搜索引擎
linux如何安装Senna
下载rmp文件:
http://sourceforge.jp/projects/tritonn/releases/
下载所有的x86相关文件
通过以下命令安装
# rpm -ivh mecab-0.97-tritonn.1.0.12.i386.rpm# rpm -ivh mecab-ipadic-2.7.0.20070801-tritonn.1.
- Linux的Initrd机制
被触发
linux
Linux 的 initrd 技术是一个非常普遍使用的机制,linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式,变化不仅反映在文件格式上, linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术,然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
- maven本地仓库路径修改
bitcarter
maven
默认maven本地仓库路径:C:\Users\Administrator\.m2
修改maven本地仓库路径方法:
1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml
2.找到
 
- XSD和XML中的命名空间
darrenzhu
xmlxsdschemanamespace命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml
http://blog.csdn.net/wanghuan203/article/details/9203621
http://blog.csdn.net/wanghuan203/article/details/9204337
http://www.cn
- Java 求素数运算
周凡杨
java算法素数
网络上对求素数之解数不胜数,我在此总结归纳一下,同时对一些编码,加以改进,效率有成倍热提高。
第一种:
原理: 6N(+-)1法 任何一个自然数,总可以表示成为如下的形式之一: 6N,6N+1,6N+2,6N+3,6N+4,6N+5 (N=0,1,2,…)
- java 单例模式
g21121
java
想必单例模式大家都不会陌生,有如下两种方式来实现单例模式:
class Singleton {
private static Singleton instance=new Singleton();
private Singleton(){}
static Singleton getInstance() {
return instance;
}
- Linux下Mysql源码安装
510888780
mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz
(1)创建mysql的安装目录及数据库存放目录
解压缩下载的源码包,目录结构,特殊指定的目录除外:
- 32位和64位操作系统
墙头上一根草
32位和64位操作系统
32位和64位操作系统是指:CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的,但是这些CPU并不是真正意义上的64 位CPU,里面依然保留了大部分32位的技术,只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面,32位系统的最大寻址空间是2 的32次方= 4294967296(bit)= 4(GB)左右,而64位系统的最大寻址空间的寻址空间则达到了
- 我的spring学习笔记10-轻量级_Spring框架
aijuans
Spring 3
一、问题提问:
→ 请简单介绍一下什么是轻量级?
轻量级(Leightweight)是相对于一些重量级的容器来说的,比如Spring的核心是一个轻量级的容器,Spring的核心包在文件容量上只有不到1M大小,使用Spring核心包所需要的资源也是很少的,您甚至可以在小型设备中使用Spring。
 
- mongodb 环境搭建及简单CURD
antlove
WebInstallcurdNoSQLmongo
一 搭建mongodb环境
1. 在mongo官网下载mongodb
2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db"
3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
- 数据字典和动态视图
百合不是茶
oracle数据字典动态视图系统和对象权限
数据字典(data dictionary)是 Oracle 数据库的一个重要组成部分,这是一组用于记录数据库信息的只读(read-only)表。随着数据库的启动而启动,数据库关闭时数据字典也关闭 数据字典中包含
数据库中所有方案对象(schema object)的定义(包括表,视图,索引,簇,同义词,序列,过程,函数,包,触发器等等)
数据库为一
- 多线程编程一般规则
bijian1013
javathread多线程java多线程
如果两个工两个以上的线程都修改一个对象,那么把执行修改的方法定义为被同步的,如果对象更新影响到只读方法,那么只读方法也要定义成同步的。
不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据,就不要将方法设置为synchronized的。
- 将文件或目录拷贝到另一个Linux系统的命令scp
bijian1013
linuxunixscp
一.功能说明 scp就是security copy,用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议,保证了数据传输的安全,其格式如下: scp 远程用户名@IP地址:文件的绝对路径
- 【持久化框架MyBatis3五】MyBatis3一对多关联查询
bit1129
Mybatis3
以教员和课程为例介绍一对多关联关系,在这里认为一个教员可以叫多门课程,而一门课程只有1个教员教,这种关系在实际中不太常见,通过教员和课程是多对多的关系。
示例数据:
地址表:
CREATE TABLE ADDRESSES
(
ADDR_ID INT(11) NOT NULL AUTO_INCREMENT,
STREET VAR
- cookie状态判断引发的查找问题
bitcarter
formcgi
先说一下我们的业务背景:
1.前台将图片和文本通过form表单提交到后台,图片我们都做了base64的编码,并且前台图片进行了压缩
2.form中action是一个cgi服务
3.后台cgi服务同时供PC,H5,APP
4.后台cgi中调用公共的cookie状态判断方法(公共的,大家都用,几年了没有问题)
问题:(折腾两天。。。。)
1.PC端cgi服务正常调用,cookie判断没
- 通过Nginx,Tomcat访问日志(access log)记录请求耗时
ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间
nginx.conf使用配置方式:
log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
- java-67- n个骰子的点数。 把n个骰子扔在地上,所有骰子朝上一面的点数之和为S。输入n,打印出S的所有可能的值出现的概率。
bylijinnan
java
public class ProbabilityOfDice {
/**
* Q67 n个骰子的点数
* 把n个骰子扔在地上,所有骰子朝上一面的点数之和为S。输入n,打印出S的所有可能的值出现的概率。
* 在以下求解过程中,我们把骰子看作是有序的。
* 例如当n=2时,我们认为(1,2)和(2,1)是两种不同的情况
*/
private stati
- 看别人的博客,觉得心情很好
Cb123456
博客心情
以为写博客,就是总结,就和日记一样吧,同时也在督促自己。今天看了好长时间博客:
职业规划:
http://www.iteye.com/blogs/subjects/zhiyeguihua
android学习:
1.http://byandby.i
- [JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析
comsci
工作流
我们已经不满足于仅仅跳跃一次,通过对引擎的升级,今天我测试了一下循环反馈模式,大概跑了200圈,引擎报一个溢出错误
在一个流程图的结束节点中嵌入一段方程,每次引擎运行到这个节点的时候,通过实时编译器GM模块,计算这个方程,计算结果与预设值进行比较,符合条件则跳跃到开始节点,继续新一轮拓扑分析,直到遇到
- JS常用的事件及方法
cwqcwqmax9
js
事件 描述
onactivate 当对象设置为活动元素时触发。
onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。
onbeforeactivate 对象要被设置为当前元素前立即触发。
onbeforecut 当选中区从文档中删除之前在源对象触发。
onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
- 正则表达式验证日期格式
dashuaifu
正则表达式IT其它java其它
正则表达式验证日期格式
function isDate(d){
var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i);
if(!v) {
this.focus();
return false;
}
}
<input value="2000-8-8" onblu
- Yii CModel.rules() 方法 、validate预定义完整列表、以及说说验证
dcj3sjt126com
yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。 返回属性的有效性规则。声明验证规则,应重写此方法。 每个规则是数组具有以下结构:array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
- UITextAttributeTextColor = deprecated in iOS 7.0
dcj3sjt126com
ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0."
Ins
- 判断一个数是质数的几种方法
EmmaZhao
Mathpython
质数也叫素数,是只能被1和它本身整除的正整数,最小的质数是2,目前发现的最大的质数是p=2^57885161-1【注1】。
判断一个数是质数的最简单的方法如下:
def isPrime1(n):
for i in range(2, n):
if n % i == 0:
return False
return True
但是在上面的方法中有一些冗余的计算,所以
- SpringSecurity工作原理小解读
坏我一锅粥
SpringSecurity
SecurityContextPersistenceFilter
ConcurrentSessionFilter
WebAsyncManagerIntegrationFilter
HeaderWriterFilter
CsrfFilter
LogoutFilter
Use
- JS实现自适应宽度的Tag切换
ini
JavaScripthtmlWebcsshtml5
效果体验:http://hovertree.com/texiao/js/3.htm
该效果使用纯JavaScript代码,实现TAB页切换效果,TAB标签根据内容自适应宽度,点击TAB标签切换内容页。
HTML文件代码:
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml"
- Hbase Rest API : 数据查询
kane_xie
RESThbase
hbase(hadoop)是用java编写的,有些语言(例如python)能够对它提供良好的支持,但也有很多语言使用起来并不是那么方便,比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口,它内嵌了jetty作为servlet容器。
启动命令:./bin/hbase rest s
- JQuery实现鼠标拖动元素移动位置(源码+注释)
明子健
jqueryjs源码拖动鼠标
欢迎讨论指正!
print.html代码:
<!DOCTYPE html>
<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
<title>发票打印</title>
&l
- Postgresql 连表更新字段语法 update
qifeifei
PostgreSQL
下面这段sql本来目的是想更新条件下的数据,可是这段sql却更新了整个表的数据。sql如下:
UPDATE tops_visa.visa_order
SET op_audit_abort_pass_date = now()
FROM
tops_visa.visa_order as t1
INNER JOIN tops_visa.visa_visitor as t2
ON t1.
- 将redis,memcache结合使用的方案?
tcrct
rediscache
公司架构上使用了阿里云的服务,由于阿里的kvstore收费相当高,打算自建,自建后就需要自己维护,所以就有了一个想法,针对kvstore(redis)及ocs(memcache)的特点,想自己开发一个cache层,将需要用到list,set,map等redis方法的继续使用redis来完成,将整条记录放在memcache下,即findbyid,save等时就memcache,其它就对应使用redi
- 开发中遇到的诡异的bug
wudixiaotie
bug
今天我们服务器组遇到个问题:
我们的服务是从Kafka里面取出数据,然后把offset存储到ssdb中,每个topic和partition都对应ssdb中不同的key,服务启动之后,每次kafka数据更新我们这边收到消息,然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了,最开始我们是在代码中打印存储的日志,发现没什么问题,后来去查看ssdb的日志,才发现里面每次set的时候都会对同一个key