anye137

海量词库构建（1）：概览

这学期要做软件工程大作业，我选的课题是“海量词库构建”。前前后后总时间至少两周吧。不过还是学到了挺多新知识，也踩过许多坑。从中我也意识到了，写好注释的重要性。不然以后回头看自己写的代码，又要花时间去理解代码，效率低下！还有，做好工作日记，方能更好掌握项目进度，以及总结好学过的知识。我写下这个系列的文章，也算一个总结吧。虽然总结来得有点晚，可能一些学过的知识和踩过的坑忘了。（哦对了，虽然说是软工大作业，但是我感觉自己做的跟软工关系不大啊，哈哈！）

项目主要有四个模块：基础词库构建，语料爬取，分词分类并构建词库，监控系统。

基础词库的构建：这里选择的是具有类别标签的各词库。有了这个带标签的基础词库，才能解决后面的新词分类问题。这里，我选择了搜狗词库和清华大学中文词库。搜狗词库，感觉分类的质量不高，而且有很多重复的词，所以我手动从中选择了几个分类质量好点的类别并去重，插入数据库。清华大学中文词库质量还是蛮高的，直接全部插入数据库了。
语料爬取：爬的是笔趣阁小说网和新华网。爬了 40w+ 小说章节（3G），17w+ 新闻（1G），共计 4G 语料。（题外话：感觉语料来源不够丰富，合理的话应该多加两三个语料来源）
分词分类并构建词库：分词调用结巴分词。至于分类，首先用 gensim 里的 Word2vec 训练语料的词向量，再用一个简单的 kNN 进行分类。额，感觉只是简单地调包而已。哈哈。
监控系统：监控系统用的 Grafana + Mysql，我之前写的文章里已经有介绍过了。不过呢，那时候用的是 Docker 里面的 Grafana。里面的 Grafana 好像有小 bug，不能安装插件，所以我直接不用 Docker 新装了一个 Grafana。监控系统主要监控的是语料爬取情况和词库构建情况。

后面我会详细讲讲各模块中的知识点，以及一些踩过的坑。最后就上个监控系统的图吧。Grafana 真神器！！！

海量词库构建（1）：概览_第1张图片

你可能感兴趣的:(海量词库构建（1）：概览)

爱情手记 41 | 元旦小画面剪辑此昵称被征用
亲爱的女朋友，元旦快乐！送上一抹亮色的鲜花，我们路过的街头巷尾，美景风光一一同时过目。樟木头市场的小花店你说要一起看市井的生活，拿着手机到处去拍特写，我看着你像个孩子一样好奇，也不买菜，也不问水果价钱，只是专注地拍，我真害怕摊主呵斥你，或者干脆上来拍你一脸。好在我的担心是多余的，他们似乎习以为常了，也随你去了。瓶瓶罐罐的花草我跟在你身后，像一个家长跟着自己的孩子，离着一段距离，却随时能够追上去，我
京东618大额券怎么领？京东有大额优惠券吗？直返APP淘客项目
京东618购物节：解锁APP直返大额券，畅享购物狂欢京东618购物节，这场年度购物盛宴，无疑是每一位消费者心中的期盼。在这场盛宴中，大额优惠券如同宝藏一般，等待着精明的你去发掘。而掌握领取大额券的秘诀，将让你的购物之旅更加畅快淋漓，尤其是当你充分利用京东APP的优势时。一、如何在京东APP轻松领取大额券？月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）返利就用
2023-10-03 格桑吖
当我们画着精致的妆容，踩着恨天高，身上散发着超出年龄的香水味，你会不会想起曾经的自己:穿着大大的校服，日常也穿着宽松的短袖，肥大的裤子；横冲直撞的跑在校园每个角落，偶尔转头笑一下；跟朋友谈笑风生，有时哈哈大笑，笑完了腰，有时怒气冲冲，直接上手……我们肆意的人和的笑，肆意的哭，喜欢就去做，不喜欢的人和事就远离，做尽了随心所欲……但现在笑着笑着就哭了，哭着哭着就笑了，有很多无能为力的事，我们要学会去迎
华鲜栗子
2019年1月26日晴打糍粑的小伙子说今天很暖和我满身浸着汗水细数快乐太阳叉腰发奋展示光芒让我和人们眼里泛着金黄一个跟头下我不说话就是大笑后继续笑等到能站起来后继续出发再跌了跟头后再爬上坡一股劲儿来自无名的女侠羽毛轻盈如即将来的春花儿我是不会被埋没的蜂鸟不需要漂亮就能造出精华
《10倍速目标达成法》孙正义的稻草战略明远说
你好，我是明远，今天给你分享《10倍速目标达成法》昨天讲了1根稻草换了一栋房子，今天讲一个知名故事。日本孙正义，初期做好了定位，进军无人涉足的ADSL，ADSL领域就是稻草，一个不赚钱又费劲的行业。进军后却获得500万用户，普通公司是2-3万用户，所以他以绝对压倒性优势成为细分领域冠军。然后用这根稻草先后收购日本电信和沃达丰，收购沃达丰创造日本历史上的最高记录17500亿日元。数据显示：2001年
2019-05-15 华英雄_712d
2019-05-15姓名：郭祥华组别：315期六项精进努力一组【日精进打卡第515】【知～学习】背诵《六项精进》2遍共2104遍。背诵《大学》2遍共2104遍。原则：“痛苦加反思等于进步”“接受严厉的爱”“迎接而并非躲避痛苦”经典语句：你面临的挑战将考验你强化了，如果你没有经历过失败，就说明你没有努力突破极限，而如果你不努力突破极限，你就不能最大限度的挖掘自己的潜能，努力突破极限，有时失败有时成功
亲子日记第十四天傻瓜也有爱
早上大宝小宝上学后，我打打卫生，老妹陪小宝玩（妹妹家小宝）不知不觉到了中午。中午吃饭的时候，大宝说：“数学、语文卷子发下来了，在110分以上。”考的还行。今晚开家长会，早早把饭做好，只等大宝回家吃饭，吃完饭我和xxx妈妈一起来到学校，不一会家长会正式开始。听到每位代课老师表扬大宝的时候，作为家长既感到高兴又感到惭愧。高兴的是在老师的教诲和自己的努力下一直都保持前几名，感恩大宝遇到的每一位老师。惭愧
2019.1.24星期四亲子日记95 李妈妈
图片发自App图片发自App图片发自App大宝被评为三好学生了！一年级的第一学期马上结束了，虽然期末考试的成绩不理想，但是这一学期大宝还是很努力的，大宝的缺点就是学东西还不够扎实，做题的时候读题不认真，不会检查！希望假期里我们一起努力改掉这些坏习惯！让大宝在新的学期里更加的主动认真的去学习，也希望大宝能够再活跃一点，能够积极参与学校的各项活动！做一个全面发展的好学生！！！厦小一年六班李新妈妈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
夜思：今日感悟10.21 三叔青年
1.人生最大的痛苦莫过于梦醒时发现无路可走。——鲁迅《娜拉走后怎样》2.人生的许多大困难，只要活着，没有什么是解决不了的，时间和智慧而已。——三毛《亲爱的三毛》3.百转千回都不能同你讲，水有愁，水自哀，水愿意载你。——卞之琳4.人若是看透了自己，便不会小看别人。——老舍《骆驼祥子》5.人生如戏，角色早就定了，有人永远是打手，有人永远挨打。——余秋雨《吾家小史》6.“师父，可我觉得淡泊名利很酷啊。”
中原焦点秦皇岛站第5期，每日分享第71天，2021年9月24日 5804c210041b
我们如何捡苹果心态决定成败，就像一块地里有很多苹果，而两个农民都来捡苹果。第一个农民他发现苹果很多，怎么减也减不完，更要命的是，他发现别人都比他捡得快，还捡得多，慢慢地他的热情越来越低，越减越没劲，后来干脆不捡了，只是站在边上看着别人捡，自己急的直跺脚，心里像猫抓的一样难受，为了减轻这种难受的感觉。他干脆离开，去玩游戏了。而另一个农民看到一地的苹果，但自己想明白了，地里的苹果不是我的，捡到才是我的
UE5 Microsoft.MakeFile.targets(44, 5): [MSB3073] 代码为6.报错解决
Microsoft.MakeFile.targets(44,5):[MSB3073]命令“E:\EpicGame\UE_5.1\Engine\Build\BatchFiles\Build.batAAAAAEditorWin64Development-Project=“D:\UE4Game\AAAAA\AAAAA.uproject”-WaitMutex-FromMsBuild”已退出，代码为6。出错
UE 编译项目时遇到的各种问题（收集中） xx-xzh UE ue5
UE编译项目时遇到的各种问题（收集中）问题1：0>Microsoft.MakeFile.Targets(44,5):ErrorMSB3073解决办法：关闭已经打开的UE编译器，然后重新编译即可问题2：Nobuildactionfilesorversionfilesspecified解决办法：启动项目选错了，切换启动项目为你的项目问题3：GENERATED_BODY()报错解决办法：确保这两行代码在
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
UNREAL报错MSB3073解决方案 liangfan1 游戏引擎
翻了几个国内的解答，发现没有找到我想要的。翻了翻英文网站发现了。UE5.1VS2022C++BuildErrorWithMSB3073-Development/Platform&Builds-EpicDeveloperCommunityForums嗨！我认为我找到问题的原因了。如果你的UnrealEngine5启用了LiveCoding集成功能，这可能会导致Mutex（互斥量）冲突。尝试禁用Liv
银饰品牌哪家强？看十大银饰品牌排名老凤祥位居第一好项目高省
很多人喜欢佩戴银制饰品，佩戴银饰不仅能够起到很好搭配装饰作用，还具有排毒养颜、延年益寿的功效，对人体非常有益，那么我国哪些品牌的银饰最好呢?下面就让我们一起来看看中国十大银饰品牌查看更多关于银饰品牌的文章吧!NO1.老凤祥。老凤祥是我国著名的珠宝首饰品牌，也是有着百年历史的民族品牌，由刚开始的老凤祥银楼发展至今成为经营钻石、铂金、翡翠、黄金等多种珠宝的大型首饰企业集团。NO2.老银铺。老银铺始创于
详解C语言函数——一篇看完彻底学会使用自定义函数秋刀鱼的滋味@ C语言语法详解 c语言开发语言 c++
目录1.函数前言1.1函数的概念：1.2为什么要使用函数：2.标准库函数2.1什么是标准库：2.2库函数有哪些：3.自定义函数3.1函数的定义：3.2函数的声明：3.4函数的调用：4.实参和形参4.1实参：4.2形参：4.3实参和形参的关系5.数组传参6.return语句6.1return语句作用：6.2常见的return问题：7.嵌套函数和链式访问7.1嵌套函数：7.2链式访问（例-printf
阿里通义千问Qwen3深夜升级：架构革新+性能碾压俊哥V AI AI新闻热点由AI辅助创作 AI 人工智能
（以下借助DeepSeek-R1&Grok3辅助整理）北京时间2025年7月22日凌晨，阿里云通义千问团队发布了Qwen3旗舰模型的最新更新——Qwen3-235B-A22B-Instruct-2507-FP8。这一更新不仅在性能上实现了突破，还标志着开源大模型技术架构的重大进化。本报告基于官方发布信息、社区反馈以及相关分析，全面解读该更新的技术细节、性能表现、社区反应及未来展望。一、技术架构与战
添加UPROPERTY(EditAnywhere）引起 error MSB3073
1>UnrealBuildTool:error:UnabletodeleteE:\EpicUE4"Microsoft.MakeFile.Targets:errorMSB3073"SolutionsGames\MyGame\BTPS\Intermediate\Build\Win64\BTPSEditor\Development(Unabletodelete\\?\E:\EpicGames\MyGam
南京10家新版正规上户口亲子鉴定中心地址名单（附2024年8月最新亲子鉴定简介）国医基因铬主任
南京上户口亲子鉴定哪里可以做？南京做上户口亲子鉴定可以去南京市江宁区双龙大道1341号君铂大厦1幢·1006室（南京康灵基因）。在南京这座繁华的城市中，每一个家庭的幸福与和谐都是社会稳定的基石。随着社会的进步和法治观念的增强，越来越多的家庭在面临户籍问题时，选择通过科学的手段来确认亲子关系，以确保家庭成员的合法权益。其中，上户口亲子鉴定作为一项重要的司法服务，正逐渐成为解决户籍争议、明确家庭关系的
YYConfuse专业iOS代码混淆加固 YYConfuse iOS辅助上架 iOS混淆 iOS上架
YYConfuse专业iOS代码混淆加固摘要下载地址前言工具介绍联系作者权限获取专注iOS代码混淆,加密加固的辅助工具工具界面工具功能介绍说明摘要iOS混淆iOS代码混淆iOS过审工具iOS上架iOS代码混淆工具iOS工具iOS马甲包iOS马甲包工具iOS混淆iOS过4.3iOS过审iOSconfuseiOScodeconfuseiOS2.3.1解决iOS账号调查解决办法iOS账号调查解决iOS账
3种经验测试方法 Nbq01 测试用例
1.错误推测法：基于经验的测试技术之错误推测法。也称为错误猜测法，就是根据经验猜想，已有的缺陷，测试经验和失败数据等可能有什么问题并依此设置测试用例。2.异常分析法基于经验测试技术之异常分析法。系统异常分析法就是针对系统有可能存在的异常操作，软硬件缺陷引起的故障进行分析，依此设计测试用例。主要针对系统的容错能力，故障恢复能力进行测试。比如华为，红米等。3.随机测试基于经验测试技术之随机测试。随机测
百日更挑战Day043 纳尼亚传奇(1)上海贼王Jason
今天我来跟大家分享一部童话《纳尼亚传奇》，今天我来跟大家介绍第一本《魔法师的外甥》(上)。它主要写了波利和的迪戈雷发现了自己家的藏书阁后面有一个密室，他们在深夜的时候悄悄地爬进了秘道，在秘道里探索发现了一个房屋。刚进屋，波利就看见了在一个桌子上放着两枚戒指，两枚黄色的，两枚绿色的。这时安德鲁舅舅开门进来了，并说要送给波利一枚黄色的戒指，波利非常喜欢。伸手去碰那个黄色的戒指，瞬间波利就不见了。迪戈雷
《绝对红人》林小冬白琳全文免费阅读（完整版）寒风书楼
《绝对红人》林小冬白琳全文免费阅读（完整版）主角：林小冬白琳简介：副乡长林小冬晚上偶然遇见女上司在办公室受到骚扰，仗义出手，解救上司于危急之中，就在女上司即将以身相许时……关注微信公众号【花车文学】去回个书號【51】，即可阅读【绝对红人】小说全文！冯啸天在学校里虽然不是什么霸王，但是仗着表哥是学校的领导，也算是一号人物，不过看眼前这形势，再硬撑下去是自讨苦吃。好汉不吃眼前亏，道歉就道歉吧，等过了眼
试着用高管的视角打工小驰行动派
做了高管才知道，领导并不关心你完成了多少工作15年，期间经历了4年中层，4年高管，我逐渐明白，其实领导并不关心你完成了多少工作量。即使你听话照做、哪怕你加班加点，年终的升职加薪可能依然与你无缘，这很扎心，但确实现实，并且在各个公司中都并不少见。初听这话，很多朋友可能觉得委屈：我明明最听话、最努力，为什么得不到认可？其实问题不在“工作量”，而在“价值创造”。领导真正关心的，是你有没有帮他解决关键问题
2018-09-06 晰姐吉祥
姓名：王彬公司：杭州爵卓服饰有限公司（NE潮牌男装）【日精进打卡第68天】【知～学习】《六项精进》1遍共183遍《六项精进》通篇1遍共33遍《大学》1遍共135遍《经营十二条》0遍共11遍••••••【经典名句】人生的道路都是由心来描绘的，所以，无论自己处于多么严酷的境遇之中，心头都不应为悲观的思想所萦绕。——稻盛和夫【行～实践】一、修身：（对自己个人）1、学习英语两小时，打卡第七天；二、齐家：（
写于2012年6月30日大白159753
2021年是我的本命年，是红色的一年，也是注定不一样的一年。之前我从来没有这么正式的写过我的年中回顾。今年不知道为什么也恰好是在6月30日这一天有了这个想法，时间地点都合适，那就开始动笔吧~一直觉得自己过得平平无奇，回顾都要靠翻朋友圈翻相册去寻找过往的时光，偏偏又不是一个爱照相爱发朋友圈的人。只能靠着蛛丝马迹来回忆我这匆匆过去的半年时光。上半年让我印象最深刻的事情可能就是我换工作吧，5月24日我来
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
广州市11家个人亲子鉴定机构地址一览—附鉴定材料手续中量国鉴
广州可以做个人亲子鉴定的机构在哪里？在广州这座历史悠久的文化名城，亲子鉴定作为现代科技与传统伦理交织的一个领域，正逐渐受到越来越多家庭的关注。亲子鉴定，作为一种科学的手段，旨在通过遗传学原理，精准地鉴定出个体之间的血缘关系，为解决家庭中的亲子关系疑虑提供了可靠的依据。广州亲子鉴定咨询中心广州中量国鉴生物dna亲子鉴定中心服务咨询点地址：广州市越秀区三元里大道217号民生商业大厦7楼701E（三元里
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他