韩梦飞沙S

文献助手

强生医药文献助手

文献入库／解析／搜索

PDF

OCR

标题／作者／时间／科目／专业／关键词／摘要／原文

解析

关键词提取

中文分词／

摘要。自动生成摘要。

归类。科目／专业

搜索

排序。置顶。标注。

---

Architecture

英[ˈɑ:kɪtektʃə(r)] 奥剋忒客车。美[ˈɑ:rkɪtektʃə(r)]

n.	体系结构; 建筑学; 建筑风格; （总体、层次）结构

用户。通过电脑。或者手机查询

强生大脑

数据算法算力

数据知网。指南针。 office 365。medline。pubmed。

算力 azure

其他平台。微软。research AI 。百度 AI。腾讯AI。阿里云，科大讯飞，

RA就是证书注册审批系统,该系统具有证书的申请、审批、下载、OCSP、LDAP等一系列功能,为整个机构体系提供电子认证服务。 RA作为CA认证体系中的一部分

数字证书注册中心，又叫RA（Registration Authority ），是数字证书认证中心的证书发放、管理的延伸。主要负责证书申请者的信息录入、审核以及证书发放等工作，同时，对发放的证书完成相应的管理功能。发放的数字证书可以存放于IC卡、硬盘或软盘等介质中。RA系统是整个CA中心得以正常运营不可缺少的一部分。

电子商务认证授权机构（CA, Certificate Authority），也称为电子商务认证中心，是负责发放和管理数字证书的权威机构，并作为电子商务交易中受信任的第三方，承担公钥体系中公钥的合法性检验的责任。

CA是证书的签发机构,它是PKI的核心。CA是负责签发证书、认证证书、管理已颁发证书的机关。它要制定政策和具体步骤来验证、识别用户身份，并对用户证书进行签名，以确保证书持有者的身份和公钥的拥有权。

PKI是Public Key Infrastructure的首字母缩写，翻译过来就是公钥基础设施；

X.509标准中，为了区别于权限管理基础设施(Privilege Management Infrastructure，简称PMI)，将PKI定义为支持公开密钥管理并能支持认证、加密、完整性和可追究性服务的基础设施]。这个概念与第一个概念相比，不仅仅叙述PKI能提供的安全服务，更强调PKI必须支持公开密钥的管理。

X.509标准是ITU-T设计的PKI标准，它是为了解决X.500目录中的身份鉴别和访问控制问题而设计的。

在X.509标准的早期版本中，除了最基本的组件——CA、证书持有者和依赖方外，只涉及了资料库。由于X.509标准是为X.500目录服务的，所以，资料库的形式就是X.500目录。在后来的X.509标准版本中，又增加了CRL Issuer组件。

在X.509标准中，使用大量的篇幅来定义证书和CRL的数据格式。目前，使用最广泛、最成功的证书和CRL格式，都是X.509标准定义的格式。

ITU-T的中文名称是国际电信联盟电信标准分局(ITU-T for ITU Telecommunication Standardization Sector), 它是国际电信联盟管理下的专门制定电信标准的分支机构。

该机构创建于1993年，前身是国际电报电话咨询委员会（CCITT 是法语Comité Consultatif International Téléphonique et Télégraphique的缩写，英文是International Telegraph and Telephone Consultative Committee），总部设在瑞士日内瓦。

历史上，从1960年到1993年改名为ITU-T，CCITT的建议在每4年一次的全会（"plenary assemblies")中正式通过，建议的全集在每次全会后出版，并以每次建议集的封面颜色来命名。例如1980年全会后的全集叫做黄皮书，而1984年的叫做红皮书。全集大概每几百页分为一册并可分册购买。这种每4年才通过一次的机制使得CCITT成为了一个缓慢而僵硬的组织。

由ITU-T制定的国际标准通常被称为建议（Recommendations）。由于ITU-T是ITU的一部分，而ITU是联合国下属的组织，所以由该组织提出的国际标准比起其它的组织提出的类似的技术规范更正式一些。

ITU-T的各种建议的分类由一个首字母来代表，称为系列（见下文），每个系列的建议除了分类字母以外还有一个编号，比如说"V.90"。

有些时候，不如新建一个标准替代原有的。这样的新标准通常通过在原来的标准后面加上"bis"或者"ter"的后缀来表明，如 "V.26bis" 和 "V.26ter"。

和IETF和3GPP等不同，ITU-T发布的协议不是开放的，除了草案和研究阶段的文本外，一般不提供免费下载。ITU-T发布的建议通常有类似X.500的名字，其中X是系列而500是系列号。

China Food and Drug Administration

一般指国家食品药品监督管理总局，是国务院直属机构。其是国家政府设置的药品监督管理部门，是我国药品行政监督管理组织体系一部分，属于国家药事管理组织体系范畴。

前身

SFDA

RTL

RTL8111_Registers_DataSheet

realtek

医疗器械产品注册技术审评报告-基因测序仪

产品类别。三类

瑞昱

瑞昱(yù)半导体成立于1987年，位于台湾「硅谷」的新竹科学园区，凭借当年几位年轻工程师的热情与毅力，走过艰辛的草创时期到今日具世界领导地位的专业IC设计公司，

我们以螃蟹为企业的标章，是期许自己能效法螃蟹在自然界中以坚韧的生命力，无惧无畏，勇于挑战的象征意义。

凭借着7位创始工程师的热情与毅力，走过风雨飘摇的草创时期，从20个人的规模拓展为今日约2000人的国际知名IC专业设计公司。

以集成电路产品之研发与设计为企业定位，从产品研发、设计、测试到销售，秉持求新求变的原则，以达成「新技术、新产品、新应用、新价值与新市场」的目标。

瑞昱已成功开发出多种领域的应用集成电路，产品线横跨通讯网路、电脑周边、多媒体、超宽频等技术，与世界先进产业主流并驾齐驱。

员工是瑞昱最重要的资产，是瑞昱成功的基石。自我管理、充份授权、重视团队、共同成长，是我们对同仁的要求和期许

RA注册证。数字证书注册中心。

数据来源:

1. CFDA (Linkage)。国家食品药物监督管理总局
2. RA Certification Repository (File Server) 证书仓库

3. RA Certification Datasheet (Excel) 数据表

使用场景:

销售根据产品规格查询产品注册证号(生产日期)。
销售根据产品规格查询产品注册证信息的状态(有效/失

效/有效期)
销售根据产品规格查询产品注册证信息。(RTL or CFDA)
销售根据产品规格查询产品注册证批件及产品检测报告的

前两页。(RTL)

业务痛点:
1. 销售无法及时有效的查询到注册证号，批件信息。

2. 存在多张注册证，销售不知道。
3. 需要检测报告和注册证批件。

文献助手

业务痛点

销售及市场部人员在自我学习或撰写项目文档过程中，需要大量文献的支持。由于Global/Local文献库相对分散，提供的检索功能各不相同，销售及市场部人员自主完成文献检索和全文下载存在困难，会将需求通过医学文献申请表提交至MA完成。
申请表需要申请人注明用途，设计的产品，已知文献信息，关键词信息和欲解决的问题
MA收到大量来自销售及市场部人员提交的文献需求。申请表中提供的检索信息在描述上存在不全面不准确的问题，往往需要MA与申请人经过多轮线下沟通确认，才能确认实际需求。沟通成本高，反馈周期长，销售及市场部人员无法快速得到所需文献信息，而反复的沟通也增加了MA团队的工作负荷。

医学部高级专员（MA）

招聘网站

医学部高级专员（MA）

职位月薪：13000-20000元/月
工作地点：北京
发布日期：招聘中
工作性质：全职
工作经验：3-5年
最低学历：硕士
招聘人数：3人
职位类别：内科医生

23k才是土豪。税后15k才是。

应用场景

1. 销售和市场部人员在自我学习或拜访前准备的过程中，需要检索文献，以提升自身学术能力(2018年 1月至6月，MA收到医学文献申请163个，初筛后下载摘要约2100+篇，下载全文约2300+篇)

• 明确知道文献信息，如作者、题目、期刊及发表时间(或链接/PMID/DOI)，需要下载文献全文 • 自主进行简单检索，直接输入关键词或组合进行检索
• 涉及多关键词组合、排列相关的复杂检索，咨询MA给出关键词建议，或填写医学文献申请表提

交至MA帮助完成检索

需求分析 – 短期

统一的文献检索入口，综合检索国内外文献库中的所有内容(包括文献摘要和全文)，并遵循文献
```
     的版权要求(文献全文仅限强生内部员工使用)
```
基于上述文献库中的文献摘要和全文内容，支持关键词或其组合检索
- 关键词或其组合模糊/精确检索，如产品、疾病、术式、干预等关键词
- 文献信息模糊/精确搜索，如作者、题目、期刊及发表时间(或链接/PMID/DOI)等
- 按文献发布时间段、文献类型和关键词进行检索(新文献、新产品、热点关键词检索)
- 可选择检索文献的语言，如中文、英文
对于按关键词或其组合检索出的文献，每篇文献自动生成简短摘要(描述目的、材料、方法、结果、结论等)并翻译，帮助用户快速完成检索结果的初筛
对于初筛后的检索结果，支持文献的批量选择/下载，选中的文献自动生成中文/英文汇总摘要(描述目的、材料、方法、结果、结论等)，帮助用户精准获取所需内容
检索结果支持全文下载，下载的附件需要添加水印或启用其他版权保护机制
支持电脑端使用

政策流程解答需求

政策大类	明细流程
注册证信息获取	注册证信息查询规范
	注册证批件及检验合格证封面下载规范
	注册证附件申请流程
文献查询	文献查询使用规范
文献查询	医生临床研究文献查询申请流程

Nqsky Blazar

耀变体blazar。

assistant

助手，助理;

Spider

Web abstract

国家药监局(CFDA)官方网站

强生自有Excel格式RA注册证数据

强生自有关于RA注册证文件服务

SPIDER数据采集系统

1.Configuration manager	基于UI界面的爬虫配置管理，以可视化的方式，让用户可以方便地创建抓取任务
2.Scheduler	整个爬虫系统的核心模块，负责抓取任务调度
3.Url manage	链接管理模块
4.Fingerprint manager	语义指纹模块，负责根据链接地址和页面内容制作语义指纹，用于后续模块对网页进行去重，防止重复抓取
5.Data fetcher	网页抓取模块，负责从抓取任务队列中取出待抓取的任务
6.Js executor	js执行服务，主要针对需要动态加载数据的页面内容下载，通过自动执行页面的js实现页面渲染，获取完整的页面内容数据
7.Proxy server	代理服务模块，负责统一管理整个爬虫系统的代理池、cookie池
8.Data parser	网页解析模块，对下载的网页内容做解析和抽取，获取网页核心信息
9.Task queue	抓取任务队列，存放待抓取的任务信息
10.Data queue	网页数据队列，存放待解析的网页数据

中国知网 CNKI

万方文献库

PubMED 国外资料库

可选文件库（MEDLINE、SCOPUS、OVID）

关键字组合检索

中英文文献材料互译

优化查询结果形成个性化推荐

按要求自动形成摘要和总结

支持筛选后批量全文下载

增加水印及版权保护机制

多端同步支持PC端及移动端使用

文献助手主要面向销售、市场人员的文献和资料需求，在已经建立了医疗综合信息库的前提下，通过智能搜索引擎、结合自然语言处理、机器翻译、机器学习训练、文献摘要自动提取、智能交互问答等技术，同时通过引入MA人工校正、外部专家人工修正等形式，面向用户提供逐渐精确的文献申请、搜索、审核、自动总结、下载等能力，并支持PC和移动端使用

KDD

文件助手-自然语言处理-技术架构

文本语义分析平台

中文分词技术

机器学习序列标注技术

离线新词发现技术

文本分类技术

文档内容理解技术

深度学习技术

关键技术—中文分词技术

基于词典的分词

基于词典的机械切分本质上就是字符串匹配的方法，将一串文本中的文字片段和已有的词典进行匹配，如果匹配到，则此文字片段就作为一个分词结果。

基于序列标注的分词

针对基于词典的机械切分所面对的问题，尤其是未登录词识别，使用基于统计模型的分词方式能够取得更好的效果。基于统计模型的分词方法，就是一个序列标注问题。

关键技术--机器学习序列标注技术

序列标注技术是关键信息提取的核心技术。通过对文档信息标注，训练序列标注模型，然后对新样本进行预测。

关键技术—中文分词技术

专用词库和并行Bi-LSTM

关键技术—离线新词发现技术

现有的大部分分词工具的准确率都比较高，但对于一些未登陆词的识别，效果并不是特别理想，这时就需要用户的词典进行补充。离线新词发现主要是指通过用户收集的文档自动挖掘出其中的未登陆词对词典进行补充的方法。

关键技术—文本分类技术

文本分类处理的对象是自然语言文字序列，通过对文本的学习，将文本进行分类。是自然语言处理的基本任务，也是情感分析等上层技术的基石。

关键技术—文档内容理解技术

对文档内容深度挖掘和理解并进行关键要素抽取是实现精准化和精细化搜索的前提，也是本搜索区别于普通文档全文搜索的重要特性。

经典的机器学习算法需要做各种各样的特征工程，90%的时间都会花在特征工程上。而Deep learning颠覆了这个过程，不需要做特征工程。

同义近义词分析：基于通用和专用语料库和语言模型以及搜索日志可以挖掘出常用词的同义近义词。同义近义词分析是实现语义搜索的基础。

拼写纠错分析：一种是Non-word Error，指单词本身就是拼错的，比如将“happy”拼成“hbppy”，。另一种是指单词虽拼写正确但是结合上下文语境确是错误的，比如“two eyes”写成“too eyes” 。

相关搜索词：通过分析搜索引擎日志，可以挖掘出query的相关搜索词。比如可以挖掘出真格基金的相关搜索词为徐小平、红杉资本等，也可以挖掘出华为手机的相关搜索词为华为mete8

关键技术—机器学习排序技术

L1层初级Ranking

L2层基于机器学习的精排

L3层点击反馈排序调权

在搜索排序中使用了一种position-aware ListMLE(p-ListMLE)的算法，考虑了排序位置信息，对不同位置的重要程度进行区分。实践显示同样的条件下p-ListMLE的搜索效果指标nDCG要优于ListMLE（机器学习-文档列表排序方法）。

关键技术—基于深度语义相似度模型（DSSM）的匹配技术

针对通用DSSM无法获取句子以及篇章级更长上下文语义的问题，我们引入了结合LSTM的DSSM模型，也称LSTM-DSSM. LSTM-DSSM 其实用的是 LSTM 的一个变种——加入了peep hole的 LSTM。

关于文献助手需求--版权控制和管理

文献助手可以对搜索出来的外部文献进行版权甄别、通过外部资源自身的版权控制信息对文献来源、文献下载、转载引用等进行识别，并向用户进行告知、付费、引用说明、禁止转载、禁止下载等的明确提示，避免未来出现版权纠纷

对强生内部资源而言，文献助手通过内置的水印技术，对所有下载的文献自动添加水印，水印内容支持模板定制，密级、权限等信息则根据内控要求自动生成、时间、归属等信息则由系统自行生成，水印仅对下载的文献生效，不影响原始文件

…………

强生项目汇报演示

网页抓取演示，

语义分析垂直搜索 Runit 文件文本搜索

爬虫和搜索后台配置
配置
https://data.datagrand.com/dashboard/#/search/searchaccessfield

账号：datagrand

密码：datagrand123

文件搜
文件搜索
http://siterec.datagrand.net/run_it/

账号 zhenkunhang

密码 LfSvAxPbIdHeFnZi
Client ID 123

将一个PDF的文字提取出来了

垂直搜索
搜索
http://gyrx-search-web.datagrand.net/#/main/pic-search

文档上传和搜索文字图表范围搜索

自然语
自然语言处理demo
mo
http://39.96.133.187:10000/

医学文献助手是一款可以是在 PubMed 搜索结果页面，添加 PDF 链接、影响因子、F1000评论、作者发表记录等chrome插件。

IF在学术界称之为影响因子，是评价学术期刊和文献质量高低的一个重要指标，当然这个指标并不定完全合理。但是，在当今信息爆炸的年代，我们也只能认为 IF 高的期刊和文献其研究质量也就高。PubMed上查询到的文献并不一定是SCI文献。因为PubMed是一个公共免费的查询平台，并不会显示影响因子IF。怎么让 PubMed 查询文献时同时显示文献的 IF？这个可以利用医学文献助手可以做到这一点。

它虽然名字是医学文献助手，但是其适用范围并不局限于医学。在最初医学文献助手还有一个更广为熟知的名字：the paper link for PubMed。下面就跟随chrome插件网一起去看看医学文献助手的使用方法吧。

文献求助 - 丁香园文献全文求助平台

pubmedplus手机客户端是一款医学文献嗖嗖app，支持在线进行关键字的查询，中英文皆可搜索出来，英文文献资料还有详细的翻译

1.检索功能：完善的高级检索、文献筛选、检索历史功能。

2.引文索引：轻松实现引文追溯，解决查找文献广度、深度问题。

3.收藏导出：支持手机与PC同步，轻松实现文献管理。

4.智能推荐：个性化推荐相关领域文献资料，跟踪进展并拓展视野。

5.Plus工具条：显示期刊影响因子、引用次数、轻松评估文献质量。

6.免费全文：一键链接Scihub，免费下载90%以上收费文献。

7.翻译功能：支持中文检索输入，英文摘要翻译。

8.订阅功能：轻松跟踪某一领域、期刊、作者等最新文献。

注册网址：http://www.storkapp.me/?ref=14500

作为一只科研狗，业界大牛的文章是我的好伙伴，不仅要掌握领域内的研究方向，还要及时追踪研究课题的新发现。但每天在Pubmed等网站逐一浏览相关文献，往往事半功倍。
后来，师兄向我推荐了神器Stork：Stork 文献鸟是由斯坦福大学成员开发的文献追踪的小工具，只需注册并设置好关键词，就会收到相应的文章。不仅如此，还可以对期刊，影响因子等进行筛选，有的放矢得找到感兴趣的文章

Stork最新推出了翻译功能，文章标题下方注有翻译，这对英文不好的我来讲太方便了。以前使用Stork时，尽管每个关键字只推送了10多篇，但一篇篇读下去也需要时间，有时还要谷歌翻译一下。现在好啦，几秒钟的时间就可以看完了，这可真是质的飞跃，Stork简直太贴心了！

不仅如此，Stork的翻译功能还覆盖了摘要部分，点开文章链接查看摘要，中英文对照一览无余，更加省时省力！

还在科研长路里上下求索的同学们，快来加入Stork大家庭吧！

参考文献到底有多重要？

从一定意义上说，论文的学术性和权威性，在某种程度上也可以从参考文献中表现出来。科学史上的任何研究成果，都是在前人或旁人的劳动成果基础上创造出来的，通过学者间的相互引用得以代代相传。

给大家分享学术史上的一个有趣的老故事，《acta crystallographica section A》在2010汤森路透公布的影响因子在学术圈激起了一场不小的波澜：前一年的影响因子还只有2.051，居然跃升到49.926，位列全榜第二！而同年nature、science的影响因子分别是34.480和29.747。这背后并没有任何舞弊和学术不端行为，而是因为该刊在2008年发表的一篇文章，被引频次高达5624次，贡献了该刊2008年72篇文章总被引次数的94.3%。

由此可见，参考文献对作者的文章是否能被接收很重要，对期刊的影响力也是同样重要。

你在用什么方法引用参考文献？

你该不会是在用最古老的方式：手工添加参考文献吧?这种方法有多不方便就不多说了，除非你的参考文献只有两三条。怎么可能呢，哪个期刊会接受一篇只有两三篇参考文献的文章呢。核心期刊的最新标准是最低15条参考文献。手工添加再加上后续的返修工作量丝毫不小，为何在这上面浪费有限的时间呢

当然我相信已经有非常多的资深科研者已经找到了一些好用文献管理工具，如endnote、readcube、医学文献王等。这些工具有个什么共同点呢？

难！难！难！（用了多年的童鞋请无视）

难在哪里？这类工具重在文献管理，界面复杂，操作相对也比较复杂，很多小伙伴用了一次之后似乎没有找到门道，无奈放弃，被迫手动添加。

现在这个时代，最不缺的就是资源、工具。在众多工具中如何找到最适合自己使用的呢？

今天小编纯福利分享一个用不了两分钟就学会的文献引用工具：引文小助手，简单说一下为什么值得推荐：

1.效率至上

节约30%的论文写作时间。

2.能解决本质需求即可，不要冗余，要轻便

解决快速引用参考文献、快速调整参考文献格式，解决本质需要，支持两大主流写作软件：word、wps

3.参考文献格式全而准

该软件内部收录了2000多种国内外期刊的参考文献格式，随意切换格式。再也不用去下载稿约再逐条调整参考文献了，好省心有没有？

4.免费

不要笑，对于现在文献管理软件动辄两三百的价格，这很重要，要是小编的话，会把它排在第一位好吗

5.还有一点小编认为是非常重要的，那就是中华医学会旗下的所有编辑部的编辑老师们都在用这个软件校对文献了，你还在等什么呢？ PS：编辑老师用的是完整版《医学文献王》，如对完整版《医学文献王》感兴趣可前往医脉通网站（medlive.cn）免费下载。

说了这么多，到底有多容易呢？来看小编的操作：

无需启动软件，安装之后，启动word、wps的同时会自动启动。

假如你需要在word或wps的A处引用某条参考文献

第一步：搜索你要引用的参考文献，可按照标题、网址、pmid、关键词等搜索文献

第二步：搜索到需要引用的参考文献之后，一键完成引用

（点击文献右侧的按钮即可完成自动引用）

第三步：调整你需要的参考文献格式

Bingo,参考文献就这样妥妥地搞定了。足够简单吧？

》》》奉上下载链接：引文小助手

如果只是引用，不涉及编辑后的自动调整，用百度学术也是同样很快捷的。输入题名后检索，一般都能命中全文，点击引用，即可显示出引文格式。点击复制即可。百度学术提供很多全文链接，中英文都有，使用起来很方便。作为工具而言，可以大胆使用，不用顾虑既往对百度的讨伐

各位大咖们做科研时少不了看很对文献，看文献少不了 PubMed，在之前微信平台也推过关于PubMed的功能及检索途径与方法，在目前PubMed是国际上最重要、最权威的生物医学文献数据库之一。PubMed一经问世，就以其文献报道速度快、访问免费、使用方便、检索功能强大、外部链接丰富、个性化服务等众多优点而获得广大用户的青睐，已成为网络环境下科研人员及医务工作获取生物医学文献信息资源的首选。然而，面对庞大的数据库检索出来的结果，精细限定搜索范围显得尤为重要。

在大环境下， Pubmedplus 应运而生，它是在 Pubmed 基础上开发的用于辅助科研的分析型文献聚类系统。通过聚类分析，帮助科研人员了解该课题在国际上发展趋势与成熟程度，分析国内外同行研究进展，寻找合作者。通过主题共词分析帮助科研人员发现潜在的研究热点，引导其发散思维，寻找新的研究方向。通过期刊的聚类分析可以了解期刊的国际化程度、收录方向及国内作者发文命中的百分比等，为读者提供全方位的期刊投稿服务。

下面介绍 Pubmedplus 的功能，带你领略它的魅力，公众号：SCI医学科研论文助手（微信：678677）为您揭开它的神秘面纱。

关键词提取自动摘要相关开源项目

GitHub - hankcs/HanLP: 自然语言处理中文分词词性标注命名实体识别依存句法分析关键词提取自动摘要短语提取拼音简繁转换
https://github.com/hankcs/HanLP

文章或博客的自动摘要(自动简介) - 开源中国社区
http://www.oschina.net/code/snippet_1180874_23950

Python实现提取文章摘要的方法_python_脚本之家
http://www.jb51.net/article/64543.htm

自动摘要关键

一、关键词自动标注

1、关键词

关键词是指能够反映文本语料主题的词语或短语，是快速了解文档内容、把握主题的重要方式。

2、概述

关键词自动标注大概可以分为两大类，一为关键词分配，另一个为关键词提取。
关键词分配是从一个预先构建好的受控词表中推荐若干个词或者短语分配给文档作为关键词。
关键词提取是从文档内容中寻找并推荐关键词，而没有指定的词库。

3、关键词提取

关键词提取一般分为两个步骤，一是生成关键词候选表，二是采用算法选择关键词。

（1）生成关键词候选表

1）去除停用词
2）只提取指定词性的词，如，名词、形容词、动词等
3）其他规则筛选等

（2）算法选用

现有的算法根据是否依赖外部知识库，大致可以分为两大类：一是依赖外部知识库，如：TF-IDF等；二是不依赖外部知识库，如：Textrank等。
此外还有监督方法，将关键词抽取转为序列标注，或基于神经网络的方法等。

4、TF-IDF

TF-IDF是一种统计方法，用以评估一字词对于一个文件集或者或一个语料库中的其中一份文件的重要程度。
字词的重要随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。

（1）原理

词频，即TF，指的是某一个给定的词语在该文件中出现的次数，通常进行归一化。
逆向文档频率，即IDF，是一个词语普遍重要性的度量，通常由总文件数目除以包含该词语的文件数目得到的商取对数得到。
实际上可以将IDF看成一个重要性的调整参数，在词频的基础上，对每一个词分配一个重要性度量，最常见的词给与小权重，而最不常见的词给与大的权重，最后将词频与权重相乘得到某个词对文章的重要性度量。

5、TextRank

TextRank算法是基于GOOGLE的提出的pageRank算法改进而来，详细可以参考我的另一篇博文：pageRank

（1）原理

TextRank与pageRank不同之处，在于权重系数的增加：

（2）权重系数

在经过处理构造出候选关键词后，得到候选关键词表T = [C1, C2, C3…CN]
对于关键词表构建长度为K的窗口，当两个词A和B在该窗口中同时出现时，认为当前两个节点有关联，在pageRank中就是两个网页间有超链接跳转，对所有的词进行统计之后归一化，就得到权重系数，这也称为共现关系。
之后进行迭代计算，就得到关键词选项了。

二、自动摘要

自动摘要与关键词自动标注类似，是从文章中自动抽取出关键句。

1、概述

自动摘要主要分为两大类，一种是抽取式，即直接从文章存在的句子中抽取出最重要的几句作为关键句；另一种是生成式，这种方法在实现难度上远高于前者，在理解文章语义的基础上重新概括生成文本。
一般采用的都是抽取式方法进行自动摘要。

2、应用

自动文摘与关键词自动标注一样可以采用TextRank进行抽取，唯一不同的是权值的计算方式，这里可以用句子之间的相似性进行替代。
在自动摘要中，对文档进行断句，分词等预处理后，得到每个句子的词列表。之后可以使用文档相似度算法，如BM25等进行计算，得出的相似度作为权值进行迭代计算，最后得到评分最高的句子。

关于TF-IDF和TextRank算法，在python的jieba包中都有算法实现。

---------------------

关键词提取方法学习总结（TF-IDF、Topic-model、RAKE）

…………

自然语言处理

百度

接口能力

接口名称	接口能力简要描述
词法分析	分词、词性标注、专名识别
依存句法分析	自动分析文本中的依存句法结构信息
词向量表示	查询词汇的词向量，实现文本的可计算
DNN语言模型	判断一句话是否符合语言表达习惯，输出分词结果并给出每个词在句子中的概率值
词义相似度	计算两个给定词语的语义相似度
短文本相似度	判断两个文本的相似度得分
评论观点抽取	提取一个句子观点评论的情感属性
情感倾向分析	对包含主观观点信息的文本进行情感极性类别（积极、消极、中性）的判断，并给出相应的置信度
文章标签	对文章的标题和内容进行深度分析，输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度
文章分类	对文章按照内容类型进行自动分类
文本纠错	识别输入文本中有错误的片段，提示错误并给出正确的文本结果
对话情绪识别	针对用户日常沟通文本背后所蕴含情绪的一种直观检测，可自动识别出当前会话者所表现出的情绪类别及其置信度
中文分词	切分出连续文本中的基本词汇序列（已合并到词法分析接口）
词性标注	为自然语言文本中的每个词汇赋予词性（已合并到词法分析接口）

科大讯飞python自然语言处理-开放平台_注册可免费使用

自然语言处理(NLP) vs 自然语言理解(NLU)

自然语言处理-阿里云

排行榜自然语言处理

我把我曾经搜索的记录都记录下来。这都是方法。

文献检索下载工具

你可能感兴趣的:(文献助手)

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
微信小程序开发注意事项 jun778895 微信小程序小程序
微信小程序开发是一个融合了前端开发、用户体验设计、后端服务（可选）以及微信小程序平台特性的综合性项目。这里，我将详细介绍一个典型的小程序开发项目的全过程，包括项目规划、设计、开发、测试及部署上线等各个环节，并尽量使内容达到或超过2000字的要求。一、项目规划1.1项目背景与目标假设我们要开发一个名为“智慧校园助手”的微信小程序，旨在为学生提供一站式校园生活服务，包括课程表查询、图书馆座位预约、食堂
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
小学科学课堂管理规培有感 31c6a3d23d4e
今天进行了这学期的第一次新教师规培，又是干货满满的一次学习，两位有经验的老教师分享了自己很多年来有关科学教学的经验。苏老师的语言风趣幽默，通过他的课堂管理规则，懂得了语言的艺术。艳姐分享的培养小助手，对我的帮助很多，小组长，（做记录、整理材料、管理卫生）。既培养了学生，又减轻老师的工作量，还有评价表，学起来学起来！
2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
优惠券推广平台大盘点：这五个最受用户喜欢！高省_飞智666600
大家好，我是你们的聪明小助手。今天，我们来聊一聊最受用户喜欢的优惠券平台。高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。飞智导师高省邀请码666600（本邀请码为超级邀请人邀请码），注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。相信大家都很喜欢买买买，但是总感觉花的钱比心里预期的多。那么，有没有
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
抖音小黄车怎么开？抖音小黄车开通方法？日常购物技巧呀
抖音不仅可以刷短视频，用户还可以在抖音上卖商品，开通小黄车之后就可以卖商品啦，开通小黄车之前，需要申请开通商品橱窗功能；首先打开【抖音短视频】，点开界面右上角的【搜索图标】，搜索【电商小助手】，点击【电商小助手】；选中关注旁边的【私信】，选择界面下方的【申请入口】，点击【商品分享权限】，满足【实名认证】、【进阶要求】之后，选择界面下方的【立即申请】即可；开通商品橱窗之后，就可以挂小黄车啦，方法是不
simulink风光火储一次调频，风机,simulink二次调频AGC风电风机储能电动汽车水电火电二次调频科研_研学社 matlab
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、一次调频及风光火储应用二、二次调频（AGC）及多能源协调2运行结果3参考文献4Simulink仿真实现⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创
掌握ChatGPT：高效利用AI助手 kkai人工智能 chatgpt 人工智能媒体学习 ai
2023年3月15日，ChatGPT-4的诞生标志着人类进入了一个全新的人机协作时代。这个时代就像一个混沌初开的新世界，而ChatGPT则是这个新世界里诞生的一个新物种。这个新物种的心智如同一个四五岁的小孩，在与它频繁互动中，人们逐渐发现它既让人惊奇，又让人困惑。ChatGPT宛如一个“天才”儿童，自幼饱读四书五经，拥有着海量的知识储备。每次与它交流，都能让人发现它身上隐藏着无限的潜能。然而，令人
含光热电站、有机有机朗肯循环、P2G的综合能源优化调度（Matlab代码实现）冒泡芳能源 matlab 开发语言
‍个人主页：研学社的博客欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3参考文献4Matlab代码实现1概述光热发电(concentratingsolarpower，CSP）是一种新型可再生能源发电技术，具有低碳发电和高效储能的优势，但当前光热电站常充当单一发电源进行能源供应，其供能潜力未得到充分
推荐开源项目：Zotero引用计数管理器——学术研究的智能助手蔡鸿烈Hope
推荐开源项目：Zotero引用计数管理器——学术研究的智能助手zotero-citationcountsZoteropluginforauto-fetchingcitationcountsfromvarioussources项目地址:https://gitcode.com/gh_mirrors/zo/zotero-citationcounts项目介绍在学术界，每篇论文背后都承载着学者们辛勤的研究成
Zotero使用（一）PDF文件导入不会自动识别海绵波波107 论文（八股文）美化 pdf
上面两种，一种中文，一种英文，会发现，中文的导入进去之后不会自动识别，部分英文也是。不能自动识别就会缺少导出参考文献的功能，怎么办？发现之前导入喜欢使用PDF格式可以结合.ris格式，分开导入，这样都有了
服务器运维小技巧（二）——如何进行监控告警 baiolkdnhjaio 网络安全
服务器运维难度高的原因，很大程度是因为服务器一旦出现问题，生产环境的业务就会受到严重影响，极有可能带来难以承担的后果。因此这份工作要求工程师保持高要求的服务质量，能够快速响应问题，及时解决问题。但是“及时”的这一点很难做到，需要通过优化工作流程、建立预警系统，搭建自动化等行为快速响应。今天主要介绍如何通过服务器运维工具搭建监控预警的手段来辅助缩短响应时间。首先打开牧云主机管理助手，进入系统设置界面
#LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification 向日葵花籽儿 LLM入门教程笔记 prompt 分类数据库
在本章中，我们将重点探讨评估输入任务的重要性，这关乎到整个系统的质量和安全性。在处理不同情况下的多个独立指令集的任务时，首先对查询类型进行分类，并以此为基础确定要使用哪些指令，具有诸多优势。这可以通过定义固定类别和硬编码与处理特定类别任务相关的指令来实现。例如，在构建客户服务助手时，对查询类型进行分类并根据分类确定要使用的指令可能非常关键。具体来说，如果用户要求关闭其账户，那么二级指令可能是添加有
MATLAB|基于多时段动态电价的电动汽车有序充电策略优化科研工作站电动汽车 matlab 电动汽车动态电价场景分析无序充电有序充电粒子群
目录主要内容模型研究一、蒙特卡洛模拟部分代码部分结果一览下载链接主要内容该模型参考文献《基于多时段动态电价的电动汽车有序充电策略优化》，采用蒙特卡洛随机抽样方法来模拟电动汽车无序充电状态下的负荷曲线，并设置三个对比算例--基础场景（无电动汽车）、电动汽车无序充电和电动汽车有序充电场景，有序充电场景以电网端负荷差最小和用户侧充电成本最经济为目标，通过粒子群算法进行求解，程序采用matlab+matp
labview串口调试助手功能实现巧了猫也不知道 labview
目录1.功能实现1.1串口打开1.2串口配置参数1.3VISA关闭1.4串口读写1.5保存log1.6UI界面显示时间戳2.功能改进2.1串口选择和波特率判断2.2前面板设计2.3关闭程序运行2.4生成exe应用程序1.功能实现1.1串口打开利用while循环和事件结构来实现，鼠标按下打开串口按钮时，串口打开；利用按名称解绑函数检测串口状态。当VISA打开无错误输出时为假，进行取反；利用条件结构进
我有悄悄话对你说茌平张晓芬
我们每个人都有自己的小秘密，有时候我们会把它深埋在心底，有时候我们会把它写进日记本，锁在自己的小抽屉里，总之我们不会把它表达出来的。记得在我小时候，由于成绩好，也是老师的小助手，老师也很器重我，总感觉做什么事也比较有信心。而性格内向，成绩不好的学生不敢和老师说话，更别说问老师问题了。记得有一次，老师生病了，我约了几个成绩不错的同学去看老师，当时有个学习比较差的女生怯生生地问我：“我能和你们一起去看
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio