f12105212

NER概念系统梳理，转载于《传送门》

关于命名实体识别（Named Entity Recognition）的一些问题梳理，便于了解该领域的各种问题和处理思路：

什么是命名实体识别？

Q: 第一个问题：什么是命名实体识别？

A: 命名实体识别是将文本中的元素分成预先定义的类，如人名、地名、机构名、时间、货币等等。作为自然语言的承载信息单位，命名实体识别属于文本信息处理的基础的研究领域，是信息抽取、信息检索、机器翻译、问答系统等多种自然语言处理技术中必不可少的组成部分。

Q: 实体预先定义？

A: 我记得传统的 NER 任务主要是对七大类的识别，现在应该不局限了吧。

Q: 未定义怎么办，实体怎么定义？

A: 其他类？

A: 现在比较难识别的就是机构名称。

Q: 时间是实体吗？七大类是哪些？

A: 命名实体识别主要分类，一般包括 3 大类（实体类、时间类和数字类）和 7 小类（人名、地名、组织名、机构名、时间、日期、货币和百分比）。但随着 NLP 任务的不断扩充，在特定领域中会出现特定的类别，比如医药领域中，药名、疾病等类别。

A: 应该加上迁移学习和强化学习，来自动对未定义进行定义或扩充。

A: slot filling 算是广义的 NER。

Q: 开放领域有哪些通用的 slot 比较有意义？

A: 150 类的细粒度。

Q: 有 paper 讲这个颗粒度吗？

A: 这个类，感觉和知识图谱中的 type 还是有些不一样的。

A: 类别估计的确有很多吧。但是细分不细分肯定是按照不同的 task 来分的，可能有的数据集只是分 7 类。

A: 一般作细粒度实体识别的 paper 里面会给出划分的类别数和每个类别具体是什么。

Q: NER 会分限定域和开放域么?？

A: NER 会针对具体 domain 区分，开放域的话应该就是指传统的三大类和七小类了。

A: 例如对话的 slot，比如说，特定领域：音乐领域，歌手，歌曲，曲风这些 slot。

A: 估计大家在实际用到 NER 的时候，这些类别都是根据自己的领域来定的吧。

A: Context-Dependent Fine-Grained Entity Type Tagging，https:// arxiv.org/abs/1412.1820，这篇文章提到一些细分的类别。

A: 谈论中提到 wikipedia 中对 NER 类别在垂直领域的情况介绍：

https://en.wikipedia.org/wiki/Named-entity_recognition

➋

命名实体识别的应用场景？

Q: 第二个问题是 NER 的应用场景, 以及可能遇到的问题（换成 slot 抽取的应用场景吧）

A: 知识图谱，文本理解，对话意图理解，舆情分析，对话 NLU 任务。

A: QA 任务, QA 本身的语言理解也需要 slot 抽取。

A: 指代消解，Chatbot，实体链接，知识抽取，关系抽取。

A: Domain knowledge，concept map for education。

A: NMT，但是非常少。

Q: 对，这些都是用到 NER 的一些 task，大家在工业中通常都会在哪些领域用到呢？

Q: 舆情分析做 NER 一些组织机构名的简称各位是怎么处理的？

Q: 怎么标注 NER 的？

A: 比如新闻推荐里，你关注哪个小公司，关注哪个小明星，这些都要识别出来。

A: 定义需要标注的实体，然后标注，但是标注总有些错误。我们之前是一部分从全称用规则生成了，另外一部分是网上找的相关资源。

Q: 怎么在源头有好的方法，标注高质量的数据？这部分成本很高。

A: bootrap 种子迭代，类似于爬虫。

A: QA 里说个地方，人名，也要有识别。

A: 是的，当用户提出一个问题，要理解 query 的意图，NER 也是必须的。

A: 是人标的就会出错，对于一些细分领域，一般人还标不来。

A: 现在工业界基本上都是看天吃饭，一个分词库里有，一个句法分析。

Q: 句法分析怎么用

A: bootstrap 是不是可以适当减少人工量，相当于半自动化。

A: 哈工大 ltp 会识别一些。

A: 迭代的学习模式，根据句法分析的结果，加一点规则是不是可以标出一批比较高质量的数据？

A: 前提是句法分析的结果要准。

Q: 目前 parser 的效果如何？如果开放 yu 句法分析结果准，基本实验人工智能了吧。

A: 我没有实际做过，之前有想过，就是先人工标一点，在那机器跑一批未标注的语料，然后将标注好的继续训练，反复迭代，各位大神是不是这样呢？

A: 中间过程会增加种子集，那部分种子也需高质量。

A: 首先选一部分的高质量种子学习模式，然后用学习到的模式去训练未标注数据，再获得一批高质量的种子，加入到原来的种子集，作为新的种子集再训练模式，依此迭代。

A: 标注语料是开展 NER 工作最大的难题，目前我也正在尝试的方法就如上所述，因为针对特定领域，类别属于自定义，所以需要从零开始构建标注语料，不过最终的效果如何还在进行尝试中。

➌

目前做 NER 的主流方法是什么？

Q: 看来标注语料一直是个比较大的问题，不过回到 NER 的话题上，我们接下来先讨论一下目前做 NER 的主流方法吧。

A: 这个是之前一个人回答的，大概谈了NER 中模型发展的历史：有一些，大致如下：MLP->LSTM->LSTM/CNN+CRF->BiLSTM+CRF- >BiLSTM+CNN+CRF。

A: 提到技术，是不是大家都是用的 CRF，除了目前最新的深度学习。

A: 句法分析规则加概率方法最好。

A: 以前的话，做 NER 主要是最大熵马尔可夫或者 CRF，现在应该都和深度学习结合了。

A: 最好是有记忆加规则加概率。

Q: 大家有不用 CRF 效果超过用 CRF 的吗？

A: 感觉 CRF 在 NER 里面的作用还是很大的。

A: CRF 只能反应部分条件关系。

A: 所以现在最好的模型是 BiLSTM+CNN+CRF 么？

A: 融入词典特征会有明显提高

A: 神经网络处理序列问题不佳，可以发明可以描述序列关系的因果网络。

A: GCNN 和 DBLSTM 差不多貌似，语料好的话，貌似用几层全连接网络效果就不错，对于两三层网络而言。

A: 是不是现在的深度学习都要很多层？

A: 要看你句子长度，我是 100word，所以是 20x5 之类的, 10x10 也试过。

Q: 我想问个简单的问题，目前用 DL 框架做 NER 是不是都要先做 word2vec？

A: 用字向量，会避免分词的错误。

A: 对认为一个字是个词，跑 word2vec。

A: GCNN 原文貌似也是有残差？

Q: GCNN 算比较新的工作，目前有出来用 GCNN 来做 NER 的工作么？

A: multi task 这块 memory 需要针对任务设计比较好的读写机制。

A: 先做 word2vec 可以提供一定的泛化能力。

A: gated CNN，之前 Facebook 出来那个工作，Gated CNN 做语言模型有论文，可以参考。

Q: 问个问题，模型的词嵌入层一般是用的 word2vec 吗？还是有其它的设定？

A: 一般都是的吧，或者 glove。

A: 字向量之外，我看还有 position embedding 之说。

Q: NER 可以识别汽车品牌吗？比如奥迪 A3，奔驰 GLK。

Q: 不分词识别机构名这种长的实体效果怎么样？

A: position embedding 一般是在关系抽取中比较重要。

Q: 那对于最开始的输入向量使用 one-hot 好点还是用一些现有的 word2vec 模型得道最初的初始输入向量好一点呢？

A: 字的 embedding 是 character embedding，微软做阅读理解的任务有用。

A: lstm 本来就不需要 position，cnn 用。

A: word2vec 的结果的基础上做聚类，相近的词距离比较近，用欧式距离。

A: position embedding，就是引入时序信息。

Q: GCNN 需要用 position embedding 吗？

A: CNN 需要 position。

Q: character embedding 说的是一个一个字母吗还是？

A: 英语环境下是字母，中文就是字了。

A: 举个例子：用 CNN 来做关系抽取，这时候 ner1 ner2 之间的 position，就是一个非常强的特征，需要加进来。

A: 所以现在做 NER 主流还是基于深度学习，也主要用 RNN，由于 GCNN 是一个比较新的工作，所以在 NER 上可能也有进步，欢迎大家深入研究了。

A: 对，很想听大家分享 GCNN 的经验，是不是层数深会有效果，毕竟有人做出效果了，虽然是据说。

A: CNN 的主要优势应该是速度够快吧，效果和 RNN 没有明显差距。

➍

目前 NER 能达到的效果，取决于什么？

Q: 目前 NER 能达到什么样的效果，取决于什么？

Q: 论文中，NER 一般能做到多高的准确率？工业界一般又是多少呢？

A: 好像 MSRA 的一个 NER 数据是目前最难做的开放 NER 任务？

Q: 现在的简单三类别的 NER 在特定领域效果很好？

A: 用 Stanford NLP 工具感觉效果还不错。

Q: ccks 好像也有 NER 的任务是吧？

Q: 还有哪些开放任务评测？

Q: NER 是不是一般准确率都可以做到 0.9？

Q: 我要听赵雷的成都, 成都算地名吗？怎么抽不出来？

A: 算啊，地名和歌曲都算。

Q: 实体关系挖掘方法有哪些？

Q: 一般中英文分别用什么数据集来做实验？

A: MSRA 的我看了个 14 年的 paper 貌似 f 只有 80 多。

A: 但是我之前写小论文的时候，做了个实验，发现句子长度对 NER 影响还是很大的。

A: 主要是那些不常见的实体识别效果。

Q: 句子长度越长，越难抽么？context 信息不是多了比较好么？

A: 分词后抽实体名词的，效果蛮好的。

A: 看模型，Standford 的那个工具好像里面加入了 crf 和 lstm 吧。

Q: 请教个弱智问题：训练字向量的话，英文和数字怎么处理呢？比如 “华为 P10”。

A: 短实体，其实用字挺好。

➎

NER 常用的数据集、工具、评测任务有哪些？

Q: 聊一聊 NER 的现成工具吧，大家平时会用工具来做 NER 么，会用哪些工具？

A: NLTK 工具也挺好。

A: snownlp

A: Spacy 也有 NER 功能，不过貌似支持英语和德语。

A: 总结来看，常用的用 Stanford、NLTK、snownlp，另外也可使用哈工大 LTP 云和 bosonnlp api，虽然不见得效果就一定准确，但利用多种方式进行处理毕竟是方便些。

➏

目前主流 NER 方法有哪些缺陷，进一步研究可从哪些方面入手？

Q: 目前主流的 NER 方法有哪些缺陷？进一步研究可以从哪些方面着手？

A: 实体关系挖掘。

A: 时间、地点、人名方面。

A: 实体和关系联合提取会不会加大实体识别的精确度。

A: 联合提取还没尝试，不知道实际工作中操作难度大吗？

A: 结合 KB 不是觉得效果好，就是效果好，lexical 的特征，效果提升明显。

A: blstm + (CNN) + crf + lexical 特征。

A: 我国学者在 ACL 2017 发表的实体和关系联合提取论文：

http://ir. ia.ac.cn/bitstream/173211/14344/1/%5B17-ACL%5D%20Joint%20Extraction%20of%20Entities%20and%20Relations%20Based%20on%20a%20Novel%20Tagging% 20Scheme.pdf

Q: kb 的知识清洗，有没有研究？

A: 将实体关系抽取转换为序列标注任务, 实体关系全部加标签。

A: 貌似好多问题都可以规约到序列标注问题。

A: 是的，像 pos tagging，分词这些基本任务都可以。

A: NER，CHUNK 和 SRL 也都是序列标注问题。

A: 其实 NER —> slot 抽取—> 序列标注。

A: 也可以规约到分类问题。

A: 关于方法，还是推荐 +lexical 特征。

Q: 在 bilstm crf 框架下, 中文有些什么 lexical 特征？

A: 偏旁部首这种么？

A: 就是他们刚刚说的 KB，说得高端点加 KB，其实就是词典。

A: 这算是结合外部知识了，其实是为了丰富 context。

A: 然后再转换为向量。

A: 推荐一篇结合 KB 的无监督方法：2016 Lifu Huang Building a Fine-Grained Entity Typing System Overnight for a New X (X = Language, Domain, Genre)

A: 另一篇文章基于 KB：

http://dl.acm.org/citation.cfm?id=3052708

A: +lexical 特征论文：Training Deep Neural Networks on Noisy Labels with Bootstrapping，https://arxiv.org/abs/1412.6596

A: +lexical 论文：Named Entity Recognition with Bidirectional LSTM- CNNs，https://arxiv.org/abs/1511.08308

A: 超大规模训练数据，加 crf 不现实，我一般就不加了直接基于 token 的。

A: 造数据主要是注意两点，一个是噪音，一个是要有足够的泛化能力。

A: 可以认为 baike anchor 是天然的标注，百度百科矛文本。

❼

如何从自然文本中生成用于训练 NER 模型的数据集？

Q: 大家是不是都是自己人工标注的呀？

A: 还是猪八戒网之类的找众包，还是直接用公开的语料集。

A: 亚马逊还专门搞了一个数据标注平台。

A: 还有个百度众包平台。

A: 数据集本身也可以发文章，比如这个会：

The International Con- ference on Language Resources and Evaluation，http://www.lrec-conf. org/

A: 从讨论内容来看分为两种情况，研究性用途可能会基于一些公开数据集或者手工标注少量数据，但实际生产中会选择众包和从其他数据源利用规则策略两种方式构造标注数据集。

你可能感兴趣的:(NER概念系统梳理，转载于《传送门》)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
Vue3+Vite+TS+Axios整合详细教程老马聊技术 Vue Vite TS vue.js
1.Vite简介Vite是新一代的前端构建工具，在尤雨溪开发Vue3.0的时候诞生。类似于Webpack+Webpack-dev-server。其主要利用浏览器ESM特性导入组织代码，在服务器端按需编译返回，完全跳过了打包这个概念，服务器随起随用。生产中利用Rollup作为打包工具，号称下一代的前端构建工具。vite是一种新型的前端构建工具，能够显著的提升前端开发者的体验。它主要有俩部分组成：一个
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
微软 Bluetooth LE Explorer 实用工具的详细使用分析悟空胆好小 microsoft
微软BluetoothLEExplorer实用工具的详细使用分析文章目录微软**BluetoothLEExplorer**实用工具的详细使用分析1.**工具定位与核心功能**2.**关键特性与更新**3.**使用场景示例**4.**系统要求与依赖**5.**与专业工具对比**6.**局限性**7.**实践建议**结论以下是微软BluetoothLEExplorer实用工具的详细使用分析：1.工具定
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
android判断深色模式的方法东东旭huster android java 开发语言
android10以后的版本才完全支持深色模式，测试下面两种方法判断系统是否深色模式都是有效的。publicstaticbooleanisDarkMode1(){if(Build.VERSION.SDK_INT
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，