Iohboel

SANAPHOR: Ontology-Based Coreference Resolution笔记

这篇文章是iswc（International Semantic Web Conference）2015年的论文。属于Entity Resolution and Linking类别

要记笔记，就写在这里啦。方便以后查看（2016/4/13）

读了TRank，以及BLANC里面的metric。（2016/4/14）

修改及整理了一些内容(2016/4/16更新)

-----------------------------------------------------------我是分割线-----------------------------------------------------------------------------------------------

Coreference Resolution&Anaphora Resolution

共指消解与指代消解

共指就是两个mention指向的同一个entity；e.g:iphone 和苹果手机（虽然貌似需要语言一样==）

指代就是后面的mention需要前面的mention来解析，存在一定的关系；e.g:（小明迟到了，这真是奇怪。”这“需要”小明“来解析，但是属于不同的entity，一个指的是一件事，一个指的是一个人）

两者的结合就是，后面的mention需要前面的mention来解析，并且两个mention指的是同一个entity。e.g:(还是前面的例子，小明迟到了，他不经常迟到的。”他“需要前面的”小明“来解析，而且两个都是指小明这个人)。

Named Entity Recognition(NER)命名实体识别

最大熵模型与条件随机域模型

最大熵统计模型获得的是所有满足约束条件的模型中信息熵极大的模型; 条件随机域模型允许在观察序列上的任意的依赖关系, 并且特征不需要一定是一个完整的状态或观察值, 因此, 可以期待用较少的训练数据来训练出模型。

ontology&entity&mention（这三个名词真是==）

本体&实体&提及

本体就是一个比较虚的东西，来自哲学概念，主要指的描述概念及概念之间关系的概念模型,通过概念之间的关系来描述概念的语义。

实体就是mention指向的东西，具有实际的意义。

提及就是在文中提到的短语什么的。

总的来说就是一个文本中会有很多mention；这些mention可能指向同一个实体，或者不同的实体；然后这些实体可能都属于一个本体类别下（比如都属于语言学等等）。

参考资料：

本体一词是指对客观世界存在的事物的系统描述，在信息科学的领域中，1991年Neches等人最早给出的定义是：给出构成相关领域词汇的基本术语和关系，以及利用这些术语和关系构成，规定这些词汇外延规则。1993年Gruber将其定义表述为“概念模型的明确的规范说明”。1997年Borst进一步完善了该本体的定义，表述为“共享概念模型的形式化规范说明”，增加了“共享”和“形式化”两个限定语。1998年Studer等人在对Gruber和Borst的定义进行了深入研究后，将本体进一步表述为“共享概念模型的明确的形式化规范说明”并从此形成了目前信息学界对本体概念比较一致的看法。

根据斯坦福大学医学院发本体的构建七步法，构建本体有如下七个步骤：

（1）确定本体的专业领域与范畴

（2）考察复用现有本体的可能性

（3）列出本体中的重要术语

（4）定义类和类的等级关系

（5）定义类的属性

（6）定义属性的分面

（7）创建实例

以上所述的七步法仅适用于某一专业或学科领域本体的构建。

本体的体系结构主要包括3个要素：核心元素集、元素间的交互作用以及这些元素到规范语义间的映射关系。对于本体的一般构造过程，可以用以下公式进行表示：

本体 = 概念（Concept）+ 属性（Property） + 公理（Axiom）+ 取值（Value）+ 名义（Nominal）

从以上的一般公式中，我们还可以归纳出本体当中的基本关系类型，共有四类：

（1） part-of关系，表达概念之间部分和整体的关系

（2） kind-of关系，表达概念之间的集成关系

（3） instance-of关系，表达概念的实例和概念之间的关系

（4） attribute-of关系，表达某个概念是另一个概念的属性

DBpedia&Wikipedia&YAGO

DBpedia：

关联数据是一种推荐的最佳实践，用来在与以往中使用URI和RDF发布、分享、连接各类数据、信息和知识，发布和部署实例数据和类数据，从而通过HTTP协议解释并获取这些数据同时强调数据的相互关联、相互联系以及有益于人际理解的语境信息。在目前的具体实践中，数据往往以RDF文件的形式发布到互联网络上，存储在关联数据知识库中。而大多数需要使用这些关联数据的网站可以直接从在线关联数据知识库的数据接口获取RDF文件并提取其中的相关信息反馈给用户，从而实现信息和数据的跨网站共享。从上面不难看出，在线关联数据知识库在当前的关联数据语义网构想中占据着核心位置。

DBpedia就是这样一个在线关联数据知识库项目。它从维基百科的词条中抽取结构化数据，以提供更准确和直接的维基百科搜索，并在其他数据集和维基百科之间创建连接，并进一步将这些数据以关联数据的形式发布到互联网上，提供给需要这些关联数据的在线网络应用、社交网站或者其他在线关联数据知识库。同时，与一些同时期的关联数据知识库项目不同，DBpedia提供的关联数据知识内容并不受限于某一较小的专业或学科领域，到2012年为止，DBpedia知识库项目已有超过3640000个条目，这些条目涉及人名、地名、音乐专辑、电影、组织、种族等等多个类目。在大数量和宽范围的前提下，DBpedia知识库的条目组织就成为决定其运行效率的关键因素。DBpedia知识库以构建本体的形式对条目进行组织，起到了一定的效果。

在DBpedia知识库一例中，由于所需要构建本体的是维基百科条目，因此其专业领域与范畴无法简单确定，因此在DBpedia的本体构建中，采用了类似于以叙词表为基础的自动化本体转换的方式。但同样的，维基百科的词条表并非规范的叙词表，其类目划分也无法简单归于某一专业分类之下，词语的专指度不可避免的出现不足，因此，在DBpedia的本体构建中，类目划分和定义基本是人工完成，之后的条目转换才使用了自动转换的方式。

Semantic Annotation（语义标注）

实现语义网目标的一个重要前提是利用本体词汇标注 Web 资源。本体在 Tim Berners-Lee提出的语义网的七层体系结构中位于第四层，其目的是为捕获相关领域的知识，提供对该领域知识的共同理解，确定该领域内共同认可的词汇，并给出这些词汇（术语）和词汇间相互关系的明确定义，通过概念之间的关系来描述概念的语义[16]。基于本体的语义标注利用由专家定义好的本体支持内容创建者在 Web 页面中添加语义元数据，使其内容能被人和机器所理解，与大众标注相比较这是一种自顶向下的分类法，属于受控词汇的标注方法。利用语
义标注工具可以对现有的大量 Web 信息进行标注，使得当前的 Web 页面内容成为机器可识别的数据，从而构成语义网的基础.

语义标注与词义消歧（ WSD， word sense disambiguation）本质上属于同一个问题，都是根据上下文决定词语的意义。但严格上讲，语义标注与 WSD有一定的区别， WSD 主要是针对一词多义的现象提出的，一般要给出词在所处语境中的释义，而语义标注则是一种广义的词义区分，所用的类别标签通常较为抽象.

语义标注的方法目前来说有3类①人工标注，由专门人员确定标注资源适用的概念集、解析资源内容结构、选择元数据元素、建立用RDF或HTML语言标记的语义数据。这个过程往往在一定编辑器、概念集和标注过程知识库支持下进行，是一个智力密集和劳动密集过程，难以应付浩瀚和不断变化的网络资源。②领域文档类型定义(DTD)和文档模式进行概念映射和标注。由于SGML／XML文档的DTD或Schema详细定义文档内容结构和各内容元素，我们可以建立特定概念和特定DTD／Schema之间的映射关系，从而自动地将SGML／XML文档中的DTD／Schema内容元素标记转换为对应的概念元数据标注。但由于DTD／Schema的适用领域及其体系结构往往不协调不兼容，因此难以准确映射，还需要人工进行审查和修改。③利用词汇语义分析进行标注，自动词汇抽取和分析技术已较成熟，可在此基础上建立词汇集合与概念类别之间的映射关系，然后通过自动词汇分析找出文档或文档片断的概念类别，甚至与其它类别的语义关系，利用这些概念类别进行标注。该标注方法最好限制在一定的应用领域和资源类型内，而且需要进行人工审查。
语义标注工具，网站http：／／annotation．semanticweb．org／tools列出了目前已有13种工具：KIMSemanticAnnotationPlatform、Onto mat Annotizer、MnM、SHOE Knowledge Annotator、Annotea，Annozilla，SMORE，Yawas，Melita，GATE，Briefing As—sociate、SemanticWord和SemanticMarkupPlug—inforIntemetExplore。从本体技术的角度上来说，现有工具普遍存在以下的不足旧：①没有工具支持最新的本体语言OWL：②多数工具不支持本体词汇扩充，这与语义Web的应用环境相悖：③语义标注过程中本体查询、辅助推理支持以及元数据产生的自动化程度还不够。

entity linking

实体连接：就是把mention连接到具体指的什么时实体上面去。分为三步：mention detection, link generation, and disambiguation
涉及方法及技术<待补充>

LDA&Interger Linear Programming

<待补充>

TRank

是一个给实体类型排序的系统。具体详情

论文：TRank: Ranking Entity Types Using the Web of Data

文章出现三次对论文TRank的引用：

1）In the context of this paper, both NER and Entity Linking are prerequisites for coreference resolution as we take advantage of external knowledge to improve
the resolution of coreferences and hence must first identify and link as many entity mentions as possible to their counterparts in the knowledge base. Since,
however, those two tasks are not the focus of this work, we decided to use in this paper the TRank pipeline because of its simplicity and its good performance inpractice on our dataset (前言部分entity linking)

2）TRank is a system for ranking entity types given the textual context in which they appear（前言部分 entity types）

3）For the mentions linked in the previous step, we employ the mappings between DBPedia and YAGO ontologies provided by TRank Hierarchy to map DBPedia types to YAGO ones.(semantic annotation部分，semantic typing)

文章的4部分 Approaches to Entity Type Ranking

主体结构为：输入网页->利用NER选取出entity->得到entityURI->得到URI的所有types URI->排序type

First,given a Web page (e.g., a news article), we identify entities mentioned in the textual content of the document using state-of-the-art NER focusing on persons,locations, and organizations.

Next, we use an inverted index constructed over DBpedia literals attached to its URIs and use the extracted entity as a query to the index to select the best-matching URI for that entity.
Then,given an entity URI, we retrieve (for example, thanks to a SPARQL query to a knowledge base) all the types attached to the entity.
Finally, our system produces a ranking of the resulting types based on the textual context where the entity has been mentioned

排序的方法：
The proposed approaches for entity type ranking can be grouped in entity-centric, context-aware, and hierarchy-based

主要方法介绍：

(a)Entity-Centric Ranking Approaches
PREQ:根据类型在背景知识库下面的频率（frequency），

WIKILINK:利用给定的实体和背景知识库的拓展实体的关系。对相邻实体进行计数，可以利用SPARQL来做。

LABEL:舍弃文本相似的方法，计算标签e与背景知识库中其他的标签的TF-IDF相似度来找到关联实体，使用最相关的实体来给e的类型排序。挑选出top-10个与e有最相似的标签的实体，基于frequency对实体排序。

(b)Context-Aware Ranking Approaches

SAMETYPE：当相同的URI类型被e和e'使用的时候，或者e和e'有共同的标签的时候，是一个匹配。
PATH：利用类型层次和e出现的上下文。根据从root到t的路径的相似度来排序。

(c)Hierarchy-Based Ranking Approaches
使用类型层次评估实体类型ti关联到实体e的深度来评价关联性。
ANCESTORS：how many ancestors ofti∈Teare also a type ofe. That is, ifAncestors(ti) is the set of ancestors of tiin the integrated type hierarchy, then
we define the score oftias the size of the set{tj|tj∈Ancestors(ti)∧ tj∈Te}.
For example, in Figure 3c we rank first the type ‘Actor’ because ‘Person’ is its ancestor and it is also a type of e. On the other hand, the type ‘Humanitarian Foundation’ has a bigger depth but no ancestor which is also a type of e.
ANC_DEPTH:considers not just the number of such ancestors oftibut also their depth

使用训练集找到最好的方法来联合不同的技术，使用决策树和线性回归模型来联合排序的方法。决策树使用M5。

TF-IDF

TF词频(Term Frequency)，表示词条在文档d中出现的频率

IDF逆向文件频率(Inverse Document Frequency)。IDF的主要思想是：如果包含词条t的文档越少，也就是n越小，IDF越大，则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m，而其它类包含t的文档总数为k，显然所有包含t的文档数n=m+k，当m大的时候，n也大，按照IDF公式得到的IDF的值会小，就说明该词条t类别区分能力不强。但是实际上，如果一个词条在一个类的文档中频繁出现，则说明该词条能够很好代表这个类的文本的特征，这样的词条应该给它们赋予较高的权重，并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处

词频（term frequency，TF）指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数(term count)的归一化，以防止它偏向长的文件。（同一个词语在长文件里可能会比短文件有更高的词数，而不管该词语重要与否。）对于在某一特定文件里的词语来说，它的重要性可表示为：

式子中分子是该词在文件中的出现次数，而分母则是在文件中所有字词的出现次数之和。

逆向文件频率（inverse document frequency，IDF）是一个词语普遍重要性的度量。某一特定词语的IDF，可以由总文件数目除以包含该词语之文件的数目，再将得到的商取对数得到

|D|：语料库中的文件总数

：包含词语的文件数目（即的文件数目）如果该词语不在语料库中，就会导致分母为零，因此一般情况下使用作为分母

TF-IDF

某一特定文件内的高词语频率，以及该词语在整个文件集合中的低文件频率，可以产生出高权重的TF-IDF。因此，TF-IDF倾向于过滤掉常见的词语，保留重要的词语

Metrics

Recall&Presicion&F1
召回率：Recall，又称“查全率”。
准确率：Precision，又称“精度”、“正确率”。

在一个大规模数据集合中检索文档时，可把集合中的所有文档分成四类：

相关的不相关的

检索到的 A B

未检索到的 C D

A：检索到的，相关的（搜到的也想要的）
B：检索到的，但是不相关的（搜到的但没用的）
C：未检索到的，但却是相关的（没搜到，然而实际上想要的）
D：未检索到的，也不相关的（没搜到也没用的）

通常我们希望：数据库中相关的文档，被检索到的越多越好，这是追求“查全率”，即A/(A+C)，越大越好。
同时我们还希望：检索到的文档中，相关的越多越好，不相关的越少越好，这是追求“准确率”，即A/(A+B)，越大越好。

归纳如下：
召回率：检索到的相关文档比库中所有的相关文档
准确率：检索到的相关文档比所有被检索到的文档

“召回率”与“准确率”虽然没有必然的关系（从上面公式中可以看到），然而在大规模数据集合中，这两个指标却是相互制约的。
由于“检索策略”并不完美，希望更多相关的文档被检索到时，放宽“检索策略”时，往往也会伴随出现一些不相关的结果，从而使准确率受到影响。
而希望去除检索结果中的不相关文档时，务必要将“检索策略”定的更加严格，这样也会使有一些相关的文档不再能被检索到，从而使召回率受到影响。

凡是设计到大规模数据集合的检索和选取，都涉及到“召回率”和“准确率”这两个指标。而由于两个指标相互制约，我们通常也会根据需要为“检索策略”选择一个合适的度，不能太严格也不能太松，寻求在召回率和准确率中间的一个平衡点。这个平衡点由具体需求决定。

Recall：the ability to remember sth. that you have learned or sth.that has happened in the past.
Recall就是指：检索系统能“回忆”起那些事的多少细节，通俗来讲就是“回忆的能力”。能回忆起来的细节数除以系统知道这件事的所有细节，就是“记忆率”，也就是recall——召回率。

F-Measure是Precision和Recall的加权调和平均：
F=(a*a+1)P*R/(a*a(P+R))
当a=1时，就是常见的F1
F1=2*P*R/(P+R)
可见，当F1较大时，实验结果比较理想

参考网址：

[1] DBpedia知识库本体分析
[2] 张坤, 刘妍, 王达. 针对最大熵模型和条件随机域模型的研究[J]. 黑龙江科技信息, 2007(12X):31-31.
[3] 傅柱, 王曰芬. 语义标注研究的发展与趋势[C]// 全国知识组织与知识链接学术交流会. 2013.

[4]时念云, 杨晨. 基于领域本体的语义标注方法研究[J]. 计算机工程与设计, 2007, 28(24):5985-5987.
[5] Tonon A, Catasta M, Demartini G, et al. TRank: Ranking Entity Types Using the Web of Data[M]// The Semantic Web – ISWC 2013. Springer Berlin Heidelberg, 2013:640-656.

[6] Lee H, Peirsman Y, Chang A, et al. Stanford's multi-pass sieve coreference resolution system at the CoNLL-2011 shared task[C]// Proceedings of the Fifteenth Conference on Computational Natural Language Learning: Shared Task. Association for Computational Linguistics, 2011:28-34.

[7]http://blog.sina.com.cn/s/blog_4a1853330100l4xw.html
[8]http://baike.baidu.com/link?url=_p0KLUg2qX2p7qXuhPSIQT8MVc2eUP0aYeOR9MkPu95vvql92Kl4sCeHZ3eLJ__zl4XUVmukbaFTqehHkGhRaa

[9] Recasens M, Hovy E. BLANC: Implementing the Rand index for coreference evaluation[J]. Natural Language Engineering, 2010, 17(4):485-510.

DeepSeek-R1模型1.5b、7b、8b、14b、32b、70b和671b有啥区别？ facaixxx2024 AI大模型人工智能算法深度学习
deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b有啥区别？码笔记mabiji.com分享：1.5B、7B、8B、14B、32B、70B是蒸馏后的小模型，671B是基础大模型，它们的区别主要体现在参数规模、模型容量、性能表现、准确性、训练成本、推理成本和不同使用场景：deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b参数规模参数规模的区别，模
A survey on instance segmentation: state of the art——论文笔记栀子清茶 1024程序员节论文阅读计算机视觉人工智能笔记学习
摘要这篇论文综述了实例分割的研究进展，定义其为同时解决对象检测和语义分割的问题。论文讨论了实例分割的背景、面临的挑战、技术演变、常用数据集，并总结了相关领域的最新成果和未来研究方向。实例分割的发展从粗略的对象分类逐步演变为更精细的像素级别推理，广泛应用于自动驾驶、机器人等领域。论文为研究人员提供了对实例分割领域的全面了解和有价值的参考。一、简介第一部分“简介”主要介绍了实例分割的背景、定义和挑战。
Python第二十三课：自监督学习 | 无标注数据的觉醒程之编 Python全栈通关秘籍 python 开发语言人工智能机器学习
本节目标理解自监督学习的核心范式与优势掌握对比学习（ContrastiveLearning）框架实现图像掩码自编码器（MaskedAutoencoder）开发实战项目：亿级参数模型轻量化探索数据增强的创造性艺术一、自监督学习基础（AI的拼图游戏）1.核心思想解析学习范式数据需求生活比喻监督学习海量标注数据老师逐题批改作业无监督学习纯无标签数据自学杂乱笔记自监督学习自动生成伪标签玩拼图游戏（根据碎片
简单工厂模式、工厂方法模式、抽象工厂模式对比学习笔记 idgoodbye 简单工厂模式工厂方法模式抽象工厂模式
工厂模式架构设计原则开闭原则：是指一个软件实体（如类、模块和函数）应该对扩展开放，对修改关闭。依赖倒置原则：是指设计代码结构时，高层模块不应该依赖低层模块，二者都应该依赖其抽象。抽象不应该依赖细节，细节应该依赖抽象。单一职责：是指一个类只负责一个主要任务，避免因一个类负责两个以上任务时，修改其中一个任务代码导致另一个任务代码受到连带影响。接口隔离原则：是指用多个专门的接口，而不使用单一的总接口，客
Spring-Boot学习笔记戴帽子的小熊猫学习笔记学习笔记 spring boot
这个笔记是在自己学习的过程中根据实际用到的和学到的整理出来的，可能会有缺失，错误等，主要是给激励自己学习，遇到写不下去的情况给自己一个参考，请各位大佬发现问题提出问题时能嘴下留情，也希望多提建议，谢谢。本笔记长期更新（更新日期2024年9月21日）目录第1章.固定格式参考1.1application.yml1.2mapper.xml(详细操作见另一个文件[XML数据库操作笔记]())1.3appl
html css 笔记小箌 html css 笔记
01_浏览器相关知识五大主流浏览器：ChromeSafariIEFirefoxOpera(拥有自己的内核)四大内核:webkitTridentGeckoblink.02_网页相关知识构成网址网站网页网页标准：结构表现行为分别对应HTMLCSSJavaScript03_HTML简介HTML是什么译为：标记语言超文本：比普通的文本信息含量更多04_HTML初体验保存：Ctrl+S后缀：.html程序员
Linux命令学习笔记之 network NetworkManager kfepiza OS操作系统 Windows Linux 等 #Linux CentOS Ubuntu 等 linux 学习 centos
networkNetworkManager前言CentOS7最小安装下的测试220511心得:启动network能打开网络,关闭network能关闭网络启动NetworkManager能打开网络,关闭不会关闭网络在两者都启动的情况下,单停network会断网,单停NetworkManager不会一些摘抄前言这两个东西在centOS7最小安装无勾选附加时就存在Ubuntu20.04中只有Networ
AI技术学习笔记系列001：FastLanguageModel.get_peft_model 函数各参数的详细解释新说一二人工智能学习笔记
以下是关于代码中FastLanguageModel.get_peft_model函数各参数的详细解释，以及企业实际微调时的选择考量：参数详解及对微调的影响1.r=32（秩）作用：控制LoRA适配器的低秩矩阵的维度（秩），直接影响可训练参数数量。影响：r越大：适配器表达能力更强，能捕捉更复杂的任务特征，但可能导致过拟合（尤其数据量少时），训练时间和显存占用增加。r越小：参数量少，训练更快，显存占用低
【虚幻C++笔记】枚举UENUM、结构体USTRUCT OSwich 虚幻C++笔记虚幻 c++笔记
目录枚举(UENUM)第一种:使用命名空间第二种:继承uint8通过申明class类别名来替代结构体(USTRUCT)枚举(UENUM)第一种:使用命名空间UENUM(BlueprintType)namespaceMyEnumType{enumMyCustomEnum{Type1,//或者使用带DisplayName别名==>Enum1UMETA(DisplayName="Type1"),Type
【虚幻C++笔记】TArray，TMap，TSet容器 OSwich 虚幻C++笔记虚幻 c++笔记
目录TArrayTMapTSetTArrayTArray是虚幻c++中的动态数组，TArray特点：速度快，内存消耗小，安全性高。并且TArray所有元素均完全为相同类型，不能进行不同元素类型的混合//构造TArrayarr={1,2,3,4,5,6,7};//Add和Push类似，但是将元素复制或移动到数组中，而Emplace//则使用给定参数构建元素类型的新实例；通常来说，Emplace的效率
【虚幻C++笔记】打印输出的方式 OSwich 虚幻C++笔记虚幻 c++笔记
目录UE_LOGGEngine->AddOnScreenDebugMessageUE_LOGUE_LOG宏是UnrealEngine中用于日志记录的标准方式。它可以输出日志信息到控制台和日志文件，支持多种日志级别（如Log，Warning，Error")UE_LOG(LogCategory,LogVerbosity,Format,...)voidAMyActor::BeginPlay(){Supe
【虚幻C++笔记】计时器 OSwich 虚幻C++笔记 ue5 c++开发语言
文章目录计时器的使用方法计时器的使用方法private://声明计时器句柄FTimerHandleTimerHandle;//声明计时器间隔时间单位:秒[EditAnywhere,BlueprintReadWrite,Category="Time"]floatInterval=1.0f;//声明计时器执行函数varOnTimer();voidAMyActor::BeginPlay(){//获取世界
Python个人学习笔记（2）：编程入门知识与基础语法介绍 NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
一、注释（一）作用1.对代码进行解释和说明避免自己忘了写的代码是做什么的——写给人看的，机器不运行不要去注释你代码做了什么，而要去注释我的代码为什么要这么做。用于记录思路、实现方法、代码功能注释很重要，大厂很重视，尤其日企2.调试代码报错的一篇代码，从下到上一句一句加#，依次运行，如果某行代码加了#后，程序运行成功，那么就是这行有问题，但这个方法不好。（二）注释方法1.单行注释==句子前加#快捷键
Java学习笔记1.1_初识 Java 火车爱上轨道 Java编程语言基础 java 学习
初识Java前言一、Java概述1.什么是程序2.Java语言的产生和发展史3.Java可以做什么4.Java语言的特点二、Java语言环境搭建1.JDK、JRE、JVM关系2.安装JDK3.配置环境变量4.环境测试三、开发第一个Java程序1.开发Java程序的步骤2.用记事本开发Java程序四、Java程序的注释1.单行注释和多行注释2.文档注释五、Java程序的结构六、JavaAPI文档前言
人工智能第五次笔记（python运算符）吴小白！笔记 python 开发语言
一.运算符运算符用于执行某种操作并返回一个结果，Python中的运算符可以分为：算数运算符，比较运算符，逻辑运算符，赋值运算符，位运算符，身份运算符，成员运算符，三目运算符八种1.1算数运算符用于执行基本的数学运算1.1.1常见的算数运算符+：加法-：减法*：乘法/：除法%：取模（取余数）**：幂运算//：整除（取整数部分）x1=5x2=2x3=(1,2)#元组x4=(3,4)x5=[1,2]x6
centos 8 安装docker（RPM离线）——k8s和docker系列名栩 #容器 docker linux centos
如果无法使用Docker的存储库来安装Docker，可以下载.rpm版本的文件并手动安装。每次要升级DockerEngine时都需要下载一个新文件。前往https://download.docker.com/linux/centos/并选择CentOS版本。然后浏览x86_64/stable/Packages/并下载.rpm要安装的Docker版本的文件。笔记要安装每晚或测试（预发布）包，stab
IMX6ULL学习整理篇——UBoot的一些基础知识（1.编译流程） charlie114514191 从0开始的学习ARMv7a IMX6ULL芯片学习 UBoot 嵌入式软件编译
前言笔者整理了最近刷IMX6ULL的一些学习笔记，这里打算稍微整理一下东西发上来作为作为一个补充正文大部分而言，当我们拿到源码的时候，一般都是——先使用make来生成一份针对我们目标开发板的配置。举个例子，正点原子针对他们的开发板（EMMC作为类似于我们电脑的硬盘，DDR类似我们电脑的内存），使用的就是他们自己配置的mx6ull_14x14_ddr512_emmc_defconfig文件。也就是说
STL学习笔记 2301_76962440 c++学习笔记
包含数据结构和数学函数#includeusingnamespacestd;boolcmp(paira,pairb){//第二位从小到大if(a.second!=b.second)returna.secondb.first;}intgcd(inta,intb){if(!b)returna;elsereturngcd(b,a%b);}intlcm(inta,intb){returna/gcd(a,b)
【C 语言极简自学笔记】Day1 初识「C语言」 LQYYDSY 学习笔记笔记 c语言
一句话认识C语言「C是唯一能让你同时触摸硬件和软件的语言」C语言是一门通用计算机编程语言，广泛应用于底层开发，主要是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。第一个C语言实例#includeintmain(){printf("HelloWorld!!!");return0;}(1)main函数是C语言程序的入口，一个C语言程序有且只有
《Operating System Concepts》阅读笔记：p286-p308 操作系统
《OperatingSystemConcepts》学习第28天，p286-p308总结，总计23页。一、技术总结1.reentrantlock(可重入锁)(1)为什么称为reentrantlock？AthreadacquiresaReentrantLocklockbyinvokingitslock()method.Ifthelockisavailable—orifthethreadinvoking
MATAB学习笔记2 好大一口果汁 MATLAB 学习笔记算法
1.多项式拟合>>p=polyfit(DateNum,Pclose,1);%多项式拟合>>value=p(1)%将斜率赋值给value，作为股票的价值value=0.1212代码分析：%后面的内容是注释，ployfit（）有三个参数，第三个参数表示多项式的阶数，也就是最高次数。比如：第三个参数为1，说明为1次项，即一次函数，第三个参数为你要拟合的阶数，一阶直线拟合，二阶抛物线拟合，并非阶次越高越好
AI笔记——语音识别 Yuki-^_^ 人工智能 AI 人工智能笔记语音识别
摘要：语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域的一项重要技术，它将人类的语音信号转换成文字。随着科技的发展，语音识别已经成为现代生活和工作中不可或缺的一部分。本文旨在介绍语音识别的基本原理、关键技术、应用场景以及未来发展趋势。一、历史与发展语音识别技术的历史可以追溯到20世纪50年代，那时的技术基于规则和模板。随着计算能力的提升和深度学习方法的出现，语
网络运维学习笔记（DeepSeek优化版） 018 HCIA-Datacom综合实验03 技术小齐网络运维学习
文章目录综合实验3实验需求一：A公司网络规划二：B公司网络规划配置一、ip、vlan、vlanif，stp、eth-trunkSW1SW2R1二、ospfSW1R1三、NATR1ISP四、拒绝ping允许httpSW1五、右半部分vlan、dhcp、ospf、NATSW4R2综合实验3实验需求一：A公司网络规划SW1/2/3组成了A公司的交换网络，其中SW1是核心层，SW2/3是接入层。三台交换机
[学习笔记] Windows编程——GDI——（六）设备上下文根本没在怕哦 Windows 编程学习笔记 windows
前言：学习笔记，随时更新。如有谬误，欢迎指正。说明：红色字体为较为重要部分。绿色字体为个人理解部分。原文链接：https://learn.microsoft.com/en-us/windows/win32/gdi/device-contexts6设备上下文设备上下文是一种结构，用于定义一组图形对象及其关联属性，以及影响输出的图形模式。图形对象包括用于线条绘制的笔、用于绘制和填充的画刷、用于复制或滚
[学习笔记] Windows编程——GDI——（三）裁剪根本没在怕哦 Windows 编程学习笔记 windows
前言：学习笔记，随时更新。如有谬误，欢迎指正。说明：红色字体为较为重要部分。绿色字体为个人理解部分。原文链接：https://learn.microsoft.com/en-us/windows/win32/gdi/clipping3裁剪剪裁是将输出限制为应用程序窗口的工作区中的某个区域或路径的过程。3.1关于裁剪应用程序通过多种方式使用剪裁。Word和Excel应用程序剪裁键盘输入，使其不显示在页
基于 Docker 搭建 FRP 内网穿透开源项目 xdpcxq1029 技术分享 docker 开源容器
有些配置项不知道该不该用，不知道该在哪用，不知道怎么用，所以我自己写个文章简单记录一下做个笔记本文介绍的是基于Docker运行frps和frpc，并通过TCP协议简单穿透SSH和HTTP，在观看本文之前请确保你的机器已经安装Docker服务端搭建frps#连接拥有公网IP的服务器，在合适的位置创建frps目录作为工作空间#创建frps目录作为工作空间$mkdirfrps#创建服务端配置文件$tou
kaggle-ISIC 2024 - 使用 3D-TBP 检测皮肤癌-学习笔记 supernova121 学习笔记
问题描述：通过从3D全身照片(TBP)中裁剪出单个病变来识别经组织学确诊的皮肤癌病例数据集描述：图像+临床文本信息评价指标：pAUC，用于保证敏感性高于指定阈值下的AUC主流方法分析（文本）基于CatBoost、LGBM和XGBoost三者的组合，为每个算法创建了XX个变体，总共XX个模型，进行集成学习。CatBoost在传统梯度提升决策树（GBDT）基础上，引入了一系列关键技术创新，以提升处理类
MySQL数据库笔记艽掵猫数据库 mysql 笔记
一、数据库基础概念1.数据库定义数据库：统一管理、长期存储、有组织的相关数据集合。特征：数据按模型组织（冗余小、独立性高、易扩展、可共享）。2.实际应用数据存储：高效管理大量结构化数据。数据管理：增删改查（CRUD）与权限控制。数据分析：整合数据源，支持决策。3.常见数据库系统数据库特点MySQL开源、高性能、易用，适用于Web应用。Oracle企业级、高可靠，支持大型应用。SQLServer微软
js中的export、import、export default等导入导出全解庸懒笔记
前端因为规范不同，所以不同的环境会有不同的导入导出方法，因为经常弄混所以特地记一下方便以后查阅记忆，本笔记都是自己总结或查阅资料得出，如有错误请帮忙指出。因为前端的导入导出主要分为commonjs和ES6modules两种标准，其中commonjs主要用于node环境，而ES6modules主要用于浏览器环境，但是ES6modules是兼容commonjs标准的，所以这就很容易让人弄混，本文也将从
Autoleaders控制组——51单片机学习笔记（2） Autoleaders控制组邓翔 51单片机学习笔记
51单片机学习（2）1.模块化编程1.1模块化编程的意义在学习单片机的途中，随着我们的知识不断扩展，我们能写出的代码也越来越复杂，越来越长了，有时我们自己写出的很长的代码，出现了错误，需要调试，但奈何自己的代码实在是太长了，真的不好分析到底是哪里出错了。这是因为我们将太多的函数和代码放在一个main.c的文件里，导致代码过度堆积。如果我们能够条理清晰地去将不同作用的代码和函数放在不同的xxx.c文
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

SANAPHOR: Ontology-Based Coreference Resolution笔记

Coreference Resolution&Anaphora Resolution

Named Entity Recognition(NER)命名实体识别

ontology&entity&mention（这三个名词真是==）

DBpedia&Wikipedia&YAGO

Semantic Annotation（语义标注）

entity linking

LDA&Interger Linear Programming

TRank

TF-IDF

Metrics

你可能感兴趣的:(笔记)