林彤妮

中文知识图谱CN-DBpedia构建的关键技术

这篇博客是根据学习查看复旦大学知识工厂实验室的徐波老师报告整合资料后的笔记，报告内容详略得当，结构清晰，干货满满，于是便自己整理并记下来，方便以后深度学习。

什么是知识图谱？

知识图谱本质上是一种语义网络。

主要由节点，边，目标三大块组成。

其中节点包括：实体、概念。边包括：实体与实体、实体与概念、概念与概念。目标包括：描述真实世界中存在的各种实体或概念。

简介中文开放百科知识图谱CN-DBpedia

是目前最大规模的开放百科中文知识图谱之一。

涵盖数千万实体和数亿的关系。

• 百科实体数 16,537,283

• 百科关系数 213,506,696

相关知识服务API累计调用量已达2.6亿次。

CN-DBpedia主要应用场景

语义搜索、智能问答、超级验证码。

CN-DBpedia系统构架

报告中，老师主要介绍了三大模块：抽取模块、归一化模块、填充模块。

抽取模块：

归一化模块：

填充模块：

方法一：利用其它知识图谱进行填充。

• e.g. YAGO利用Geonames（一个包含超过1000万地点位置信息的地理知识图谱）来增加YAGO实体的地理位置信息

方法二：利用百科网站的其他语种进行填充

• e.g. Wikipedia

方法三：利用百科网站实体标签进行填充

• e.g. 如“刘德华”的一个分类信息为“香港演员”，可以从中得出（刘

德华，出生地，香港）和（刘德华，职业，演员）两组Infobox

方法四：利用百科网站实体正文进行填充

• 百科实体正文内容是对实体最全面的介绍，包含的信息最为丰富

利用百科网站实体正文内容进行填充

基本思路

• 为每个属性构建一个抽取器（分类器）

• 每个抽取器分别从百科文本（实体名已知）的句子中抽取出相应属性的值

序列数据标记问题

文本属性值抽取本质上是一个序列数据标记问题 ，将句子当做是一个序列数据，属性值抽取过程即可看作是序列数据标记过程

1表示为属性值，0表示不是属性值。

这里简单介绍一下传统分类方法：

条件随机场：针对序列数据进行分类的模型，每个词组需要人为设定一组特征。

缺点：1、需要专家人为设计特征。2、不具有通用性。

基于深度学习的方法：

实体分类模块：

知识图谱中的边：

• 实体与实体（百科网站抽取）

• 概念与概念（Taxonomy Construction）

• 实体与概念（实体分类）

Taxonomy构建需要耗费巨大的人工，代价巨大。如何才能获得一个质量优良、又不需要太多人工的Taxonomy呢?

为此，提出了Taxonomy复用的方法，也就是将现有的、成熟的Taxonomy（如DBpedia、Yago、Freebase等）作为CN-DBpedia的Taxonomy。

基于Taxonomy复用的实体分类

难点1：训练集构建，中文实体无法直接分类到英文 Taxonomy上。

解决方案 ：跨语言实体链接，跨语言概念传递。

难点2：训练集存在噪声

• CASE 1：DBpedia 中的实体本身存在分类错误，这将导致对应的中文实体也分类错误

• CASE 2：由于跨语言实体链接错误，导致中文实体分类错误

• CASE 3：由于中文实体语义特征缺失，导致无法推断部分来自其对应英文实体的概念

解决方案

• 对训练集中实体的分类结果进行多分类器投票过滤。

• 将训练集分为N份，其中每N-1份作为训练集，用来过滤另一份的结果。

• 每个分类器分别对实体进行重新预测，与原结果比较，未预测出的结果即视为该分类器认为的噪声数据。

• 通过过滤策略对结果进行过滤。

跨语言实体分类—系统框架

基于文本的实体分类

难点1：训练集构建

人工标记代价大。

解决方案 :STEP 1：基于远程监督的训练集构建。

STEP 2：训练集噪声过滤

多分类器投票过滤方法

难点2：特征选择

人工设计代价大。

解决方案

基于神经网络的实体指称项分类，一个句子分为三部分： Left Context ,Mention ,Right Context.

对句子进行向量化处理 [?−? , … , ?−1] [?1, … , ??] [?1, … , ?? ]

难点3：结果融合

• 简单的合并算法无法取得良好的效果

解决方案

将其看作是一个整数线性规划问题。

• 一个带约束的优化问题，并且模型中的每个参数都要求为非负数。

模型

• 将所有mention的分类结果累加

约束

• 概念互斥约束

一个实体不能同时属于两个语义互斥的概念

??? ?1, ?2 = ??? ?(?1,?2)/?(?1)×?(?2)

• 概念层次化约束

• 一个实体如果不属于某个概念，那么也不能属于这个概念的任意子概念。

如何更新？

传统更新方法

基于更新日志的更新

• Wikipedia有这个功能，但百度百科没有

• 周期性更新

• E.g., 每半年重新爬取一遍数据并进行解析

反馈更新

• 用户点击更新按钮，进行更新

• 基于搜索日志的新词发现

• 用户搜索一个词时，未在知识库中找到，即认为是一个新词

主动更新方法

基本思路

•监控互联网上的热词

• 热词分为两种情况

• 新词

• 旧词，但信息发生了变化

• 更新热词以及与之相关的词条

为什么将热词作为更新的种子结点？

• 实证分析

实验:统计热词的更新频率和随机选择的实体的更新频率。

结果 :80%的热词在100天内更新过了 ,10%的随机选择的实体在100天内更新过了。

更新框架

步骤一：从互联网上发现热词作为种子结点

步骤二：更新这些热词（从百科网站中获取新词或更新旧词）

步骤三：从这些更新的热词的页面中的超链接中获取更多的待更新实体，并为每个待更新实体设置更新优先级。

• 如果是旧词，从知识库中获取

• 如果是新词，从最新的百科页面中获取

• 之所以要设置优先级而不是更新所有扩展实体是由于扩展会得到非常多的实体，超过每日的更新限制K

步骤四：按照优先级顺序更新扩展实体。

优先级如何设置？

原则

• 如果是一个新词，那么优先级设置为最高。

• 如果是一个旧词，估计其上一次更新结束到当前时间内可能更新的次数，该次数作为优先级指标E[u(x)]。

• P(x)：为实体x预期的更新频率，通过预测器得到。

• ts (x)：为最近一次更新的时间。

• 如果x是一个新词，t? ? = −∞

Jiaqing Liang, Sheng Zhang, Yanghua Xiao, How to Keep a Knowledge

Base Synchronized with Its Encyclopedia Source, (IJCAI2017 )

期望更新频率预测器

模型：回归

• 线性回归

• 随机森林回归

更新系统评估

• 我们将这套更新机制布置到CN-DBpedia中。

• 设置K（每日更新实体个数上限）为1000。

• 我们系统在一天中爬取了1000个实体，其中68.7%的实体的信息发生了变化。

你可能感兴趣的:(中文知识图谱CN-DBpedia构建的关键技术)

【Android】跨进程调用service zhangzeyuaaa Android
Android系统中，各应用程序都运行在自己的进程里，进程之间一般无法直接进行数据交换。为了实现这种跨进程通信（interprocesscommunication,IPC），Android提供了AIDL（AndroidInterfaceDefinitionLanguage，android接口定义语言）Service。要使用AIDL进行通信，需要以下步骤：服务端1.定义AIDL接口。通常在该接口中定
PCIE中TLP的路由 newyork major PCIE PCIE
是指TLP通过Switch或者PCIe桥片时采用哪条路径，最终到达EP或者RC的方法。三种路由方式基于地址(Address)的路由memrd/wr,IOrd/wr使用TLP中的Address字段进行路由选径基于ID的路由cfgrd/wr、“Vendor_DefinedMessages”报文、Cpl和CplD报文根据BDF进行路由隐式路由(Implicit)Message报文包括“INTxInter
Redis ZSet 数据结构深度解析：原理、实现与实战全揭密！程序猿Mr.wu Redis redis 数据结构缓存
一、前言：为什么要学习ZSet？在Redis的五大基础数据类型中，ZSet（SortedSet，有序集合）是一种非常强大而灵活的数据结构，广泛应用于排行榜、延时队列、权重排名等场景。如果说String是Redis的“最小原子”，那么ZSet就是Redis的“重量级选手”——不仅能存数据，还能排序查询，这正是它的魅力所在！二、ZSet是什么？和Set有啥区别？ZSet=Set+Score+排序！特性
MySQL 中的锁机制详解：原理、实现方式与实战解析！程序猿Mr.wu MySQL mysql 数据库
MySQL中的锁机制详解：原理、实现方式与实战解析！锁的世界，比你想象得更精彩！一、为什么要有锁？在并发环境下，多线程操作数据库的同一份数据时，如果没有锁机制，可能会出现以下问题：脏读：读取了另一个事务未提交的数据。不可重复读：同一事务中多次读取结果不一致。幻读：读取时发现记录“凭空”出现或消失。锁的存在，就是为了保证并发情况下的数据一致性与隔离性。二、MySQL中锁的分类1.按作用范围分类分类说
Spring Boot 应用开发实战指南：从入门到实战（内含实用技巧+项目案例）程序猿Mr.wu Spring Boot Java 后端 spring boot java
SpringBoot应用开发实战指南：从入门到实战（内含实用技巧+项目案例）你是否还在为Spring配置复杂、开发效率低下而苦恼？SpringBoot早已成为Java后端开发的“标配”，本篇文章将带你全面掌握SpringBoot应用开发核心技能，从0到部署，构建高效、优雅的企业级应用！一、什么是SpringBoot？SpringBoot是Spring团队推出的快速开发框架，简化了传统Spring应
Android筑基——Service的启动过程之同进程启动（基于api21） willwaywang6 #Android 架构学习 android Service 启动
目录1.前言2.正文2.1ContextWrapper.startService()方法2.2ContextImpl.startService()方法2.3ContextImpl.startServiceCommon()方法2.3.1ActivityManagerNative.getDefault()方法2.4ActivityManagerProxy.startService()方法2.5Acti
Oracle 神级函数 Decode 实战：一条 SQL 替代 3000 行代码的计算逻辑 AI、少年郎 oracle sql 数据库递归组织树
在企业级应用开发中，复杂的业务统计需求往往需要编写大量代码进行数据处理。本文将通过Oracle的DECODE函数与分组函数的巧妙结合，展示如何用一条SQL语句实现原本需要3000行代码的复杂计算逻辑，尤其针对企业组织架构中的部门级请假数据统计场景。一、基础准备：构建业务数据表1.创建单位部门表（模拟组织架构）CREATETABLEt_dept(dept_idNUMBERPRIMARYKEY,--部
后台服务启动前台Service（跨进程）一只努力的菜鸟。 java android android studio
在开发中，很多时候我们会碰到在hmi里面做了页面布局，但是要求开机就显示。我们的Service是开机自启动的，但是hmi不是开机自启动。那么这个时候我们需要在hmi添加一个hmiService，用后台的Service拉起hmiService进而去显示View（这个View一般都为WindowManager，不依附Activity）上代码：前台Service（hmiService）：1.首先创建一个
02 ESP32-S3——WIFI开发
在ESP32开发中，或多或少会看见有的工程添加的是ESP-WIFI库有的添加的是WIFI库。特意去查找了下，两者都是可以开发esp32/esp8266的WIFI功能。两者的区别：Esp-wifi库：硬件平台：这个库是Espressif提供的专门为esp32开发wifi的库，是ESP-IDF（EspressifIoTDevelopmentFramework）的一部分，ESP-IDF是ESP32的官方
学习一：Qt中Connect和多线程嘿·嘘 Qt qt 开发语言
目录1、信号与槽1.1举例：在同一个cpp文件中。1.2举例：在不同cpp文件中。1.3断开连接2、多线程2.1公共函数2.2信号与槽2.3静态函数2.4保护功能2.5静态保护成员3.6举例1、信号与槽在Qt中connect函数主要用来建立信号与槽函数。通过信号与槽函数机制可以实现不同线程之间的数据传输（不止这一种方式，这里就单描述信号与槽）。因为在Qt中，通常是主线程对窗口进行赋值，子线程不能直
AI原生应用领域反馈循环：助力应用持续进化 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native ai
AI原生应用领域反馈循环：助力应用持续进化关键词：AI原生应用、反馈循环、持续进化、数据驱动、用户体验摘要：本文围绕AI原生应用领域的反馈循环展开探讨。首先介绍了反馈循环在AI原生应用中的重要性，接着详细解释了反馈循环的核心概念及其相关要素。通过具体的算法原理和操作步骤展示了反馈循环如何在技术层面实现。以实际项目案例说明反馈循环在实际开发中的应用和效果。还探讨了反馈循环在不同场景下的应用，推荐了相
AI原生应用性能优化：混合推理的7个最佳实践 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 性能优化 ai
AI原生应用性能优化：混合推理的7个最佳实践关键词：AI原生应用、性能优化、混合推理、最佳实践、推理效率摘要：本文主要探讨了AI原生应用性能优化中混合推理的相关内容。首先介绍了文章的背景、目的、预期读者和文档结构等信息，接着对混合推理的核心概念进行了通俗易懂的解释，并阐述了各核心概念之间的关系，给出了核心概念原理和架构的文本示意图以及Mermaid流程图。详细讲解了核心算法原理和具体操作步骤，用数
浅谈HttpClient weixin_34092455 网络
为什么80%的码农都做不了架构师？>>>HttpClient简介HttpClient是ApacheJakartaCommon下的子项目，可以用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议最新的版本和建议。HttpClient支持的功能如下：支持Http0.9、Http1.0和Http1.1协议。实现了Http全部的方法（GET,POST,PUT,HEA
使用vllm部署 Nanonets-OCR-s 没刮胡子软件开发技术实战专栏 Linux服务器技术人工智能AI ocr python 深度学习
使用vLLM部署Nanonets-OCR-s模型的完整指南Nanonets-OCR-s作为基于Qwen2.5-VL-3B的多模态OCR模型，结合vLLM的高效推理引擎可显著提升部署性能。一、环境准备与依赖安装1.安装vLLM与多模态依赖#安装vLLM（含CUDA加速）pipinstallvllm==0.3.21#建议使用稳定版本pipinstalltransformers==4.35
C++：vector容器（上篇）李白同学 C++c++开发语言
1.vector的介绍及使用1.1vector的介绍vector文档说明链接：vector-C++Reference(cplusplus.com)1.2vector的使用1.2.1vector的定义(constructor)构造函数声明接口说明vector()（重点）无参构造vector（size_typen,constvalue_type&val=value_type()）构造并初始化n个val
C/C++快速回顾 Immok 其他
C/C++的库参考大全：http://www.cplusplus.com/reference/C语言：C语言的入口方法：main(intargc,constchar*argv[])intargc指控制台传入的参数个数，argv是传入的值宏定义：#definePi3.14//在编译阶段替换宏方法：#defineMAX(a,b)\a>b?a:bC中的switch需要写break;,否则会一直往下执行，
【STM32仿真】基于STM32单片机设计的秒表时钟计时器仿真系统阿齐Archie 单片机项目合集 stm32 嵌入式硬件单片机 proteus
基于STM32单片机设计的秒表时钟计时器仿真系统演示视频基于STM32单片机设计的秒表时钟计时器仿真系统摘要本设计基于STM32单片机，设计并实现了一个秒表时钟计时器仿真系统。系统通过显示器实时显示当前时间，并通过定时器实现秒表计时功能。显示小时、分钟、秒、毫秒，通过按键可调整时分秒和毫秒的时间。在键盘上输入要设置的时间，按*进入时间修改，之后在按*回退到上一位数字，按#表示修改完成。系统采用模块
鸿蒙开发之埋点方案：高效追踪用户行为 niu某某移动开发鸿蒙开发 HarmonyOS harmonyos 鸿蒙开发移动开发组件化模块化 ArkUI
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）✒️鸿蒙应用开发与鸿蒙系统开发哪个更有前景？✒️嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~✒️对于大前端开发来说，转鸿蒙开发究竟是福还是祸？✒️鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？✒️记录一场鸿蒙开发岗位面试经历~✒️持续更新中……概述埋点是指将信息采集程序和原本的功能代码结合起来，针对特定用户行为收集、处理和发送一些
C++中对象传参的几种方式递归书房 c++
在C++中传递对象作为函数参数有多种方式，每种方式都有不同的语义、性能特点和适用场景。以下是全面的分析和最佳实践指南：1.按值传递(PassbyValue)voidprocessObject(MyClassobj){//操作obj的副本}MyClassoriginal;processObject(original);//复制构造新对象特点：创建对象的完整副本函数内修改不影响原始对象调用时发生复制构
相机的光圈 enginexpert 数码相机
光圈（Aperture）是镜头中一个控制光线进入相机的开口，它在摄影中起着至关重要的作用。光圈的大小决定了进入相机传感器的光线数量，并影响曝光、景深、以及拍摄效果。光圈参数通常用f/值（光圈值）来表示，常见的参数包括f/1.4,f/2.8,f/5.6,f/22等。以下是光圈的几个主要方面的详细解释：1.光圈值（f/值）光圈值（f/值）是衡量光圈大小的标准。光圈的f值是焦距与光圈直径的比值。较低的f
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
【C++】C++快速回顾入门、概念概要子非渔 C++入门 C++C++总结
C++语言跟其它语言类似，主要基本的本文不列举了。我在学习的过程中，遇到C++的不同之处，或者是重点的地方，都会将其记录下来。主要从关键字、常见函数、输入输出等角度去记录。输入输出：count>命名空间：namespaceusingnamespacestd;extern:多个文件中共享的全局变量。主要是将本文件中的变量释放至其他文件也可以使用的全局高度。用于不同文件的数据交互。成员运算符：.->.
c++STL库与快速排序浪子小院基础精讲 c++算法开发语言数据结构
什么是STL库STL=StandardTemplateLibrary，标准模板库，是一系列软件的统称。从根本上说，STL是一些“容器”的集合，这些“容器”有list,vector,set,map等，STL也是算法和其他一些组件的集合。前面已经学习过的中sort函数、中string类都是STL的内容。STL库还有很多内容，比如：向量（vector）、栈（stack）、队列（queue）、优先队列（p
1910. 删除一个字符串中所有出现的给定子字符串 Joyner2018 python 算法 leetcode 开发语言 python
字符串反复删除子串问题的多种解法解析✨题目描述给定两个字符串s和part，我们需要对s执行以下操作，直到s中不再包含任何子串part：每次找到s中最左边出现的part子串，并将其从s中删除。最后，返回所有part都被删除后的最终字符串。注意：子串指的是字符串中连续的字符序列。删除操作是从左到右，每次只删除最左边的一个匹配部分。示例说明示例1：输入：s="daabcbaabcbc",part="ab
1911. 最大交替子序列和 Joyner2018 python 算法 leetcode 开发语言 python
子序列的最大交替和—动态规划详解题目描述给定一个数组nums，定义其交替和为：数组中偶数下标元素之和减去奇数下标元素之和（下标从0开始）。例如，数组[4,2,5,3]的交替和为(4+5)-(2+3)=4。现在，给定数组nums，请你找到它的任意子序列，使得该子序列（重新编号，下标从0开始）的交替和最大，返回这个最大交替和。子序列定义：从原数组中删除一些元素后，剩下元素顺序不变组成的数组。你可以选择
干货！大模型时代一定要收藏的 20 个LLM 中文数据集 OpenBayes 资源上新人工智能语言模型数据库机器学习
自ChatGPT重磅推出以来，大语言模型(largelanguageModel,LLM)以其卓越的学习能力在各个领域引起轰动。大模型的训练和调优离不开优质庞大的数据支撑，精心构建的数据集不仅为大模型提供了充分的燃料，还为大模型在垂直领域的应用和性能提升提供了可能。本文整理了一些适用于大模型训练调优的热门中文公开数据集（按照首字母A-Z顺序排列），以供大家了解和使用。温馨提示：本文列举的所有数据集，
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能自动驾驶 unix ai
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择关键词：AI伦理、自动驾驶、道德算法、电车难题、责任归属、技术监管、人机协作摘要：本文深入探讨自动驾驶技术发展过程中面临的伦理挑战，从经典的"电车难题"出发，分析AI决策系统在生死抉择中的道德困境。我们将剖析自动驾驶的伦理框架设计原则，探讨技术实现方案，并通过代码示例展示伦理算法如何嵌入自动驾驶系统。文章还将讨论法律责任划分、社会接受度等现实问题，最
利用大数据领域Doris提升企业数据决策效率大数据洞察大数据网络 ai
利用大数据领域Doris提升企业数据决策效率关键词：大数据、Doris、企业数据决策、数据处理、效率提升摘要：本文围绕利用大数据领域的Doris来提升企业数据决策效率展开。首先介绍了背景，包括目的、预期读者、文档结构和相关术语。接着阐述了Doris的核心概念、架构以及与其他系统的联系。详细讲解了Doris的核心算法原理和具体操作步骤，并给出Python代码示例。同时介绍了相关的数学模型和公式。通过
15.OCR训练 Echo`` Halcon系统化学习 ocr 人工智能深度学习算法计算机视觉机器学习
目录1.OCR训练2.助手训练13.助手训练24.算子训练5.OCR训练联合编程6.练习1.OCR训练*OCR训练*1.分类器文件*.omc*2.halcon官方的*1.局限性只能识别数字和字母*2.样式比较单一*3.样本数量较少*...**3.训练方法*1.助手训练*1.打开OCR助手*2.选择图片*3.选择训练区域*4.分割*5.字体*6.训练文件*7.新*8.学习*9.加入训练样本*10.保
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他