1黄鹰

Elasticsearch系列---Term Vector工具探查数据

概要

本篇主要介绍一个Term Vector的概念和基本使用方法。

term vector是什么？

每次有document数据插入时，elasticsearch除了对document进行正排、倒排索引的存储之外，如果此索引的field设置了term_vector参数，elasticsearch还会对这个的分词信息进行计算、统计，比如这个document有多少个field，每个field的值分词处理后得到的term的df值，ttf值是多少，每个term存储的位置偏移量等信息，这些统计信息统称为term vector。
term vector的值有5个

no：不存储term vector信息，默认值
yes：只存储field terms信息，不包含position和offset信息
with_positions：存储term信息和position信息
with_offsets：存储term信息和offset信息
with_positions_offsets：存储完整的term vector信息，包括field terms、position、offset信息。

term vector的信息生成有两种方式：index-time和query-time。index-time即建立索引时生成term vector信息，query-time是在查询过程中实时生成term vector信息，前者以空间换时间，后者以时间换空间。

term vector有什么作用？

term vector本质上是一个数据探查的工具（可以看成是一个debugger工具），上面记录着一个document内的field分词后的term的详细情况，如拆分成几个term，每个term在正排索引的哪个位置，各自的df值、ttf值分别是多少等等。一般用于数据疑似问题的排查，比如说排序和搜索与预期的结果不一致，需要了解根本原因，可以拿这个工具手动进行数据分析，帮助判断问题的根源。

读懂term vector信息

我们来看看一个完整的term vector报文，都有哪些信息，带#号的一行代码是添加的注释，如下示例：

{
  "_index": "music",
  "_type": "children",
  "_id": "1",
  "_version": 1,
  "found": true,
  "took": 0,
  "term_vectors": {
    "text": {
      "field_statistics": {
        "sum_doc_freq": 3,
        "doc_count": 1,
        "sum_ttf": 3
      },
      "terms": {
        "elasticsearch": {
          "doc_freq": 1,
          "ttf": 1,
          "term_freq": 1,
          "tokens": [
            {
              "position": 2,
              "start_offset": 11,
              "end_offset": 24
            }
          ]
        },
        "hello": {
          "doc_freq": 1,
          "ttf": 1,
          "term_freq": 1,
          "tokens": [
            {
              "position": 0,
              "start_offset": 0,
              "end_offset": 5
            }
          ]
        },
        "java": {
          "doc_freq": 1,
          "ttf": 1,
          "term_freq": 1,
          "tokens": [
            {
              "position": 1,
              "start_offset": 6,
              "end_offset": 10
            }
          ]
        }
      }
    }
  }
}

一段完整的term vector信息，term vector是按field为维度来统计的，主要包含三个部分：

field statistics
term statistics
term information

field statistics

指该索引和type下所有的document，对这个field所有term的统计信息，注意document的范围，不是某一条，是指定index/type下的所有document。

sum_doc_freq(sum of document frequency)：这个field中所有的term的df之和。
doc_count(document count)：有多少document包含这个field，有些document可能没有这个field。
sum_ttf(sum of total term frequency)：这个field中所有的term的tf之和。

term statistics

hello为当前document中，text field字段分词后的term，查询时设置term_statistics=true时生效。

doc_freq(document frequency)：有多少document包含这个term。
ttf(total term frequency)：这个term在所有document中出现的频率。
term_freq(term frequency in the field)：这个term在当前document中出现的频率。

term information

示例中tokens里面的内容，tokens里面是个数组

position：这个term在field里的正排索引位置，如果有多个相同的term，tokens下面会有多条记录。
start_offset：这个term在field里的偏移，表示起始位置偏移量。
end_offset：这个term在field里的偏移量，表示结束位置偏移量。

term vector使用案例

建立索引music，type命名为children，指定text字段为index-time，fullname字段为query-time

PUT /music
{
  "mappings": {
    "children": {
      "properties": {
        "content": {
            "type": "text",
            "term_vector": "with_positions_offsets",
            "store" : true,
            "analyzer" : "standard"
         },
         "fullname": {
            "type": "text",
            "analyzer" : "standard"
        }
      }
    }
  }
}

添加3条示例数据

PUT /music/children/1
{
  "fullname" : "Jean Ritchie",
  "content" : "Love Somebody"
}

PUT /music/children/2
{
  "fullname" : "John Smith",
  "content" : "wake me, shark me ..."
}
PUT /music/children/3
{
  "fullname" : "Peter Raffi",
  "content" : "brush your teeth"
}

对document id为1这条数据进行term vector探查

GET /music/children/1/_termvectors
{
  "fields" : ["content"],
  "offsets" : true,
  "positions" : true,
  "term_statistics" : true,
  "field_statistics" : true
}

得到的结果即为上文的term vector示例。
另外可以提一下，用这3个document的id进行查询，field_statistics部分是一样的。

term vector常见用法

除了上一节的标准查询用法，还有一些参数可以丰富term vector的查询。

doc参数

GET /music/children/_termvectors
{
  "doc" : {
    "fullname" : "Peter Raffi",
    "content" : "brush your teeth"
  },
  "fields" : ["content"],
  "offsets" : true,
  "positions" : true,
  "term_statistics" : true,
  "field_statistics" : true
}

这个语法的含义是针对指定的doc进行term vector分析，doc里的内容可以随意指定，特别实用。

per_field_analyzer参数
可以指定字段的分词器进行探查

GET /music/children/_termvectors
{
  "doc" : {
    "fullname" : "Jimmie Davis",
    "content" : "you are my sunshine"
  },
  "fields" : ["content"],
  "offsets" : true,
  "positions" : true,
  "term_statistics" : true,
  "field_statistics" : true,
  "per_field_analyzer" : {
    "text": "standard"
  }
}

filter参数
对term vector统计结果进行过滤

GET /music/children/_termvectors
{
  "doc" : {
    "fullname" : "Jimmie Davis",
    "content" : "you are my sunshine"
  },
  "fields" : ["content"],
  "offsets" : true,
  "positions" : true,
  "term_statistics" : true,
  "field_statistics" : true,
  "filter" : {
      "max_num_terms" : 3,
      "min_term_freq" : 1,
      "min_doc_freq" : 1
    }
}

根据term统计信息，过滤出你想要看到的term vector统计结果。也挺有用的，比如你探查数据可以过滤掉一些出现频率过低的term。

docs参数
允许你同时对多个doc进行探查，这个使用频率看个人习惯。

GET _mtermvectors
{
   "docs": [
      {
         "_index": "music",
         "_type": "children",
         "_id": "2",
         "term_statistics": true
      },
      {
         "_index": "music",
         "_type": "children",
         "_id": "1",
         "fields": [
            "content"
         ]
      }
   ]
}

term vector使用建议

有两种方式可以得到term vector信息，一种是像上面案例，建立时指定，另一种是直接查询时生成

index-time，在mapping里配置，建立索引的时候，就直接给你生成这些term和field的统计信息，如果term_vector设置为with_positions_offsets，索引所占的空间是不设置term vector时的2倍。
query-time，你之前没有生成过任何的Term vector信息，然后在查看term vector的时候，直接就可以看到了，会on the fly，现场计算出各种统计信息，然后返回给你。

这两种方式采用哪种取决于对term vector的使用期望，query-time更常用一些，毕竟这个工具的用处是协助定位问题，实时计算就行。

小结

term vector是一个比较实用的工具，尤其是针对线上数据进行分析、协助问题定位的时候，可以派上很大的用场。

专注Java高并发、分布式架构，更多技术干货分享与心得，请关注公众号：Java架构社区
可以扫左边二维码添加好友，邀请你加入Java架构社区微信群共同探讨技术

你可能感兴趣的:(Elasticsearch系列,elasticsearch)

Agent架构与工作原理：理解智能体的核心机制 hdzw20 agent学习 ai 机器学习 agent 智能体
Agent架构与工作原理：深入理解智能体的核心机制AIAgent的核心组成部分一个完整的AIAgent通常由以下几个核心模块组成：1.规划模块（PlanningModule）规划模块是Agent的"大脑"，负责制定行动策略。它接收目标任务，分析当前状态，并制定一系列行动计划。规划可以是：短期规划：针对当前步骤的即时决策长期规划：面向整体目标的战略性规划动态规划：根据执行结果实时调整计划2.记忆模块
抖音极速版邀请码是多少,2024新版抖音极速版邀请码有哪些? 熊熊福利
抖音极速版邀请码是多少呢？拉到文章末尾就可以看到！在文章的结尾可以看到抖音极速版邀请码是多少。抖音极速版邀请码怎么填写第1步首先打开【抖音极速版】客户端，然后点击底部【来赚钱】第2步接着点击【填写邀请码】右侧的【去填写】第3步再输入邀请码，最后点击【立即领取】即可。2024年抖音极速版为了回馈广大用户朋友的支持和厚爱，特推出邀请好友填写邀请码来获得一系列特权的活动。只要您是首次下载抖音极速版，并且
华为P30系列海外已发布，OPPO Reno更稳了！灵感科技
华为P30在巴黎正式发布，作为年度的摄影旗舰，特别是P30Pro可以说是目前手机影像的天花板机型，特别是在暗光拍照上以及长焦拍摄上的表现着实让人感觉到惊艳。在长焦拍摄上，华为P30Pro在硬件上采用了潜望式的长焦镜头，10倍长焦焦段为125mm，结合华为自己的技术可以获得大约10倍混合变焦以及50倍的数码变焦，单看参数华为P30Pro已经比大部分的数码相机要强上一些。但是毕竟还是无损数码变焦，即便
yolov8涨点系列之C2f模块改进主分支没脾气的小玩家 YOLO 目标检测
文章目录C2F模块介绍定义与基本原理应用场景C2f模块修改步骤(1)C2f_up模块编辑(2)在__init_.py+block.py中声明（3）在task.py中声明yolov8引入C2f_up模块yolov8.yamlyolov8.yaml引入C2f_up模块C2f改进对YOLOv8检测具有多方面的好处C2F模块介绍定义与基本原理 C2F（Coarse-to-Fine）模块通常是一
yolov8涨点系列之替换幽灵卷积GhostConv 没脾气的小玩家 yolov8涨点系列 YOLO 目标检测
文章目录核心思想主要步骤优势yolov8.yaml文件增加CBAMyolov8.yamlyolov8.yaml将Conv卷积替换成GhostConv 幽灵卷积（GhostConv）是一种新颖的卷积操作方法，旨在解决传统卷积神经网络中参数量和计算量过大的问题，尤其适用于资源受限的设备。以下是对幽灵卷积的详细介绍：核心思想常规的卷积操作会产生大量的特征图，其中存在一定的冗余信息。幽灵卷积的核心思
apache ignite系列（二）：配置 weixin_30521161
ignite有两种配置方式，一种是基于XML文件的配置，一种是基于JAVA代码的配置：这里将ignite常用的配置集中罗列出来了，一般建议使用xml配置。1，基于XML的配置-->org.cord.*-->java.lang.Longcom.palic.demo.data.domain.CommRate-->-->-->-->-->-->-->-->-->-->-->127.0.0.1:48500
YOLO目标检测模型优化技术全景解析
YOLO目标检测模型优化技术全景解析作为实时目标检测领域的标杆算法，YOLO系列模型通过持续的技术革新不断提升性能边界。本文将从模型架构设计、数据优化、注意力机制融合、后处理策略及训练方法等维度，系统剖析YOLO优化领域的关键技术与最新进展。一、模型架构优化：突破性能瓶颈的核心路径多尺度检测层增强针对小目标检测难题，主流方案通过增加浅层检测通道优化特征提取。例如在YOLOv5中引入160×160特
《暮海情深》泰剧/电视剧【1080p超清泰语中字】2024暮海情深全集12集完整未删减版百度/夸克网盘高清迅雷免费在线观看 6a3de85245co
随着2024年的到来，泰国电视剧市场又迎来了一部备受期待的佳作——《暮海情深》。这部泰剧自开拍以来就备受瞩目，如今终于以1080p超清画质和泰语中文字幕的形式完整呈现，共计12集，为观众带来了细腻的情感和深刻的故事。《暮海情深》是一部以现代都市为背景的爱情剧，讲述了主角们在爱情、友情和亲情之间的纠葛。剧中通过一系列跌宕起伏的故事情节，展现了人性的复杂和爱情的真谛。故事的主人公是一位年轻有为的企业家
DolphinScheduler 如何高效调度 AnalyticDB on Spark 作业？ DolphinScheduler社区 spark 大数据分布式
DolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统，能高效地执行和管理大数据流程。用户可以在DolphinSchedulerWeb界面轻松创建、编辑和调度云原生数据仓库AnalyticDBMySQL版的Spark作业。前提条件AnalyticDBforMySQL集群的产品系列为企业版、基础版或湖仓版。AnalyticDBforMySQL集群中已创建Job型资源组
【Linux系列】rsync和mv 檀越@新空间 s5 Linux学习 linux 服务器 java
博客目录1.操作性质不同2.对源文件的影响3.使用场景4.示例对比使用`rsync-a`：使用`mv`：5.注意事项总结rsync-a/data/software/build0713/dist//usr/share/nginx/html/和mv是两种完全不同的操作，主要区别如下：1.操作性质不同rsync-a复制同步：将源目录（/data/software/build0713/dist/）的内容递
【加解密与C】Rot系列(四)Rot8000 阿捏利加解密与C c语言 Rot8000
Rot8000简介Rot8000是一种基于Unicode字符集的旋转加密算法，类似于经典的Rot13，但扩展到了更大的字符范围（通常是Unicode的基本多语言平面，即U+0000到U+FFFF）。Rot13仅适用于26个拉丁字母，而Rot8000通过覆盖更多字符（如中文、符号等），增强了加密的灵活性和趣味性。Rot8000加密原理Rot8000的核心思想是将每个Unicode字符的码点值加上0x
NX636NX644美光固态闪存NX663NX665 18922804861 人工智能性能优化大数据服务器网络
美光固态闪存深度解析：NX636、NX644、NX663、NX665全面评测技术架构与核心性能美光NX636、NX644、NX663、NX665系列固态闪存均基于176层3DTLCNAND技术，采用美光自研主控芯片，支持PCIe4.0协议，理论带宽可达16GT/s。其中，NX665作为旗舰型号，连续读取速度突破7.4GB/s，随机写入性能较NX636提升约40%，相当于从“自行车道”升级至“高速公
NX585NX586美光固态闪存NX633NX635
美光NX系列固态闪存深度解析：技术、性能与市场洞察一、技术架构与核心创新美光NX系列固态闪存（如NX585、NX586、NX633、NX635）的技术根基源于其G9NAND技术平台，通过优化晶体管结构与制程工艺，显著提升存储密度与读写速度。例如，NX585的MT29F8T08GUCAG芯片在顺序读取速度上达到7.4GB/s，相当于每秒传输超过1.4万张高清照片。这一性能表现得益于多通道交互设计和动
金庸续书《西毒欧阳锋大传》承接射雕三部曲，是査良居士的代表作青莓时代
在以写金庸武侠续作而成名的小说作家群体中，查良居士的名字不可不提。他的“金庸著名人物传记系列”，许多金庸武侠爱好者都看过。江湖传言，此系列已经与金庸的射雕三部曲系列构成了奇妙的血缘关系。金庸著名人物传记系列更有人言：读查良不读金庸不行，读金庸不读查良不完美！接下来，青莓时代就带大家一起走进查良居士的“金庸著名人物传记系列”，看看它究竟写了什么内容，到底写得怎么样。旧武侠书在这里，欢迎一起交流！十五
Android UI 组件系列（五）：CheckBox、RadioButton 与 Switch 控件详解
博客专栏：Android初级入门UI组件与布局源码：通过网盘分享的文件：Android入门布局及UI相关案例链接:https://pan.baidu.com/s/1EOuDUKJndMISolieFSvXXg?pwd=4k9n提取码:4k9n引言在Android开发中，用户与应用的交互往往离不开各种“选择”操作，例如：注册表单中选择兴趣爱好（可多选）设置界面中切换通知、Wi-Fi开关（开/关状态）
怎样挑到一件好的高仿maxmara羽绒服？高端顶级奢侈品
怎样挑到一件好的高仿maxmara羽绒服？MaxMara是意大利风格的象征标志，其成衣系列独具高级定制女装的剪裁设计、奢华材质以及精致细节，彰显了这一品牌系列的优雅自信与现代品味。MaxMara由极富远见的AchilleMaramotti创立于1951年，以其时尚的外套、简约的单品、干练的西装和优雅的配饰而闻名。MaxMara系列如今远销90多个国家和地区，共有2254个销售网点，而且是MaxMa
使用U盘制作MacOS系统启动盘并安装系统
目录前言1、准备工作2、下载MacOS镜像3、制作启动盘4、重装系统1、Apple芯片2、Intel芯片END前言由于公司采购了新的Mac（M2芯片），那么我的老旧Mac（Intel芯片）就可以回收交给公司了，但是电脑上有很多我使用的数据，于是我想直接抹盘，然后就是一系列的坑，当我把整个磁盘进行抹除之后，首先就是开机之后蓝屏报错误码，我直接呆住，原来抹盘连系统都干掉了....，于是我使用磁盘工具去
ISO11898 与 SAE J1939 通信协议详细介绍芊言凝语汽车常见功能分享网络
ISO11898与SAEJ1939通信协议的详细介绍：ISO11898通信协议ISO11898是一系列国际标准，专门用于道路车辆的控制器局域网（CAN）的数据链路层和物理层6。它定义了CAN网络的基本操作，规定了网络设计、实施和测试的要求，为CAN网络的设计和实施提供了全面的指导。其核心技术特点包括高可靠性、实时性、支持多主控系统、高效的数据包结构以及灵活性等7。具体如下5：ISO11898-1：
【沧海行系列】鬼域行——第十六章乱琼碎玉沧海行人
而我最不喜欢阴阳分明的东西了。要知道阴在阳之内，不在阳之对。我们要充分利用自己的优势，打入敌营陇南地界，早早就有人准备好了酒菜等候何平等人。为首的人回报道：“何长老，我等追查了很久，没有黄长老的痕迹啊。”何平听了，心里已经有九成把握听到的是这个回答了，但她还是叹了口气去，又问道：“上次那妖女的事可曾继续扩散？”那人又说：“这事奇就奇在这，眼下不知是什么人，平息了流言，如今知道那女子身有鉴空遗书的人
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】迭代器和生成器的区别及其各自实现方式和使用场景 AnAn__kang python 机器学习开发语言
系列文章目录前言小伙伴们，今天我们将进入迭代器和生成器的使用，这俩个呢对我们处理信息的时候帮助是非常大的。对于我们的电脑将减轻负重，不至于内存的损耗过大。未来我们在训练模型处理数据时，会频繁的使用生成器。一，迭代器Iterator迭代器提供了一种惰性（lazyevaluation）获取数据的方法，使得我们能够逐步访问序列中的元素，而无需一次性加载所有数据。其主要优点包括节省内存、提高性能、支持自定
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
Python --- Day3 推导式及常见语句和内置函数的学习！！！
系列文章目录前言相信各位伙伴们在前俩次的文章和Python的基础学习中大有收获，这次我们将进入推导式，常见语句和内置函数的学习！跟着博主一起成为一名Ai的算法工程师！一、推导式用更简洁的方式创建列表、字典和集合。是Python特有的一种表达式形式。1.1列表推导式a=[1,2,3,4]result=[x*2forxina]#创建一个新列表，元素是原列表每个元素的两倍1.2字典推导式a=['a','
开源Agent平台Dify源码剖析系列（六）核心模块core/agent之CotCompletionAgentRunner ATM006 机器智能人工智能大模型人机协同 Agent Dify
每一篇文章都短小精悍，不啰嗦。笔者寄语本期介绍Dify框架的核心模块core/agent。接下来我们一起深入剖析core/agent目录下的所有代码，并以通俗易懂的方式解释。我们需要先了解这个目录的完整结构，然后逐个分析关键文件，最后总结整个Agent框架的设计和工作原理。首先，让我查看core/agent目录的完整结构：dify/api/core/agent.├──base_agent_runn
ARM指令集--简介小蘑菇二号 arm 指令集
目录1ARM指令集特点2ARM指令集分类3指令格式ARM指令集是专为ARM架构处理器设计的一系列机器指令集合。ARM（AdvancedRISCMachines）以其精简指令集计算机（RISC）设计理念为基础，提供了高效、低功耗的指令系统。ARM指令集历经多个版本迭代，目前最新的主流版本包括ARMv8-A（支持AArch64和AArch32两种执行状态）。1ARM指令集特点-**精简指令集**：指令
面试实战，问题一，讲一下Springboot的作用
SpringBoot框架的主要作用和功能SpringBoot是由Pivotal团队开发的一个开源Java框架，旨在显著简化基于Spring框架的应用程序开发过程。它通过提供一系列自动化工具和约定，帮助开发者快速构建独立、生产就绪的应用程序。下面我将逐步介绍其主要作用和核心功能，确保回答清晰易懂。主要作用简化Spring应用程序开发：SpringBoot的核心目标是降低Spring框架的入门门槛和配
高仿maxmara羊绒大衣什么价格？高端顶级奢侈品
高仿maxmara羊绒大衣什么价格？MaxMara是意大利风格的象征标志，其成衣系列独具高级定制女装的剪裁设计、奢华材质以及精致细节，彰显了这一品牌系列的优雅自信与现代品味。MaxMara由极富远见的AchilleMaramotti创立于1951年，以其时尚的外套、简约的单品、干练的西装和优雅的配饰而闻名。MaxMara系列如今远销90多个国家和地区，共有2254个销售网点，而且是MaxMara集
小架构step系列19：请求和响应秋千码途架构
1概述作为Web程序，通用形式是发起HTTP请求并获取返回的结果，在这个过程中，需要把请求映射到代码的接口上，提供这种接口的类一般称为Controller，也就是需要把请求映射到Controller的接口方法上，把请求的参数映射到接口的参数中，并从接口返回接口处理的结果。在后端渲染页面的场景中，返回的结果需要处理为视图View。而现在更普遍的是前后端分离，返回的结果一般处理为JSON格式的数据，前
@选调生在传承红色基因中汲取奋进力量神奇咩咩咩
《习近平谈治国理政》生动记录了习近平总书记领导党和人民应变局、开新局的伟大实践，集中展现了马克思主义中国化的最新成果，是系统反映习近平新时代中国特色社会主义思想的权威著作。作为选调生，学习跟进、认识跟进、行动跟进，全面系统地读原著学原文、悟原理、知原义，重点关注第四卷提出的一系列原创性的治国理政新理念新思想新战略，对于我们进一步加深对中国之路、中国之治、中国之理的理解，深刻体悟这一思想强大的真理力
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他