phpseyo

sphinx(或coreseek)配置文件记录

# Sphinx configuration file sample

# WARNING! While this sample file mentions all available options,

# it contains (very) short helper descriptions only. Please refer to

# doc/sphinx.html for details.

#############################################################################

## data source definition

#############################################################################

source src1

{

# data source type. mandatory, no default value

# known types are mysql, pgsql, mssql, xmlpipe, xmlpipe2, odbc

type = mysql

#####################################################################

## SQL settings (for 'mysql' and 'pgsql' types)

#####################################################################

# some straightforward parameters for SQL source types

sql_host = localhost

sql_user = root

sql_pass = ******

sql_db = ******

sql_port = 3306 # optional, default is 3306

# UNIX socket name

# optional, default is empty (reuse client library defaults)

# usually '/var/lib/mysql/mysql.sock' on Linux

# usually '/tmp/mysql.sock' on FreeBSD

sql_sock = /tmp/mysql.sock

# MySQL specific client connection flags

# optional, default is 0

# 数据传输方式

# mysql_connect_flags = 32 # enable compression

# MySQL specific SSL certificate settings

# optional, defaults are empty

# SLL链接

# mysql_ssl_cert = /etc/ssl/client-cert.pem

# mysql_ssl_key = /etc/ssl/client-key.pem

# mysql_ssl_ca = /etc/ssl/cacert.pem

# MS SQL specific Windows authentication mode flag

# MUST be in sync with charset_type index-level setting

# optional, default is 0

# mssql_winauth = 1 # use currently logged on user credentials

# MS SQL specific Unicode indexing flag

# optional, default is 0 (request SBCS data)

# mssql_unicode = 1 # request Unicode data from server

# ODBC specific DSN (data source name)

# mandatory for odbc source type, no default value

# odbc_dsn = DBQ=C:\data;DefaultDir=C:\data;Driver={Microsoft Text Driver (*.txt; *.csv)};

# sql_query = SELECT id, data FROM documents.csv

# ODBC and MS SQL specific, per-column buffer sizes

# optional, default is auto-detect

# sql_column_buffers = content=12M, comments=1M

# pre-query, executed before the main fetch query

# multi-value, optional, default is empty list of queries

# 发送SQL语句前发送

sql_query_pre = SET NAMES utf8

sql_query_pre = SET SESSION query_cache_type=OFF

# main document fetch query

# mandatory, integer document ID field MUST be the first selected column

# 需要查询的表构建查询

sql_query = \

SELECT id,target_type,genre,stars,sub_title,sports_team,music_band,music_album \

FROM ko_link

#如果多个数据源并要在一个索引,必须要保持字段的顺序数量跟数据都要一致,否则将出错

# joined/payload field fetch query

# joined fields let you avoid (slow) JOIN and GROUP_CONCAT

# payload fields let you attach custom per-keyword values (eg. for ranking)

# syntax is FIELD-NAME 'from' ( 'query' | 'payload-query' ); QUERY

# joined field QUERY should return 2 columns (docid, text)

# payload field QUERY should return 3 columns (docid, keyword, weight)

# REQUIRES that query results are in ascending docuent ID order!

# multi-value, optional, default is empty list of queries

# 添加字段,来源与表自动连接

# 字段结果集保持为

# (1,tags1)

# (1,tags2)

# (2,tags3)

# (2,tags4)

# 添加字段将用于搜索,结果如有第3个字段,第3个字段表示该记录的权重,权重为大于1的值

# sql_joined_field = tags from query; SELECT docid, CONCAT('tag',tagid) FROM tags ORDER BY docid ASC

# sql_joined_field = wtags from payload-query; SELECT docid, tag, tagweight FROM tags ORDER BY docid ASC

# file based field declaration

# content of this field is treated as a file name

# and the file gets loaded and indexed in place of a field

# max file size is limited by max_file_field_buffer indexer setting

# file IO errors are non-fatal and get reported as warnings

# 把字段声明放入文件

# sql_file_field = content_file_path

# range query setup, query that must return min and max ID values

# optional, default is empty

# sql_query will need to reference $start and $end boundaries

# if using ranged query:

# 分区查询,防止MYSQL死锁

# sql_query = \

# SELECT doc.id, doc.id AS group, doc.title, doc.data \

# FROM documents doc \

# WHERE id>=$start AND id<=$end

# sql_query_range = SELECT MIN(id),MAX(id) FROM documents

# range query step

# optional, default is 1024

# 分区查询跳步

# sql_range_step = 1000

# unsigned integer attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# optional bit size can be specified, default is 32

# 声明无符号数字段

#sql_attr_uint = target_type

# sql_attr_uint = forum_id:9 # 9 bits for forum_id

#sql_attr_uint = group_id

#声明BOOL字段

# boolean attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# equivalent to sql_attr_uint with 1-bit size

# sql_attr_bool = is_deleted

# bigint attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# declares a signed (unlike uint!) 64-bit attribute

# 声明长整字段

# sql_attr_bigint = my_bigint_id

# UNIX timestamp attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# similar to integer, but can also be used in date functions

# 声明时间字段

# sql_attr_timestamp = posted_ts

# sql_attr_timestamp = last_edited_ts

#sql_attr_timestamp = date_added

# string ordinal attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# sorts strings (bytewise), and stores their indexes in the sorted list

# sorting by this attr is equivalent to sorting by the original strings

# 声明字符串字段用于排序等,但此字段不会被存储

# sql_attr_str2ordinal = author_name

# floating point attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# values are stored in single precision, 32-bit IEEE 754 format

# 声明浮点字段

# sql_attr_float = lat_radians

# sql_attr_float = long_radians

# multi-valued attribute (MVA) attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# MVA values are variable length lists of unsigned 32-bit integers

# syntax is ATTR-TYPE ATTR-NAME 'from' SOURCE-TYPE [;QUERY] [;RANGE-QUERY]

# ATTR-TYPE is 'uint' or 'timestamp'

# SOURCE-TYPE is 'field', 'query', or 'ranged-query'

# QUERY is SQL query used to fetch all ( docid, attrvalue ) pairs

# RANGE-QUERY is SQL query used to fetch min and max ID values, similar to 'sql_query_range'

# 声明复合字段

# sql_attr_multi = uint tag from query; SELECT docid, tagid FROM tags

# sql_attr_multi = uint tag from ranged-query; \

# SELECT docid, tagid FROM tags WHERE id>=$start AND id<=$end; \

# SELECT MIN(docid), MAX(docid) FROM tags

# string attribute declaration

# multi-value (an arbitrary number of these is allowed), optional

# lets you store and retrieve strings

# 只是把数据存储,但不会索引改字段

# sql_attr_string = stitle

# wordcount attribute declaration

# multi-value (an arbitrary number of these is allowed), optional

# lets you count the words at indexing time

# 将转化成关键字的字段,用于提高匹配率

# sql_attr_str2wordcount = stitle

# combined field plus attribute declaration (from a single column)

# stores column as an attribute, but also indexes it as a full-text field

# 跟sql_attr_string不同是该属性加入索引

# sql_field_string = author

# sql_field_str2wordcount = title

# post-query, executed on sql_query completion

# optional, default is empty

# 取后查询

# sql_query_post =

# post-index-query, executed on successful indexing completion

# optional, default is empty

# $maxid expands to max document ID actually fetched from DB

# 索引后查询

# sql_query_post_index = REPLACE INTO counters ( id, val ) \

# VALUES ( 'max_indexed_id', $maxid )

# ranged query throttling, in milliseconds

# optional, default is 0 which means no delay

# enforces given delay before each query step

#分区查询的时间间隔

sql_ranged_throttle = 0

# document info query, ONLY for CLI search (ie. testing and debugging)

# optional, default is empty

# must contain $id macro and must fetch the document by that id

#命令行调试查询结果用

sql_query_info = SELECT * FROM ko_link WHERE id=$id

# kill-list query, fetches the document IDs for kill-list

# k-list will suppress matches from preceding indexes in the same query

# optional, default is empty

##清理指定查询ID列表,对于数据的更改

# sql_query_killlist = SELECT id FROM documents WHERE edited>=@last_reindex

# columns to unpack on indexer side when indexing

# multi-value, optional, default is empty list

# 启用ZIP压缩可以降低系统负载但必须保证zlib库zlib-dev库可用

# unpack_zlib = zlib_column

# unpack_mysqlcompress = compressed_column

# unpack_mysqlcompress = compressed_column_2

# maximum unpacked length allowed in MySQL COMPRESS() unpacker

# optional, default is 16M

# 压缩缓存区大小不能小于字段存储值

# unpack_mysqlcompress_maxsize = 16M

#####################################################################

## xmlpipe2 配置

#####################################################################

# type = xmlpipe

# shell command to invoke xmlpipe stream producer

# mandatory

# xmlpipe_command = cat /usr/local/sphinx/var/test.xml

# xmlpipe2 field declaration

# multi-value, optional, default is empty

# xmlpipe_field = subject

# xmlpipe_field = content

# xmlpipe2 attribute declaration

# multi-value, optional, default is empty

# all xmlpipe_attr_XXX options are fully similar to sql_attr_XXX

# xmlpipe_attr_timestamp = published

# xmlpipe_attr_uint = author_id

# perform UTF-8 validation, and filter out incorrect codes

# avoids XML parser choking on non-UTF-8 documents

# optional, default is 0

# xmlpipe_fixup_utf8 = 1

}

# inherited source example

# 继承数据源

# all the parameters are copied from the parent source,

# and may then be overridden in this source definition

#source src1throttled : src1

# sql_ranged_throttle = 100

#############################################################################

## index definition

#############################################################################

# local index example

# this is an index which is stored locally in the filesystem

# all indexing-time options (such as morphology and charsets)

# are configured per local index

index test1

{

# index type

# optional, default is 'plain'

# known values are 'plain', 'distributed', and 'rt' (see samples below)

#索引类型本地分布式

# type = plain

# document source(s) to index

# multi-value, mandatory

# document IDs must be globally unique across all sources

#数据源,可以多个数据源

source = src1

# index files path and file name, without extension

# mandatory, path must be writable, extensions will be auto-appended

# 索引保存路径

path = /usr/local/sphinx/var/data/test1

# document attribute values (docinfo) storage mode

# optional, default is 'extern'

# known values are 'none', 'extern' and 'inline'

#索引存储方式

docinfo = extern

# memory locking for cached data (.spa and .spi), to prevent swapping

# optional, default is 0 (do not mlock)

# requires searchd to be run from root

#内存锁定需要保证足够权限

mlock = 0

# a list of morphology preprocessors to apply

# optional, default is empty

# builtin preprocessors are 'none', 'stem_en', 'stem_ru', 'stem_enru',

# 'soundex', and 'metaphone'; additional preprocessors available from

# libstemmer are 'libstemmer_XXX', where XXX is algorithm code

# (see libstemmer_c/libstemmer/modules.txt)

# 词语提取器

# morphology = stem_en, stem_ru, soundex

# morphology = libstemmer_german

# morphology = libstemmer_sv

morphology = stem_en

# minimum word length at which to enable stemming

# optional, default is 1 (stem everything)

# 词干化的最小词长

# min_stemming_len = 1

# stopword files list (space separated)

# optional, default is empty

# contents are plain text, charset_table and stemming are both applied

# 停用搜索词

# stopwords = /usr/local/sphinx/var/data/stopwords.txt

# wordforms file, in "mapfrom > mapto" plain text format

# optional, default is empty

# 词型字典可用spelldump工具生成

# wordforms = /usr/local/sphinx/var/data/wordforms.txt

# tokenizing exceptions file

# optional, default is empty

#Token特例文件,就是有些词是完整词意,不能拆分索引如a&t 跟a & t

# plain text, case sensitive, space insensitive in map-from part

# one "Map Several Words => ToASingleOne" entry per line

# exceptions = /usr/local/sphinx/var/data/exceptions.txt

# minimum indexed word length

# default is 1 (index everything)

# 最小索引长度,就是小于指定长度的词不被索引

min_word_len = 1

# charset encoding type

# optional, default is 'sbcs'

# known types are 'sbcs' (Single Byte CharSet) and 'utf-8'

# 字符编码

charset_type = utf-8

# charset definition and case folding rules "table"

# optional, default value depends on charset_type

# defaults are configured to include English and Russian characters only

# you need to change the table to include additional ones

# this behavior MAY change in future versions

# 'sbcs' default value is

# charset_table = 0..9, A..Z->a..z, _, a..z, U+A8->U+B8, U+B8, U+C0..U+DF->U+E0..U+FF, U+E0..U+FF

# 转换字符表

# 'utf-8' default value is

# charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F

# ignored characters list

# optional, default value is empty

# 忽略字符表

# ignore_chars = U+00AD

# minimum word prefix length to index

# optional, default is 0 (do not index prefixes)

#索引的最小前缀长度,小心使用,索引和搜索的时间皆会恶化

# min_prefix_len = 0

# minimum word infix length to index

# optional, default is 0 (do not index infixes)

#索引的最小中缀长度小心使用,索引和搜索的时间皆会恶化

# min_infix_len = 0

# list of fields to limit prefix/infix indexing to

# optional, default value is empty (index all fields in prefix/infix mode)

# 未知

# prefix_fields = filename

# infix_fields = url, domain

# enable star-syntax (wildcards) when searching prefix/infix indexes

# search-time only, does not affect indexing, can be 0 or 1

# optional, default is 0 (do not use wildcard syntax)

# 启用星号语法

# enable_star = 1

# expand keywords with exact forms and/or stars when searching fit indexes

# search-time only, does not affect indexing, can be 0 or 1

# optional, default is 0 (do not expand keywords)

# 扩大搜索关键字形式如: running -> ( running | *running* | =running )

# expand_keywords = 1

# n-gram length to index, for CJK indexing

# only supports 0 and 1 for now, other lengths to be implemented

# optional, default is 0 (disable n-grams)

# 中文等其他语言的基本支持

# ngram_len = 1

# n-gram characters list, for CJK indexing

# optional, default is empty

#中文或其他语言的值范围

# ngram_chars = U+3000..U+2FA1F

# phrase boundary characters list

# optional, default is empty

# 边界符

# phrase_boundary = ., ?, !, U+2026 # horizontal ellipsis

# phrase boundary word position increment

# optional, default is 0

# 边界符增量

# phrase_boundary_step = 100

# blended characters list

# blended chars are indexed both as separators and valid characters

# for instance, AT&T will results in 3 tokens ("at", "t", and "at&t")

# optional, default is empty

# 混合字符列表

# blend_chars = +, &, U+23

# blended token indexing mode

# a comma separated list of blended token indexing variants

# known variants are trim_none, trim_head, trim_tail, trim_both, skip_pure

# optional, default is trim_none

#未知

# blend_mode = trim_tail, skip_pure

# whether to strip HTML tags from incoming documents

# known values are 0 (do not strip) and 1 (do strip)

# optional, default is 0

# 删除HTML标签 (小心文本被删除)

html_strip = 0

# what HTML attributes to index if stripping HTML

# optional, default is empty (do not index anything)

# 保留的HTML标签

# html_index_attrs = img=alt,title; a=title;

# what HTML elements contents to strip

# optional, default is empty (do not strip element contents)

# 不但删除标签,其包含的文本也将删除

# html_remove_elements = style, script

# whether to preopen index data files on startup

# optional, default is 0 (do not preopen), searchd-only

# 预先打开索引还是每次查询的时候在打开索引

# preopen = 1

# whether to keep dictionary (.spi) on disk, or cache it in RAM

# optional, default is 0 (cache in RAM), searchd-only

# 将字典文件是否保存在内存中

# ondisk_dict = 1

# whether to enable in-place inversion (2x less disk, 90-95% speed)

# optional, default is 0 (use separate temporary files), indexer-only

# 是否启用原地索引倒转将少磁盘使用性能会有一点损失

# inplace_enable = 1

# in-place fine-tuning options

# optional, defaults are listed below

#微调原地倒转

# inplace_hit_gap = 0 # preallocated hitlist gap size

# inplace_docinfo_gap = 0 # preallocated docinfo gap size

# inplace_reloc_factor = 0.1 # relocation buffer size within arena

# inplace_write_factor = 0.1 # write buffer size within arena

# whether to index original keywords along with stemmed versions

# enables "=exactform" operator to work

# optional, default is 0

# 是否在索引原关键词的词干化/重映射后的形式的同时也索引原词

# index_exact_words = 1

# position increment on overshort (less that min_word_len) words

# optional, allowed values are 0 and 1, default is 1

#在经过过短的词（比 min_word_len短的词）处后增加位置值

# overshort_step = 1

# position increment on stopword

# optional, allowed values are 0 and 1, default is 1

#在经过停用词处后增加位置值可选选项

# stopword_step = 1

# hitless words list

# positions for these keywords will not be stored in the index

# optional, allowed values are 'all', or a list file name

# 不能中断的字符列表

# hitless_words = all

# hitless_words = hitless.txt #字符文件

# detect and index sentence and paragraph boundaries

# required for the SENTENCE and PARAGRAPH operators to work

# optional, allowed values are 0 and 1, default is 0

# 是否检查标签合并针对HTML

# index_sp = 1

# index zones, delimited by HTML/XML tags

# a comma separated list of tags and wildcards

# required for the ZONE operator to work

# optional, default is empty string (do not index zones)

# 对HTML标签的权重

# index_zones = title, h*, th

}

# inherited index example

# 索引继承

# all the parameters are copied from the parent index,

# and may then be overridden in this index definition

#index test1stemmed : test1

# path = /usr/local/sphinx/var/data/test1stemmed

# morphology = stem_en

# distributed index example

# this is a virtual index which can NOT be directly indexed,

# and only contains references to other local and/or remote indexes

#index dist1

#分布式索引配置

# 'distributed' index type MUST be specified

# type = distributed

# local index to be searched

# there can be many local indexes configured

# local = test1

# local = test1stemmed

# remote agent

# multiple remote agents may be specified

# syntax for TCP connections is 'hostname:port:index1,[index2[,...]]'

# syntax for local UNIX connections is '/path/to/socket:index1,[index2[,...]]'

# agent = localhost:9313:remote1

# agent = localhost:9314:remote2,remote3

# agent = /var/run/searchd.sock:remote4

# blackhole remote agent, for debugging/testing

# network errors and search results will be ignored

# agent_blackhole = testbox:9312:testindex1,testindex2

# remote agent connection timeout, milliseconds

# optional, default is 1000 ms, ie. 1 sec

# agent_connect_timeout = 1000

# remote agent query timeout, milliseconds

# optional, default is 3000 ms, ie. 3 sec

# agent_query_timeout = 3000

# realtime index example

# you can run INSERT, REPLACE, and DELETE on this index on the fly

# using MySQL protocol (see 'listen' directive below)

#index rt

# 'rt' index type must be specified to use RT index

# type = rt

# index files path and file name, without extension

# mandatory, path must be writable, extensions will be auto-appended

# path = /usr/local/sphinx/var/data/rt

# RAM chunk size limit

# RT index will keep at most this much data in RAM, then flush to disk

# optional, default is 32M

# rt_mem_limit = 512M

# full-text field declaration

# multi-value, mandatory

# rt_field = title

# rt_field = content

# unsigned integer attribute declaration

# multi-value (an arbitrary number of attributes is allowed), optional

# declares an unsigned 32-bit attribute

# rt_attr_uint = gid

# RT indexes currently support the following attribute types:

# uint, bigint, float, timestamp, string

# rt_attr_bigint = guid

# rt_attr_float = gpa

# rt_attr_timestamp = ts_added

# rt_attr_string = author

#############################################################################

## indexer settings

#############################################################################

indexer

{

#索引过程内存使用限制。可选选项，默认32M。

# memory limit, in bytes, kiloytes (16384K) or megabytes (256M)

# optional, default is 32M, max is 2047M, recommended is 256M to 1024M

mem_limit = 32M

# maximum IO calls per second (for I/O throttling)

# optional, default is 0 (unlimited)

# 每秒最大I/O操作次数，用于限制I/O操作。可选选项，默认为0（无限制）。

# max_iops = 40

# maximum IO call size, bytes (for I/O throttling)

# optional, default is 0 (unlimited)

# 最大允许的I/O操作大小，以字节为单位，用于I/O节流。可选选项，默认为0（不限制）。

# max_iosize = 1048576

# maximum xmlpipe2 field length, bytes

# optional, default is 2M

# 对于XMLLpipe2数据源允许的最大的域大小

# max_xmlpipe2_field = 4M

# write buffer size, bytes

# several (currently up to 4) buffers will be allocated

# write buffers are allocated in addition to mem_limit

# optional, default is 1M

# 写缓冲区的大小，单位是字节。可选选项，默认值是1MB。

# write_buffer = 1M

# maximum file field adaptive buffer size

# optional, default is 8M, minimum is 1M

# max_file_field_buffer = 32M

}

#############################################################################

## searchd settings

#############################################################################

searchd

{

# [hostname:]port[:protocol], or /unix/socket/path to listen on

# known protocols are 'sphinx' (SphinxAPI) and 'mysql41' (SphinxQL)

# multi-value, multiple listen points are allowed

# optional, defaults are 9312:sphinx and 9306:mysql41, as below

# listen = 127.0.0.1

# listen = 192.168.0.1:9312

# listen = 9312

# listen = /var/run/searchd.sock

listen = 9312

#listen = 9306:mysql41

# log file, searchd run info is logged here

# optional, default is 'searchd.log'

# 全部searchd运行时事件会被记录在这个日志文件中。

log = /usr/local/sphinx/var/log/searchd.log

# query log file, all search queries are logged here

# optional, default is empty (do not log queries)

# 全部搜索查询会被记录在此文件中。

query_log = /usr/local/sphinx/var/log/query.log

# client read timeout, seconds

# optional, default is 5

#网络客户端请求的读超时时间，单位是秒。

read_timeout = 5

# request timeout, seconds

# optional, default is 5 minutes

#在使用持久连接时，两次查询之间等待的最长时间（单位是秒）。

client_timeout = 300

# maximum amount of children to fork (concurrent searches to run)

# optional, default is 0 (unlimited)

#子进程的最大数量 ,用来控制服务器负载。任何时候不可能有比此设置值更多的搜索同时运行。当达到限制时，新的输入客户端会被用临时失败（SEARCH_RETRY）状态码驳回，同时给出一个声明服务器已到最大连接限制的消息。

max_children = 30

# PID file, searchd process ID file name

# mandatory

#进程ID文件

pid_file = /usr/local/sphinx/var/log/searchd.pid

# max amount of matches the daemon ever keeps in RAM, per-index

# WARNING, THERE'S ALSO PER-QUERY LIMIT, SEE SetLimits() API CALL

# default is 1000 (just like Google)

#守护进程在内存中为每个索引所保持并返回给客户端的匹配数目的最大值。

max_matches = 1000

# seamless rotate, prevents rotate stalls if precaching huge datasets

# optional, default is 1

#防止 searchd 轮换在需要预取大量数据的索引时停止响应。可选选项，默认为1（启用无缝（seamless）轮换）。

seamless_rotate = 1

# whether to forcibly preopen all indexes on startup

# optional, default is 1 (preopen everything)

#是否在启动是强制重新打开所有索引文件。可选选项，默认为0（不重新打开）。

preopen_indexes = 1

# whether to unlink .old index copies on succesful rotation.

# optional, default is 1 (do unlink)

#索引轮换成功之后，是否删除以.old为扩展名的索引拷贝。可选选项，默认为1（删除这些索引拷贝）。

unlink_old = 1

# attribute updates periodic flush timeout, seconds

# updates will be automatically dumped to disk this frequently

# optional, default is 0 (disable periodic flush)

# UpdateAttributes() 调用时候更新是否隔一段时间写入磁盘

# attr_flush_period = 900

# instance-wide ondisk_dict defaults (per-index value take precedence)

# optional, default is 0 (precache all dictionaries in RAM)

#对 ondisk_dict 指令的全局的默认值。可选选项，默认值是0（将字典预先缓冲到内存）。

# ondisk_dict_default = 1

# MVA updates pool size

# shared between all instances of searchd, disables attr flushes!

# optional, default size is 1M

#网络通讯时允许的最大的包的大小。

mva_updates_pool = 1M

# max allowed network packet size

# limits both query packets from clients, and responses from agents

# optional, default size is 8M

#用于多值属性MVA更新的存储空间的共享池大小。

max_packet_size = 8M

# crash log path

# searchd will (try to) log crashed query to 'crash_log_path.PID' file

# optional, default is empty (do not create crash logs)

#崩溃日志文件的路径

# crash_log_path = /usr/local/sphinx/var/log/crash

# max allowed per-query filter count

# optional, default is 256

#每次查询允许设置的过滤器的最大个数。只用于内部检查，不直接影响内存使用或性能。

max_filters = 256

# max allowed per-filter values count

# optional, default is 4096

#单个过滤器允许的值的最大个数。只用于内部检查，不直接影响内存使用或性能。

max_filter_values = 4096

# socket listen queue length

# optional, default is 5

#TCP监听积压列表长度。无法如对的请求立即失败并收到“连接被拒”错误信息

# listen_backlog = 5

# per-keyword read buffer size

# optional, default is 256K

#每个关键字的读缓冲区的大小。可选选项，默认值是256K。

# read_buffer = 256K

# unhinted read size (currently used when reading hits)

# optional, default is 32K

#无提示时读操作的大小。可选选项，默认值是32K。

# read_unhinted = 32K

# max allowed per-batch query count (aka multi-query count)

# optional, default is 32

#限制每批次的查询量。一个OPEN之后的查询量

max_batch_queries = 32

# max common subtree document cache size, per-query

# optional, default is 0 (disable subtree optimization)

# subtree_docs_cache = 4M

# max common subtree hit cache size, per-query

# optional, default is 0 (disable subtree optimization)

# 限制RAM使用一个共同的子树优化默认不优化

# subtree_hits_cache = 8M

# multi-processing mode (MPM)

# known values are none, fork, prefork, and threads

# optional, default is fork

# 工作方式

workers = threads # for RT to work

# max threads to create for searching local parts of a distributed index

# optional, default is 0, which means disable multi-threaded searching

# should work with all MPMs (ie. does NOT require workers=threads)

# dist_threads = 4

# binlog files path; use empty string to disable binlog

# optional, default is build-time configured data directory

# 二进制日志路径

# binlog_path = # disable logging

# binlog_path = /usr/local/sphinx/var/data # binlog.001 etc will be created there

# binlog flush/sync mode

# 0 means flush and sync every second

# 1 means flush and sync every transaction

# 2 means flush every transaction, sync every second

# optional, default is 2

# 日志刷新模式

# binlog_flush = 2

# binlog per-file size limit

# optional, default is 128M, 0 means no limit

#最大日志大小

# binlog_max_log_size = 256M

# per-thread stack size, only affects workers=threads mode

# optional, default is 64K

#每个线程的堆栈大小。

# thread_stack = 128K

# per-keyword expansion limit (for dict=keywords prefix searches)

# optional, default is 0 (no limit)

# 扩大为一个关键字的最大数目

# expansion_limit = 1000

# RT RAM chunks flush period

# optional, default is 0 (no periodic flush)

#RT索引在内存中检查的时间

# rt_flush_period = 900

# query log file format

# optional, known values are plain and sphinxql, default is plain

# 查询日志格式

# query_log_format = sphinxql

# version string returned to MySQL network protocol clients

# optional, default is empty (use Sphinx version)

# MYSQL版本

# mysql_version_string = 5.0.37

# trusted plugin directory

# optional, default is empty (disable UDFs)

# 插件目录

# plugin_dir = /usr/local/sphinx/lib

# default server-wide collation

# optional, default is libc_ci

# 链接字符集

# collation_server = utf8_general_ci

# server-wide locale for libc based collations

# optional, default is C

# collation 选项

# collation_libc_locale = ru_RU.UTF-8

# threaded server watchdog (only used in workers=threads mode)

# optional, values are 0 and 1, default is 1 (watchdog on)

# 是否启用服务器监控进程

# watchdog = 1

# SphinxQL compatibility mode (legacy columns and their names)

# optional, default is 0 (SQL compliant syntax and result sets)

#sphinxql 兼容模式

# compat_sphinxql_magics = 1

}

# --eof--

你可能感兴趣的:(搜索引擎)

Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
网站推广爬虫 Bearjumpingcandy 爬虫
网站推广爬虫是一种用于升网站曝光度和推广效果的工具。它通过自动化地访问和收集网站信息，从而实现对目标网站的广告、关键词、排名等数据进行分析和优化。以下是网站推广爬虫的一些介绍：数据收集：网站推广爬虫可以自动访问目标网站，并收集相关的数据，如网站流量、关键词排名、竞争对手信息等。这些数据可以帮助网站推广人员了解网站的现状和竞争环境，从而制定相应的推广策略。关键词优化：通过分析搜索引擎的关键词排名情况
SpringBoot整合ES搜索引擎实现网站热搜词及热度计算码踏云端 springboot Elasticsearch spring boot elasticsearch 后端热搜词热度计算 java
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
2019.1.6 root_restart
1.新版研学行程公众号推送及页面改动，以后继续尝试无logo版行程单方便转发，附带一篇研学政策解读2.百家号，头条号，搜狐号注册认证及审核，后续每天会在上面更新以往研学活动，增加搜索引擎中山大研学和雨滴教育的关联3.与鹿老师探讨研究方便代理的新宣传模式
只有一个诚字最重要（3.22）胡同学的读书笔记
1人们会认为谷歌是搜索引擎。而事实上，谷歌是第一个以机器为主导的搜索引擎，这个分类在谷歌之前是不存在的，而你必须要认识到谷歌的这个秘密才能判断它与其他公司的不同之处。2如果我目前在一个公司，当大家不知道未来的路怎么走，过去的路也已经彻底放弃了，我会先把事实摆在所有人面前，然后让大家讨论，在争论的过程中产生一个纲领性的共识，让每个部门在大的纲领下去寻求一种变化，不再以增长和竞争为纲，而是转移到产品和
写出渗透测试信息收集详细流程卿酌南烛_b805
一、扫描域名漏洞：域名漏洞扫描工具有AWVS、APPSCAN、Netspark、WebInspect、Nmap、Nessus、天镜、明鉴、WVSS、RSAS等。二、子域名探测：1、dns域传送漏洞2、搜索引擎查找（通过Google、bing、搜索c段）3、通过ssl证书查询网站：https://myssl.com/ssl.html和https://www.chinassl.net/ssltools
【ShuQiHere】快速排序（Quick Sort）：揭开高效排序算法的神秘面纱 ShuQiHere 排序算法算法数据结构
【ShuQiHere】引言在计算机科学中，排序算法是我们日常编程不可或缺的一部分。无论是处理大量数据、优化搜索引擎，还是进行系统性能提升，排序算法都起到了至关重要的作用。在所有的排序算法中，快速排序（QuickSort）凭借其高效性和灵活的分治策略成为最受欢迎的排序算法之一。在这篇博客中，我们将深入探讨快速排序的原理、性能分析以及如何通过优化策略进一步提升其效率。1.什么是快速排序？（QuickS
海量数据查找最大K个值：数据结构与算法的选择星辰@Sea 数据结构 Java 数据结构
在处理大数据集时，经常需要找到数据集中最大的K个元素，这样的需求在很多领域都有广泛应用，例如推荐系统中寻找评分最高的K个商品、数据分析中找出最重要的K个特征、搜索引擎中找到排名前K的结果等等。面对海量数据，传统的排序方法可能不再适用，因为它们通常具有较高的时间复杂度。因此，选择合适的数据结构和算法对于提高效率至关重要。本文将详细介绍如何在海量数据集中查找最大的K个值，探讨不同的数据结构与算法选择，
全面解析MeiliSearch及其Go语言实现寻找09之夏 Meilisearch golang 开发语言后端 Meilisearch
前言随着互联网的发展和数字化进程的加速，无论是企业还是个人用户，都需要面对海量的信息。在这个背景下，搜索技术的重要性日益凸显。MeiliSearch是一款开源搜索引擎，它的出现为开发者提供了一个高效、灵活的选择。本文将从多个角度探讨MeiliSearch的特性、使用方法及其实现原理，并通过Go语言示例展示如何构建一个高性能的搜索系统。一、MeiliSearch特性MeiliSearch之所以受到欢
面对信息茧房，我们如何破局？听风便是雨_
当我们进入了互联网时代，信息的交互变得无比地便捷，当你需要什么样的信息，只需要在搜索引擎上输入，便可立马查询到你想要的结果，而且现在随着抖音、微博之类的应用APP的出现，我们本应从这些APP中获得更加丰富的知识或者信息，来开阔我们的眼界。但是事实上，我们仿佛没有获得预期的效果，更甚至于陷入更大的怪圈当中——缺乏耐心，不能容忍与自己想法不一样的他人建议，失去了与外界良好沟通的能力以及开拓自己的眼界的
80%的人都知道的——内容营销老泊
我们已经知道内容营销是依靠内容来进行营销，一起看一下内容营销的工作流吧。选题创作投放主要内容营销的选题类型-常青树：用户长时间关心的，比如房价，教育-热点：用户短时间关心的，比如八卦，实事二八原则常青树话题等等选题来源：访谈法：寻找目标用户尽可能一对一进行访谈，用户反馈的问题都可以成为你的选题来源数据法：利用搜索引擎获取内容选题。利用爬虫工具看看人们都比较关心哪些话题来作为选题基于时事的选题数据工
50.复盘变现之路 506小棉袄
1.昨天下载了头条，用搜索引擎找到了如何写文章。注册了一下。这一切其实都好简单，但是自己就是拖着没有做，而且还心安理得。现在在管理别人，于是用自己做到了才能教别人去做到来要求自己发现也不难。2.日更被我捡了起来。后面没有特殊情况，我会一直更下去。放弃一件事很容易，坚持自己喜欢的事也不会太难。3.今天完成了50关的最后一关，接下来就要挑战100关。想看看自己的极限在哪里。具体做法：1.每天早起一小时
NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
Django：Python高级Web框架详解及参数设置零度° python python django 前端
Django是一个高级的PythonWeb框架，它鼓励快速开发和简洁实用的设计。Django遵循MVC设计模式，提供了一套完整的解决方案，用于构建复杂的、数据库驱动的网站。Django的主要特点自动管理数据库：通过ORM（对象关系映射）自动管理数据库。自动生成站点地图：支持搜索引擎优化（SEO）。用户身份认证：内置用户认证系统。中间件支持：强大的中间件支持，可以处理请求和响应。跨站请求伪造（CSR
ES(Elasticsearch)常用的函数遨游在知识的海洋里无法自拔 java
Elasticsearch（简称ES）是一个开源的搜索引擎，广泛用于全文搜索、分析和数据可视化。以下是一些常用的Elasticsearch函数和操作：索引操作创建索引PUT/index_name删除索引DELETE/index_name查看索引GET/index_name文档操作插入文档POST/index_name/_doc/{"field":"value"}获取文档GET/index_name
HTML 图片一壶浊酒.. 前端开发 html 前端
在HTML中，我们可以使用img标签来显示一张图片。对于img标签，我们只需要掌握它的三个属性：src、alt和title。alt属性用于描述图片，这个描述文字是给搜索引擎看的，并且当图片无法显示时，页面会显示alt中的文字。title属性也用于描述图片，不过这个描述文字是给用户看的，并且当鼠标指针移到图片上时，会显示title中的文字。colspan属性body{background-color
生信学习Day-1 GJJDr
1.如何学习2.怎样解决学习中遇到的问题？a.第一步:搜索：首选-谷歌，其次-必应，大神级的搜索引擎：虫部落快搜。专业教程-搜狗微信、搜狗知乎、、githubb.第二步：如果你的问题不知该如何搜索，可在微信群中与小组成员讨论c.第三步：正确的提问3.如何搭建高效的学习平台a.效率软件:（1）浏览器-chrome浏览器简洁高效无广告，可以添加插件，比如”沙拉查词”（自行搜索），可以即时翻译。（2）电
优质素材的六个搜索技巧老李大李和小李
一是要有耐心哦耐心不但是搜索的技巧而且是前提的、必要的。没有耐心进行搜索就不会有大量的好的输入。二是多关键词这个就像我们在搜索引擎中使用的方法，输入关键词反复搜索就会发现好多有用的而且是我们未知的知识。三是多渠道我们要利用各种搜索引擎和各种方式包括读书、和人聊天的方法来搜集资料。四是多维度至少要从三方面着手～文字、图片、视频。五是精准搜索有了前面做的功课，我们要对主题和材料进行凝炼～取其精华去除无
什么是黑链？什么是黑帽？什么是明链？倔强的小蚁云Zt 网络数据库 tcp/ip 运维
什么是黑链？什么是黑帽？什么是明链？黑链有哪几种表示方式！怎样预防黑链？首先我们说下黑链定义:黑链是SEO黑帽手法中相当普遍的一种手段，笼统地说，它就是指一些人用非正常的手段获取的其它网站的反向链接，最常见的黑链就是通过各种网站程序漏洞获取搜索引擎权重或者PR较高的网站的WEBSHELL，进而在被黑网站上链接自己的网站。黑链的写法黑链文本黑链标签被放在一个隐藏的div中。用户在浏览器中是无法看到的
精准剖析白帽SEO和黑帽SEO的区别 heimaoxuexi 黑帽seo 黑帽 seo 黑帽seo技术
我们都知道，SEO就是搜索引擎优化，是对网站进行内部及外部的不断调整优化，改进网站在搜索引擎中的关键词自然排名，获得更多流量。而SEO又分为白帽SEO和黑帽SEO，SEO中的黑帽SEO技术http://www.heimaolianmeng.com。根据做网站的实战经验，分享一下自己对于白帽SEO和黑帽SEO的见解。一、白帽SEO1、符合用户体验原理就是指我们网站上做的任何内容、任何图片以及任何网站
【程序员必读】如何利用AI高效编程，从容准时下班！ z千鑫 AI领域人工智能 Agent AI工具 AI助手工作流 AI编程 ai
前言：在编程的旅途中，程序员们常常面临各种挑战，尤其是在编写代码时，难题层出不穷。尽管传统搜索引擎提供了海量信息，但往往让我们在无尽的例子和复杂分析中迷失，难以找到真正适合自己的解决方案。正因如此，越来越多的程序员开始借助AI的力量，轻松应对这些难题，让工作变得更高效，从而实现准时下班的目标。问题：那么如何利用AI编写代码呢？一、明确问题的核心在使用AI生成代码之前，首先要明确你所遇到的问题是什么
万字详解PHP+Sphinx中文亿级数据全文检索实战（实测亿级数据0.1秒搜索耗时）小松聊PHP进阶 MySQL PHP 全文检索 php sphinx mysql sql 数据库服务器
Sphinx查询性能非常厉害，亿级数据下输入关键字，大部分能在0.01~0.1秒，少部分再5秒之内查出数据。Sphinx官方文档：http://sphinxsearch.com/docs/sphinx3.html极简概括：由C++编写的高性能全文搜索引擎的开源组件，C/S架构，跨平台（支持Linux、Windows、MacOS），支持分布式部署，并可直接适配MySQL。解决问题：因为MySQL的l
弹性搜索引擎Elasticsearch：本地部署与远程访问指南猴哥是肖鸿人工智能技术指导专升本 jenkins 运维
在大数据时代，数据搜索和分析成为企业核心竞争力的关键因素。弹性搜索引擎Elasticsearch作为一种分布式、可扩展的搜索和分析引擎，受到广泛欢迎。本文将介绍Elasticsearch的本地部署与远程访问，帮助读者更好地利用这一强大的工具。一、本地部署环境准备在开始部署Elasticsearch之前，需要准备以下环境：操作系统：Elasticsearch支持多种操作系统，如Linux、Windo
程序员如何平衡日常编码工作与提升式学习？--编程之路：平衡与成长的艺术青云交教学 java学习学习高效编码习惯与时间管理技巧提升式学习的策略职业发展与个人成长的和谐共生编程教会你如何思考--比尔盖茨 Java学习方法时间管理
目录引言：正文：方向一：高效编码习惯与时间管理技巧方向二：提升式学习的策略方向三：职业发展与个人成长的和谐共生结束语：引言：在当今科技飞速发展的时代，编程已成为一项至关重要的技能。正如比尔·盖茨所说：“编程教会你如何思考。”对于程序员来说，如何在繁忙的日常编码工作中不断提升自己，实现职业发展与个人成长的双赢，是一个极具挑战性的问题。例如，谷歌的搜索引擎算法就是一个经典的编程案例，它通过高效的算法和
2023-03-15 困的晕_5c43
1.简述引擎有哪些类型，各类搜索引擎的工作原理是什么。.（1）全文索引型（2）目录索引型（3）元数据索引型（4）垂直索引型（5）互动式索引型搜索引擎的原理可以分为：数据收集、建立索引数据库、索引数据库中搜索和排序。2.新媒体内容搜集工具有哪些？尝试使用这些工具搜集一些当前热点话题第一个：爆文素材采集工具做新媒体运营，每天都需要去搜集大量的爆文视频等素材，这里给大家推荐一个自媒体爆文素材采集工具--
云计算技术与应用 - 了解认识云计算 ZuckD 云计算运维
云计算的背景互联网自1960年开始兴起，主要用于军方、大型企业等之间的纯文字电子邮件或新闻集群组服务。直到1990年才开始进入普通家庭，随着web网站与电子商务的发展，网络已经成为了目前人们离不开的生活必需品之一。云计算这个概念首次在2006年8月的搜索引擎会议上提出，成为了互联网的第三次革命。近几年来，云计算也正在成为信息技术产业发展的战略重点，全球的信息技术企业都在纷纷向云计算转型。我们举例来
LlamaIndex 使用 RouterOutputAgentWorkflow hawk2014bj llamaIndex LLM agent
LlamaIndex中提供了一个RouterOutputAgentWorkflow功能，可以集成多个QueryTool，根据用户的输入判断使用那个QueryEngine，在做查询的时候，可以从不同的数据源进行查询，例如确定的数据从数据库查询，如果是语义查询可以从向量数据库进行查询。本文将实现两个搜索引擎，根据不同Query使用不同QueryEngine。安装MySQL依赖pipinstallmys
五类学习技巧之搜索技巧│《学习力》笔记06 翟树纯
在当今信息爆炸的时代，搜索引擎就相当于我们的外接大脑，为了充分发挥搜索引擎的威力，就要提高自己的搜索能力。我们平时用的最多的就是通用搜索引擎，以百度为例，不仅可以用来搜索文字，还可以进行学术搜索、图片搜索、视频搜索、地图搜索。术业有专攻，除了百度之类的通用搜索引擎，还有其他的专业搜索引擎，如网站历史查询、高清图库、学术网站、商业数据库等。01搜索两大原则1．换位思考从搜索引擎的角度思考，用关键词检
NLP面试题（9月4日笔记）好好学习Py 自然语言处理自然语言处理笔记人工智能
常见的分词方法分词是将连续的子序列按照一定的规则进行重新组合形成词序列的过程，是NLP领域内最基础的内容。常见的分词方法有jieba分词，jieba分词支持多种分词模模式：精确模式，全模式，搜索引擎模式。1）精确模式：将句子最精确的进行切分，适合文本分析，在日常工作中最为常用；2）全模式：将句子中所有可以成词的词语都扫描出来，速度非常快，但不能消除歧义。3）搜索引擎模式：在精确模式的基础上，对长词
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt