AdolphYang

Lucene.Net 站内搜索

一全文检索：

like查询是全表扫描(为性能杀手)
Lucene.Net搜索引擎,开源,而sql搜索引擎是收费的
Lucene.Net只是一个全文检索开发包(只是帮我们存数据取数据,并没有界面,可以看作一个数据库,只能对文本信息进行检索)
Lucene.Net原理:把文本切词保存,然后根据词汇表的页来找到文章

二分词算法：

//一元分词算法(引用Lucene.Net.dll)

            //一元分词算法（已过时）
            Analyzer analyzer = new StandardAnalyzer();
            TokenStream tokenStream = analyzer.TokenStream("", new StringReader("北京，HI欢饮你hello word"));
            Lucene.Net.Analysis.Token token = null;
            while ((token = tokenStream.Next()) != null)
            {
                Console.WriteLine(token.TermText());
            }
            Console.ReadKey();

一元分词算法

//二元分词算法(CJK:China Japan Korean 需要再引用CJKAnalyzer.cs/CJKTokenizer.cs)

            //二元分词算法（CJK:China Japan Korean）
            Analyzer analyzer = new CJKAnalyzer(); // new StandardAnalyzer();
            TokenStream tokenStream = analyzer.TokenStream("", new StringReader("北京，HI欢饮你"));
            Lucene.Net.Analysis.Token token = null;
            while ((token = tokenStream.Next()) != null)
            {
                Console.WriteLine(token.TermText());
            }
            Console.ReadKey();

二元分词算法

//基于词库的分词算法(盘古分词算法)

打开PanGu4Luene\WebDemo\Bin,将Dictionaries添加到项目根路径(改名Dict),对于其下的文件，在其属性里，输出目录修改为如果较新则复制
添加PanGu.dll的引用(如果直接引用PanGu.dll则必须不带PanGu.xml)
添加PanGu4Luene\Release中PanGu.Luene.Analyzer.dll的引用

其中PanGu_Release_V2.3.1.0\Release\DictManage.exe可以查看Dict.dct二进制词库,既可以查看词汇也可以加入词汇

            //基于词库的分词算法（盘古分词）
            Analyzer analyzer = new PanGuAnalyzer();
            TokenStream tokenStream = analyzer.TokenStream("", new StringReader("北京，HI欢饮你hello word"));
            Lucene.Net.Analysis.Token token = null;
            while ((token = tokenStream.Next()) != null)
            {
                Console.WriteLine(token.TermText());
            }
            Console.ReadKey();

盘古分词算法

三写入索引

Luene.Net写入类介绍

打开文件夹,指定要写入的文件夹
文件加锁,避免两个人同时写入文件(并发)
判断是否文件中有数据,有的话就更新数据,没有就创建
逐一读取待读文件中文本并写入文档
写之后进行close,则表示解锁,可以由其他人写入(加锁写入过程中程序出现bug需要强制解锁时可能出问题)
各种类的作用:
Directory保存数据:FSDirectory(文件中),RAMDirectory(内存中)
IndexReader对索引库进行读取的类,IndexWriter对索引库进行写的类
IndexReader的bool IndexExists(Directory directory)判断目录是否是一个索引目录
IndexWriter的bool IsLocked(Directory directory)判断目录是否是锁定的
IndexWriter在进行写操作时会自动加锁,close的时候会自动解锁.IndexWriter.Unlock方法手动解锁(比如还没来得及close IndexWriter程序就崩溃了,可能造成一直被锁定)
IndexWriter(Directory dir,Analyzer a,bool create,MaxFieldLength mfl)写入哪个文件夹,采用什么分词算法,是否是创建,最大大小
void AddDocument(Document doc),向索引中添加文档
Add(Field field)向文档中添加字段
DeleteAll()删除所有文档,DeleteDocuments按照条件删除文档
File类得构造函数 Field(string name,string value,Field.Store store,Field.Index index,Field.TermVector termVector)
上面依次表示:(字段名,字段值,是否把原文保存到索引中,index表示如何创建索引(Field.Index需要进行全文检索,NOT_ANALYZED不需要的),termVector表示索引词之间的距离,超出则关联度低)
处理并发(写的时候只能逐一写入):用消息队列保证只有一个程序(线程)对索引操作,其他程序不直接进行索引库的写入,而是把要写入的数据放入消息队列,由单独的程序从消息队列中取数据进行索引库的写入

文章在新增和编辑时写入索引：

引用4个ServiceStack的dll用于队列

引用Quartz.dll/Common.Logging.dl用于定时任务

引用Lucene.Net.dll/PanGu.dll/PanGu.Lucene.Analyzer.dll用于写入索引

添加Dictionary改名Dict，旗下文件修改为如果较新则复制

/// <summary>
        /// 入队列（用于新闻索引的队列集合）
        /// </summary>
        /// <param name="news"></param>
        public void EnqueueForNewsSearch(TD_NEWS news)
        {
            //获得新闻信息
            Dictionary<string, object> dict = new Dictionary<string, object>();
            dict["ID"] = news.ID;
            dict["CATEGORYID"] = news.CATEGORYID;
            dict["TITLE"] = news.TITLE;
            dict["CONTENT"] = news.CONTENT;
            string json = CommonHelper.Serializer(dict);
            //入队列
            using (IRedisClient client=RedisManager.ClientManager.GetClient())
            {
                client.EnqueueItemOnList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX, json);
            }
        }

文章新增或编辑时入队列

namespace DIDAO.Timer
{
    /// <summary>
    /// 新闻索引（出队列，把每一条新闻信息 写入新闻索引）
    /// </summary>
    public class NewsIndex
    {
        public void Start()
        //public void Execute(JobExecutionContext context)
        {
            while(true)
            {
                using(IRedisClient client=RedisManager.ClientManager.GetClient())
                {
                    string json = client.DequeueItemFromList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX);
                    if (json == null)
                    {
                        Thread.Sleep(100);
                        //return;
                    }
                    else
                    {
                        //获得新闻信息
                        Dictionary<string, object> dict = (Dictionary<string, object>)CommonHelper.DeSerializer( json);
                        TD_NEWS news = new TD_NEWS();
                        news.ID = Convert.ToInt64(dict["ID"]);
                        news.CATEGORYID = Convert.ToInt64(dict["CATEGORYID"]);
                        news.TITLE = dict["TITLE"].ToString();
                        news.CONTENT = dict["CONTENT"].ToString();
                        //一条一条写入索引
                        WriteToNewsIndex(news.ID, news.CATEGORYID, news.TITLE, news.CONTENT);
                    }
                }
            }
        }

        /// <summary>
        /// //一条一条写入索引
        /// </summary>
        /// <param name="id"></param>
        /// <param name="categoryid"></param>
        /// <param name="title"></param>
        /// <param name="content"></param>
        private void WriteToNewsIndex(long id, long categoryid, string title, string content)
        {
            FSDirectory directory = null;
            IndexWriter writer = null;
            try
            {
                string indexPath =@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsIndex"; //目录
                directory = FSDirectory.Open(new DirectoryInfo(indexPath), new NativeFSLockFactory()); //获得新的索引目录：打开索引的目录并加锁，防止并发写入
                bool exist = IndexReader.IndexExists(directory);
                if (exist) //如果读取时，目录中有索引
                {
                    if(IndexWriter.IsLocked(directory)) //且写入时，目录原先是锁定的，则需要手动强制解锁（说明原先是异常退出，没有解锁）
                    {
                        IndexWriter.Unlock(directory);
                    }
                }
                //向目录中一条一条的写入索引
                //初始化 "写入索引"（目录，分词算法，是否创建，最大字段长度）
                writer = new IndexWriter(directory, new PanGuAnalyzer(), !exist, IndexWriter.MaxFieldLength.UNLIMITED);
                //初始化一个文档，向文档添加字段，把文档写入索引
                Document doc = new Document();
                doc.Add(new Field("id", id.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
                doc.Add(new Field("categoryid", categoryid.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
                doc.Add(new Field("title", title, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
                doc.Add(new Field("content", content, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
                writer.AddDocument(doc);
            }
            finally
            {
                if(writer!=null)
                {
                    writer.Close(); //释放 写入索引资源
                }
                if(directory!=null)
                {
                    directory.Close(); //释放 打开目录资源
                }
            }
        }
    }
}

文章出队列写入索引

写入索引如果报错：

未能加载文件或程序集“PanGu, Version=2.3.0.0, Culture=neutral, PublicKeyToken=null”
或它的某一个依赖项。系统找不到指定的文件。

原因：

执行这个写入索引的令一个程序也需要引用PanGu.dll，最先执行写入索引的程序与后面真正类所在的索引是相互依赖的。

四文章搜索：

query.Add(new Term("字段名","关键词"))
query.Add(new Term("字段名2","关键词2"))
类似于:where 字段名contains关键词 and 字段名2contains关键词2
PhraseQuery用于进行多个关键词的检索
PhraseQuery.SetSlop(int slop)用来设置单词之间的最大距离
BooleanQuery可以实现字段名contains关键词or字段名2contains关键词2

搜索时所采用的分词算法必须和生成索引时一致，即盘古分词算法

总条数 totalSize = collector.GetTotalHits()

查询结果集合应该是从(pagenum-1)*5,pagenum*5,但是collector.TopDocs(m,n)的m是从0开始、n是条数

#region 新闻搜索
                #region 逻辑
                //1    获得所有关键词 //获得当前页 pagenum 
                //2    遍历关键词 //用盘古分词的Segment进行切词 
                //3    添加按关键词查询 
                //4    设置关键词间距离 

                //5    打开目录并不加锁 获得目录 
                //6    打开目录 进行索引读取 
                //7    从索引读取中初始化搜索 
                //8    获得查询结果的100条结果
                //9    在这个结果中，按照query这个条件进行搜索 
                //10 获得搜索结果的第m-n条结果 （//获得总条数 totalszie //设置每页多少条 pagesize //获得搜索结果的 (pagenum-1)*PageSize,pagesize 的搜索结果 ）
                //11    遍历结果【
                //12    获得每一条结果的Lucene所分配的文档id 
                //13    根据文档id搜索到文档 
                //14    获得该文档的某个字段的值 
                //15    拼接url和title，添加到结果集合 】
                //16    把这个结果集合解析到某个cshtml  
                #endregion
                #region 获得请求
                string keywords = context.Request["keywords"].Trim();
                string pagenumStr = context.Request["pagenum"];
                //验证 非空
                if (string.IsNullOrWhiteSpace(keywords))
                {
                    return;
                }
                //获得当前页
                int pagenum = 1;
                if (!string.IsNullOrWhiteSpace(pagenumStr) && VolidHelper.CheckStringIsInt(pagenumStr))
                {
                    pagenum = Convert.ToInt32(pagenumStr);
                } 
                #endregion
                #region 查询条件
                //用盘古分词的Segment进行切词 
                PanGu.Segment segment = new PanGu.Segment();
                var wordInfos = segment.DoSegment(keywords); //获得切词集合
                //查询方式
                PhraseQuery query = new PhraseQuery(); //适用多个关键词的查询
                foreach (var wordInfo in wordInfos)
                {
                    query.Add(new Term("content", wordInfo.Word)); //添加查询条件
                }
                query.SetSlop(1000); //设置关键词间距离  
                #endregion
                //获得查询的结果集合
                List<TD_NewsSearchResult> results = new List<TD_NewsSearchResult>();
                FSDirectory directory = FSDirectory.Open(new DirectoryInfo(@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsIndex"), new NoLockFactory()); //打开目录不加锁，并获得目录
                IndexReader reader = IndexReader.Open(directory, true); //打开目录，并获得索引读取类IndexReader
                IndexSearcher searcher = new IndexSearcher(reader); //通过索引读取类 初始化索引搜索类IndexSearcher 
                TopScoreDocCollector collector = TopScoreDocCollector.create(1000, true); //通过TopScoreDocCollector获得最多1000条的查询结果
                searcher.Search(query, null, collector); //按query条件 从查询结果collector 进行搜索
                int totalsize = collector.GetTotalHits(); //搜索结果的总条数 
                int pagesize = 10; //每页多少条  (pagenum-1)*pagesize,pagesize （从0开始取）
                ScoreDoc[] docs = collector.TopDocs((pagenum - 1) * pagesize, pagesize).scoreDocs; //获得搜索结果collector的第m-n条的文档结果ScoreDoc 
                foreach (ScoreDoc scoredoc in docs) //遍历文档结果集
                {
                    int docId = scoredoc.doc; //获得文档结果Lucene所分配的文档id 
                    Document doc = searcher.Doc(docId); //根据文档id搜索到文档
                    long id = Convert.ToInt64(doc.Get("id")); //获得该文档的 字段id的值
                    long categoryid = Convert.ToInt64(doc.Get("categoryid")); //获得该文档的 字段id的值
                    string title = doc.Get("title");
                    string content = doc.Get("content");
                    TD_NewsSearchResult nsr = new TD_NewsSearchResult();
                    nsr.URL = "/News/" + categoryid + "/" + id + ".shtml";
                    nsr.TITLE = title;
                    results.Add(nsr);
                }
                RazorHelper.RazorParse(context, "~/News/NewsSearch.cshtml", new { results = results, keywords = keywords,
                                totalsize=totalsize, pagesize=pagesize,currpage=pagenum }); 
                #endregion

NewsController.ashx?action=search

五写入索引优化：

通过多线程避免界面卡死：

因为耗时操作会阻塞主进程，所以需要把耗时操作放入子线程

因为主线程关闭，则子线程也会关闭，所以需要把子线程设置为后台子线程，这样主线程关闭，子线程会继续

示例：

        private void btnMainThread_Click(object sender, EventArgs e)
        {
            Thread thread = new Thread(F1); //把把耗时操作F1 委托给子线程thread 
            thread.IsBackground = true; //把子线程设置为后台子线程 （从而主线程关闭，后台线程依然继续）
            thread.Start(); //启动这个后台子线程 
        }

        //子线程中执行耗时操作 
        private void F1()
        {
            string path = @"G:\RuPeng_yangguo_work\EasyUi.rar";
            for (int i = 0; i < 1000;i++ )
            {
                File.ReadAllBytes(path);
                //如果子线程要操作界面控件，需要控件的BeginInvoke(new Action(()=>{...})) 
                textBox1.BeginInvoke(new Action(() =>
                {
                    textBox1.Text = "正在读取文件第" + i + "次";
                }));
            }
        }

testThread.Form1.cs

实例：

//定时任务,子进程中出队列,然后写入文章索引,关闭窗口时终止子进程(出队列)和quartz.net进程
首先,启动窗体,执行定时任务,而定时的任务是进行新闻的出队列
然后,新闻的出队列是耗时操作,需要委托子进程,并设为后台进程,然后开始执行进程,其中出队列进程的控制由while(IsRunning)控制,先预先设置IsRunning=true
IsRunning = true;
Thread thread = new Thread(RunScan);//委托给子线程去RunScan
thread.IsBackground = true;//该子线程为后台线程
thread.Start();//执行该后台子线程,去执行RunScan方法
然后,执行出队列这个后台子进程
public static bool IsRunning { get; set; }//是否继续线程
public void RunScan()
{
while (IsRunning)//一旦窗体关闭,IsRunning=false,该进程终止
{...
然后,一直执行这个子进程,直到窗体被关闭,这时设置IsRunning=false使还在执行的这个后台子进程Thread的RunScan()终止,同时还需终止后台Quartz.net进程,避免窗体关闭而进程还在
private void Form1_FormClosed(object sender, FormClosedEventArgs e)
{
NewsIndexer.IsRunning = false;//终止后台子进程RunScan方法
SendNewRegisterUM.schedWNI.Shutdown();//还需要终止后台Quartz.net进程,避免窗体已关闭,但是进程依然在
}

    /// <summary>
    /// 新闻索引（出队列，把每一条新闻信息 写入新闻索引）
    /// </summary>
    public class NewsIndex:IJob
    {
        /// <summary>
        /// 是否开始后台子线程
        /// </summary>
        public bool IsBegining { get; set; }

        //把耗时操作委托给后台子线程，是为了避免页面卡死。且主线程关闭，子线程会继续。当然这里由关闭时的 IsBegining 控制子线程是否继续
        public void Execute(JobExecutionContext context)
        //public void Start()
        {
            Thread thread = new Thread(DequeueForNewIndex); //把耗时操作（出队列）委托给子线程thread 
            thread.IsBackground = true; //把这个子线程设置为后台子线程（从而主线程结束，后台子线程依然继续）
            this.IsBegining = true; //后台子线程中的耗时操作 初始化为true
            thread.Start(); //开始子线程
        }

        //耗时操作所在的子线程 
        public void DequeueForNewIndex()
        {
            while(this.IsBegining)
            {
                using(IRedisClient client=RedisManager.ClientManager.GetClient())
                {
                    string json = client.DequeueItemFromList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX);
                    if (json == null)
                    {
                        //Thread.Sleep(100);
                        return; //定时任务时，在此结束循环 去执行下一次任务 
                    }
                    else
                    {
                        //获得新闻信息
                        Dictionary<string, object> dict = (Dictionary<string, object>)CommonHelper.DeSerializer( json);
                        TD_NEWS news = new TD_NEWS();
                        news.ID = Convert.ToInt64(dict["ID"]);
                        news.CATEGORYID = Convert.ToInt64(dict["CATEGORYID"]);
                        news.TITLE = dict["TITLE"].ToString();
                        news.CONTENT = dict["CONTENT"].ToString();
                        //一条一条写入索引
                        WriteToNewsIndex(news.ID, news.CATEGORYID, news.TITLE, news.CONTENT);
                    }
                }
            }
        }

        /// <summary>
        /// //一条一条写入索引
        /// </summary>
        /// <param name="id"></param>
        /// <param name="categoryid"></param>
        /// <param name="title"></param>
        /// <param name="content"></param>
        private void WriteToNewsIndex(long id, long categoryid, string title, string content)
        {
            FSDirectory directory = null;
            IndexWriter writer = null;
            try
            {
                string indexPath =@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsIndex"; //目录
                directory = FSDirectory.Open(new DirectoryInfo(indexPath), new NativeFSLockFactory()); //获得新的索引目录：打开索引的目录并加锁，防止并发写入
                bool exist = IndexReader.IndexExists(directory);
                if (exist) //如果读取时，目录中有索引
                {
                    if(IndexWriter.IsLocked(directory)) //且写入时，目录原先是锁定的，则需要手动强制解锁（说明原先是异常退出，没有解锁）
                    {
                        IndexWriter.Unlock(directory);
                    }
                }
                //向目录中一条一条的写入索引
                //初始化 "写入索引"（目录，分词算法，是否创建，最大字段长度）
                writer = new IndexWriter(directory, new PanGuAnalyzer(), !exist, IndexWriter.MaxFieldLength.UNLIMITED);
                //初始化一个文档，向文档添加字段，把文档写入索引
                Document doc = new Document();
                doc.Add(new Field("id", id.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
                doc.Add(new Field("categoryid", categoryid.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
                doc.Add(new Field("title", title, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
                doc.Add(new Field("content", content, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
                writer.AddDocument(doc);
            }
            finally
            {
                if(writer!=null)
                {
                    writer.Close(); //释放 写入索引资源
                }
                if(directory!=null)
                {
                    directory.Close(); //释放 打开目录资源
                }
            }
        }
    }

Timer.NewsIndex.cs

        //窗口关闭，同时关闭后台子线程 和定时任务 
        private void FormMain_FormClosed(object sender, FormClosedEventArgs e)
        {
            new NewsIndex().IsBegining = false; //结束后台子线程 
            //TimeSchedule.sched.Shutdown(); //关闭定时计划 --出错
        }

TimerForm.FormMain.cs

获取html的InnerText

搜索出来的不仅只是Title,还需要预览一部分内容body
用Lucene.net放入索引的时候需要过滤html标签
解决索引中body中全是html标签的问题,不利于搜索,很多垃圾信息,显示不方便。
使用HtmlAgilityPack进行innerText处理.
考虑文章编辑\重新索引等问题,需要先把旧的文档删除,再增加新的(等价于update)HTML解析器:输入一个html文档,提供对html文档操作的接口
开发包HtmlAgilityPack.1.4.0.zip,用于把html标签进行innerText后再放入索引库

引用 HtmlAgilityPack.dll

示例：

    HtmlDocument htmlDoc = new HtmlDocument();
    htmlDoc.Load(@"D:\temp\htmlAgilityPack.txt");
    //HtmlNode node = htmlDoc.GetElementbyId("p11");//获得hmtl文档中id为p11的标签节点
    //Console.WriteLine(node.InnerText);
    Console.WriteLine(htmlDoc.DocumentNode.InnerText);//获得html文档中的文档节点的innerText显示
    //htmlDoc.DocumentNode.DescendantNodes()
    Console.ReadKey();




HtmlAgilityPack.dll提供操作Html文档的标签方法
获得网页title:doc.DocumentNode.SelectSingleNode("//title").InnerText;//XPath中"//title"表示所有title节点;SelectSingleNode用于获取满足条件的唯一节点
获得所有超链接:doc.DocumentNode.Descendants("a");
获得name为kw的input,相当于getElementByName();
var kwBox=doc.DocumentNode.SelectSingleNode("//input[@name='kw']");//"//input[@name='kw']"也是XPath语法,表示name=kw的input标签

示例

实例：

        /// <summary>
        /// 入队列（用于新闻索引的队列集合）
        /// </summary>
        /// <param name="news"></param>
        public void EnqueueForNewsSearch(TD_NEWS news)
        {
            //获得新闻信息
            Dictionary<string, object> dict = new Dictionary<string, object>();
            dict["ID"] = news.ID;
            dict["CATEGORYID"] = news.CATEGORYID;
            dict["TITLE"] = news.TITLE;
            //需要把CONTENT中的html都innerText才加入索引
            HtmlDocument htmlDoc = new HtmlDocument();
            htmlDoc.LoadHtml(news.CONTENT);
            dict["CONTENT"] = htmlDoc.DocumentNode.InnerText;
            string json = CommonHelper.Serializer(dict);
            //入队列
            using (IRedisClient client=RedisManager.ClientManager.GetClient())
            {
                client.EnqueueItemOnList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX, json);
            }
        }

实例

一键建立新闻索引：

入队列：

如果新闻太多，应该分批次进行入队列建立索引

        [PermissionAction("所有新闻一键重建全文索引")]
        public void allNewsIndex(HttpContext context)
        {
            #region 所有新闻 一键重建全文索引
            #region 逻辑
            //1    判断是否有权限 
            //1   获得categoryid，用于重定向到当前新闻列表
            //2    如果新闻太多，应该分批次进入队列建立索引 
            //3    按100行查取新闻，相当于pagesize=100
            //4    获得总条数totalsize，获得totalsize/pagesize的水仙花数，即总页数totalpage 
            //5    遍历每一页【
            //6    获得该页的新闻集合
            //7    对于每一个新闻进行新闻入队列】
            //8    记录操作日志  
            #endregion
            string categoryidStr = context.Request["categoryid"];
            int categoryid = VolidHelper.CheckStrToInt(categoryidStr);
            long pagesize = 100; //每页100条，相当于每次查询100条 
            long totalsize = myORM_BLL.SelectCountByField(typeof(TD_NEWS), 1); //新闻总数
            long totalpage = (long)Math.Ceiling(totalsize * 1.0 / pagesize); //水仙花数，即总页数
            for (long i = 1; i <= totalpage; i++)
            {
                //获得该页的新闻集合
                List<object> list = myORM_BLL.SelectModelsByRownum(typeof(TD_NEWS), "NO", 1, (i - 1) * pagesize + 1, i * pagesize);
                //对于每一个新闻进行新闻入队列
                using (IRedisClient client = RedisManager.ClientManager.GetClient())
                {
                    foreach (object obj in list)
                    {
                        TD_NEWS news = obj as TD_NEWS;
                        new NewsBLL().EnqueueForNewsSearch(news, client);
                    }
                }
            }
            AdminHelper.RecordOperateLog(context, "新闻一键重建全文索引");
            context.Response.Redirect("/News/NewsController.ashx?action=list&categoryid="+categoryid); 
            #endregion
        }

NewsController.ashx

        /// <summary>
        /// 入队列 带外连接（用于新闻索引的队列集合）
        /// </summary>
        /// <param name="news"></param>
        public void EnqueueForNewsSearch(TD_NEWS news, IRedisClient client)
        {
            //获得新闻信息
            Dictionary<string, object> dict = new Dictionary<string, object>();
            dict["ID"] = news.ID;
            dict["CATEGORYID"] = news.CATEGORYID;
            dict["TITLE"] = news.TITLE;
            //需要把CONTENT中的html都innerText才加入索引
            HtmlDocument htmlDoc = new HtmlDocument();
            htmlDoc.LoadHtml(news.CONTENT);
            string content = htmlDoc.DocumentNode.InnerText;
            dict["CONTENT"] = content;
            string json = CommonHelper.Serializer(dict);
            //入队列
            client.EnqueueItemOnList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX, json);
        }

NewsBLL.cs

出队列：

每次出队列都进行一次索引路径的打开读取和关闭,效率低

全部出队列之前先打开索引目录,之后才关闭索引目录,最后才等待下一次client的队列中新数据

每次出队列加入检索索引之前,都需要删除文档索引中的相同id的文档索引,因为"编辑新闻"和"一键重建全文索引"都会再次加入同id的索引

    /// <summary>
    /// 新闻索引（出队列，把每一条新闻信息 写入新闻索引）
    /// </summary>
    public class NewsIndex:IJob
    {
        /// <summary>
        /// 是否开始后台子线程
        /// </summary>
        public bool IsBegining { get; set; }

        //把耗时操作委托给后台子线程，是为了避免页面卡死。且主线程关闭，子线程会继续。当然这里由关闭时的 IsBegining 控制子线程是否继续
        public void Execute(JobExecutionContext context)
        //public void Start()
        {
            Thread thread = new Thread(DequeueForNewIndex); //把耗时操作（出队列）委托给子线程thread 
            thread.IsBackground = true; //把这个子线程设置为后台子线程（从而主线程结束，后台子线程依然继续）
            this.IsBegining = true; //后台子线程中的耗时操作 初始化为true
            thread.Start(); //开始子线程
        }

        //耗时操作所在的子线程 
        public void DequeueForNewIndex()
        {
            while(this.IsBegining)
            {
                using(IRedisClient client=RedisManager.ClientManager.GetClient())
                {
                    ProcessDenqueue(client);
                    
                }
            }
        }

        //进行出队列操作 
        private void ProcessDenqueue(IRedisClient client)
        {
            //打开目录获得写入类
            FSDirectory directory = null;
            IndexWriter writer = null;
            try
            {
                string indexPath =@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsIndex"; //目录
                directory = FSDirectory.Open(new DirectoryInfo(indexPath), new NativeFSLockFactory()); //获得新的索引目录：打开索引的目录并加锁，防止并发写入
                bool exist = IndexReader.IndexExists(directory);
                if (exist) //如果读取时，目录中有索引
                {
                    if(IndexWriter.IsLocked(directory)) //且写入时，目录原先是锁定的，则需要手动强制解锁（说明原先是异常退出，没有解锁）
                    {
                        IndexWriter.Unlock(directory);
                    }
                }
                //向目录中一条一条的写入索引
                //初始化 "写入索引"（目录，分词算法，是否创建，最大字段长度）
                writer = new IndexWriter(directory, new PanGuAnalyzer(), !exist, IndexWriter.MaxFieldLength.UNLIMITED);

                //一直进行出队列，并写入索引 
                while(true)
                {
                    string json = client.DequeueItemFromList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX);
                    if (json == null)
                    {
                        //Thread.Sleep(100);
                        return; //在此结束当前连接的出队列，跳到子线程中的下一次client出队列 
                    }
                    else
                    {
                        //获得新闻信息
                        Dictionary<string, object> dict = (Dictionary<string, object>)CommonHelper.DeSerializer(json);
                        TD_NEWS news = new TD_NEWS();
                        news.ID = Convert.ToInt64(dict["ID"]);
                        news.CATEGORYID = Convert.ToInt64(dict["CATEGORYID"]);
                        news.TITLE = dict["TITLE"].ToString();
                        news.CONTENT = dict["CONTENT"].ToString();
                        //一条一条写入索引
                        WriteToNewsIndex( writer,news.ID, news.CATEGORYID, news.TITLE, news.CONTENT);
                    }
                }

                //回收资源 
            }
            finally
            {
                if (writer != null)
                {
                    writer.Close(); //释放 写入索引资源
                }
                if (directory != null)
                {
                    directory.Close(); //释放 打开目录资源
                }
            }
            
        }

        /// <summary>
        /// //一条一条写入索引 （写入之前先删除相同文档id的文档）
        /// </summary>
        /// <param name="writer">索引写入类</param>
        /// <param name="id"></param>
        /// <param name="categoryid"></param>
        /// <param name="title"></param>
        /// <param name="content"></param>
        private void WriteToNewsIndex(IndexWriter writer, long id, long categoryid, string title, string content)
        {
            //写入之前先删除相同文档id的文档
            writer.DeleteDocuments(new Term("id", id.ToString()));
            //初始化一个文档，向文档添加字段，把文档写入索引
            Document doc = new Document();
            doc.Add(new Field("id", id.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
            doc.Add(new Field("categoryid", categoryid.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
            doc.Add(new Field("title", title, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
            doc.Add(new Field("content", content, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
            writer.AddDocument(doc);
        }
    }

Timer.NewsIndex.cs

六搜索优化：

搜索结果高亮显示：

搜索结果中获取最匹配的摘要段，关键词需要高亮显示

引用 PanGu.HighLight.dll

        /// <summary>
        /// 搜索结果 （关键词高亮，并获取最匹配摘要）
        /// </summary>
        /// <param name="keywords">关键词</param>
        /// <param name="content">内容</param>
        /// <returns>搜索结果的内容摘要</returns>
        public static string HighLight(string keywords,string content)
        {
            #region 逻辑
            //1    引用HighLight.dll
            //2    设置关键词高亮的样式
            //3    用关键词样式HtmlFormatter和盘古分词对象Segment 初始化Highlighter
            //4    设置每个摘要字符数 
            //5    获得最匹配的摘要段  
            #endregion
            //设置关键词高亮的样式
            PanGu.HighLight.SimpleHTMLFormatter simpleHTMLFormatter = new PanGu.HighLight.SimpleHTMLFormatter("<span class='keywordHL'>", "</span>");
            //初始化高亮类Highlighter（用关键词样式HtmlFormatter和盘古分词对象Segment）
            PanGu.HighLight.Highlighter highlighter = new PanGu.HighLight.Highlighter(simpleHTMLFormatter, new PanGu.Segment());
            //设置每个摘要字符数 
            highlighter.FragmentSize = 100;
            //获得最匹配的摘要段 
            return highlighter.GetBestFragment(keywords, content);
        }

Front.FrontHelper.cs

#region 新闻搜索
                #region 逻辑
                //1    获得所有关键词 //获得当前页 pagenum 
                //2    遍历关键词 //用盘古分词的Segment进行切词 
                //3    添加按关键词查询 
                //4    设置关键词间距离 

                //5    打开目录并不加锁 获得目录 
                //6    打开目录 进行索引读取 
                //7    从索引读取中初始化搜索 
                //8    获得查询结果的100条结果
                //9    在这个结果中，按照query这个条件进行搜索 
                //10 获得搜索结果的第m-n条结果 （//获得总条数 totalszie //设置每页多少条 pagesize //获得搜索结果的 (pagenum-1)*PageSize,pagesize 的搜索结果 ）
                //11    遍历结果【
                //12    获得每一条结果的Lucene所分配的文档id 
                //13    根据文档id搜索到文档 
                //14    获得该文档的某个字段的值 
                //15    拼接url和title，添加到结果集合 】
                //16    把这个结果集合解析到某个cshtml  
                #endregion
                #region 获得请求
                string keywords = context.Request["keywords"].Trim();
                string pagenumStr = context.Request["pagenum"];
                //验证 非空
                if (string.IsNullOrWhiteSpace(keywords))
                {
                    return;
                }
                //获得当前页
                int pagenum = 1;
                if (!string.IsNullOrWhiteSpace(pagenumStr) && VolidHelper.CheckStringIsInt(pagenumStr))
                {
                    pagenum = Convert.ToInt32(pagenumStr);
                } 
                #endregion
                #region 查询条件
                //用盘古分词的Segment进行切词 
                PanGu.Segment segment = new PanGu.Segment();
                var wordInfos = segment.DoSegment(keywords); //获得切词集合
                //查询方式
                PhraseQuery query = new PhraseQuery(); //适用多个关键词的查询
                foreach (var wordInfo in wordInfos)
                {
                    query.Add(new Term("content", wordInfo.Word)); //添加查询条件
                }
                query.SetSlop(1000); //设置关键词间距离  
                #endregion
                //获得查询的结果集合
                List<TD_NewsSearchResult> results = new List<TD_NewsSearchResult>();
                FSDirectory directory = FSDirectory.Open(new DirectoryInfo(@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsIndex"), new NoLockFactory()); //打开目录不加锁，并获得目录
                IndexReader reader = IndexReader.Open(directory, true); //打开目录，并获得索引读取类IndexReader
                IndexSearcher searcher = new IndexSearcher(reader); //通过索引读取类 初始化索引搜索类IndexSearcher 
                TopScoreDocCollector collector = TopScoreDocCollector.create(1000, true); //通过TopScoreDocCollector获得最多1000条的查询结果
                searcher.Search(query, null, collector); //按query条件 从查询结果collector 进行搜索
                int totalsize = collector.GetTotalHits(); //搜索结果的总条数 
                int pagesize = 10; //每页多少条  (pagenum-1)*pagesize,pagesize （从0开始取）
                ScoreDoc[] docs = collector.TopDocs((pagenum - 1) * pagesize, pagesize).scoreDocs; //获得搜索结果collector的第m-n条的文档结果ScoreDoc 
                foreach (ScoreDoc scoredoc in docs) //遍历文档结果集
                {
                    int docId = scoredoc.doc; //获得文档结果Lucene所分配的文档id 
                    Document doc = searcher.Doc(docId); //根据文档id搜索到文档
                    long id = Convert.ToInt64(doc.Get("id")); //获得该文档的 字段id的值
                    long categoryid = Convert.ToInt64(doc.Get("categoryid")); //获得该文档的 字段id的值
                    string title = doc.Get("title");
                    string content = doc.Get("content");
                    TD_NewsSearchResult nsr = new TD_NewsSearchResult();
                    nsr.URL = "/News/" + categoryid + "/" + id + ".shtml";
                    nsr.TITLE = title;
                    nsr.CONTENT = FrontHelper.HighLight(keywords,content);
                    results.Add(nsr);
                }
                RazorHelper.RazorParse(context, "~/News/NewsSearch.cshtml", new { results = results, keywords = keywords,
                                totalsize=totalsize, pagesize=pagesize,currpage=pagenum }); 
                #endregion

Front.News.NewsController.ashx

七扩展任务：

项目任务:完成新闻搜索、视频笔记搜索功能,而且是综合搜索
逻辑思路：//搜索(分页\高亮显示)-->建立索引-->出队列-->入队列T_Segment(Id,Name,note,ChapterId)\T_News(Id,Title,NewsContent,CategoryId)

综合搜索：

入队列：
1    把所有的新闻入队列（已做 ）
2    把所有的课程笔记入队列（未做）    {
3    判断是否有权限 
4    获得课程类别的父级pid=0 
5    获得段落总数totalsize 
6    设置每次获得多少条段落pagesize 
7    获得总次数（总页数，天花板数totalpage）
8    遍历页数    【
9    获得当前页的段落集合 
10    入队列：[
11    对于每一个段落的TD_SEGEMENT(ID CHAPTERID NAME NOTE)
12    对NOTE进行innerText
13    拼接Dict进行json化
14    进行入队列]    】    }
15    记录操作日志 
16    跳转课程类别列表

入队列：

#region 一键重建段落索引
                #region 逻辑
                //入队列：
                //1    把所有的新闻入队列（已做 ）
                //2    把所有的课程笔记入队列（未做）    {
                //3    判断是否有权限 
                //4    获得课程类别的父级pid=0 
                //5    获得段落总数totalsize 
                //6    设置每次获得多少条段落pagesize 
                //7    获得总次数（总页数，天花板数totalpage）
                //8    遍历页数    【
                //9    获得当前页的段落集合 
                //10    入队列：[
                //11    对于每一个段落的TD_SEGEMENT(ID CHAPTERID NAME NOTE)
                //12    对NOTE进行innerText
                //13    拼接Dict进行json化
                //14    进行入队列]    】    }
                //15    记录操作日志 
                //16    跳转课程类别列表 
                #endregion
                //获得课程类别的父级pid
                string pidStr = context.Request["pid"];
                int pid = VolidHelper.CheckStrToInt(pidStr);
                //获得段落总数totalsize 
                long totalsize = myORM_BLL.SelectCountByField(typeof(TD_SEGEMENT), 1);
                long pagesize = 100; //设置每次获得多少条段落pagesize 
                long totalpage = (long)Math.Ceiling(totalsize * 1.0 / pagesize); //获得总次数（总页数，天花板数totalpage）
                //遍历页数    【
                for (long i = 1; i <= totalpage; i++)
                {
                    //获得当前页的段落集合 
                    List<object> list = myORM_BLL.SelectModelsByRownum(typeof(TD_SEGEMENT), "NO", 1, (i - 1) * pagesize + 1, i * pagesize);
                    //入队列：[
                    using (IRedisClient client = RedisManager.ClientManager.GetClient())
                    {
                        foreach (object obj in list)
                        {
                            TD_SEGEMENT sge = obj as TD_SEGEMENT;
                            new CourseBLL().EnqueueForSegementSearch(sge, client);
                        }
                    }
                }
                //记录操作日志 
                AdminHelper.RecordOperateLog(context, "一键重建段落索引");
                context.Response.Redirect("/Course/CategoryController.ashx?action=list&pid=" + pid); 
                #endregion

Admin/Course/CateogoryController.ashx?action=allSegmentIndex

        /// <summary>
        /// 入队列：（用于段落索引）
        /// </summary>
        /// <param name="sge">段落实例</param>
        /// <param name="client"></param>
        public void EnqueueForSegementSearch(TD_SEGEMENT sge, IRedisClient client)
        {
            Dictionary<string, object> dict = new Dictionary<string, object>();
            dict["ID"] = sge.ID;
            dict["CHAPTERID"] = sge.CHAPTERID;
            dict["NAME"] = sge.NAME;
            HtmlDocument htmlDoc = new HtmlDocument();
            string note = sge.NOTE == null ? string.Empty : sge.NOTE;
            htmlDoc.LoadHtml(note);
            dict["NOTE"] = htmlDoc.DocumentNode.InnerText;
            string json = CommonHelper.Serializer(dict);
            client.EnqueueItemOnList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_SEGEMENTINDEX, json);
        }

BLL/CourseBLL.cs

出队列并写入索引 ：
1    窗口启动，执行定时任务 
2    定时任务中 把出队列委托给后台子线程，并用IsBegining控制子线程的运行
3    执行后台子线程（由IsBegining控制）
4    打开目录，获得IndexWriter类，如果IndexReader时存在原索引，并且原索引加锁，则强制解锁
5    初始化写入索引IndexWriter类 （由盘古分词算法）

6    循环出队列    {
7    把队列中每一个json解析为Dict
8    获得段落信息 
9    把段落信息写入索引【
10    先删除相同文档id的索引文档
11    初始化文档 
12    向文档中添加字段 
13    把文档添加到索引】    }
14    再对段落循环出队列     {
15    （其中id="sgement"+id，保证写入索引时id不与新闻中id重复）}
16    回收目录资源
17    回收索引资源

出队列并写入索引：

    /// <summary>
    /// 新闻索引（出队列，把每一条新闻信息 写入新闻索引）
    /// </summary>
    public class NewsAndSegmentIndex:IJob
    {
        /// <summary>
        /// 是否开始后台子线程
        /// </summary>
        public bool IsBegining { get; set; }

        //把耗时操作委托给后台子线程，是为了避免页面卡死。且主线程关闭，子线程会继续。当然这里由关闭时的 IsBegining 控制子线程是否继续
        public void Execute(JobExecutionContext context)
        //public void Start()
        {
            Thread thread = new Thread(DequeueForNewIndex); //把耗时操作（出队列）委托给子线程thread 
            thread.IsBackground = true; //把这个子线程设置为后台子线程（从而主线程结束，后台子线程依然继续）
            this.IsBegining = true; //后台子线程中的耗时操作 初始化为true
            thread.Start(); //开始子线程
        }

        //耗时操作所在的子线程 
        public void DequeueForNewIndex()
        {
            while(this.IsBegining)
            {
                using(IRedisClient client=RedisManager.ClientManager.GetClient())
                {
                    ProcessDenqueue(client);
                }
            }
        }

        //进行出队列操作 （新闻和段落 都要出队列）
        private void ProcessDenqueue(IRedisClient client)
        {
            //打开目录获得写入类
            FSDirectory directory = null;
            IndexWriter writer = null;
            try
            {
                string indexPath =@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsAndSegmentIndex"; //目录
                directory = FSDirectory.Open(new DirectoryInfo(indexPath), new NativeFSLockFactory()); //获得新的索引目录：打开索引的目录并加锁，防止并发写入
                bool exist = IndexReader.IndexExists(directory);
                if (exist) //如果读取时，目录中有索引
                {
                    if(IndexWriter.IsLocked(directory)) //且写入时，目录原先是锁定的，则需要手动强制解锁（说明原先是异常退出，没有解锁）
                    {
                        IndexWriter.Unlock(directory);
                    }
                }
                //向目录中一条一条的写入索引
                //初始化 "写入索引"（目录，分词算法，是否创建，最大字段长度）
                writer = new IndexWriter(directory, new PanGuAnalyzer(), !exist, IndexWriter.MaxFieldLength.UNLIMITED);

                //一直进行出队列，并写入索引 
                while(true)
                {
                    string json = client.DequeueItemFromList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_NEWSINDEX);
                    if (json == null)
                    {
                        //return; //在此结束当前连接的出队列，跳到子线程中的下一次client出队列 
                        #region 段落出队列
                        while(true)
                        {
                            //如果新闻的队列集合全部出队了 就继续把段落的队列集合出队列
                            string segJson = client.DequeueItemFromList(ConstStringHelper.REDIS_ADMIN_QUEUELIST_SEGEMENTINDEX);
                            if (segJson == null)
                            {
                                return;
                            }
                            else
                            {
                                //获得段落信息
                                Dictionary<string, object> dict = (Dictionary<string, object>)CommonHelper.DeSerializer(segJson);
                                TD_SEGEMENT news = new TD_SEGEMENT();
                                long idOld = Convert.ToInt64(dict["ID"]);
                                //其中id="news_"+id，保证写入相同索引目录时 id不与段落中id重复
                                string id = "segement_" + idOld;
                                long categoryid = Convert.ToInt64(dict["CHAPTERID"]);
                                string title = dict["NAME"].ToString();
                                string content = dict["NOTE"].ToString();
                                //一条一条写入索引
                                WriteToNewsIndex(writer, id, categoryid, title, content);
                            } 
                        }
                        #endregion
                    }
                    else
                    {
                        //获得新闻信息
                        Dictionary<string, object> dict = (Dictionary<string, object>)CommonHelper.DeSerializer(json);
                        TD_NEWS news = new TD_NEWS();
                        long idOld = Convert.ToInt64(dict["ID"]);
                        //其中id="news_"+id，保证写入相同索引目录时 id不与段落中id重复
                        string id = "news_" + idOld;
                        long categoryid = Convert.ToInt64(dict["CATEGORYID"]);
                        string title = dict["TITLE"].ToString();
                        string content = dict["CONTENT"].ToString();
                        //一条一条写入索引
                        WriteToNewsIndex(writer, id, categoryid, title, content);
                    }
                }

                //回收资源 
            }
            finally
            {
                if (writer != null)
                {
                    writer.Close(); //释放 写入索引资源
                }
                if (directory != null)
                {
                    directory.Close(); //释放 打开目录资源
                }
            }
            
        }

        /// <summary>
        /// //一条一条写入索引 （写入之前先删除相同文档id的文档）
        /// </summary>
        /// <param name="writer">索引写入类</param>
        /// <param name="id"></param>
        /// <param name="categoryid"></param>
        /// <param name="title"></param>
        /// <param name="content"></param>
        private void WriteToNewsIndex(IndexWriter writer, string id, long categoryid, string title, string content)
        {
            //写入之前先删除相同文档id的文档
            writer.DeleteDocuments(new Term("id", id));
            //初始化一个文档，向文档添加字段，把文档写入索引
            Document doc = new Document();
            doc.Add(new Field("id", id, Field.Store.YES, Field.Index.NOT_ANALYZED));
            doc.Add(new Field("categoryid", categoryid.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));
            doc.Add(new Field("title", title, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
            doc.Add(new Field("content", content, Field.Store.YES, Field.Index.ANALYZED,Field.TermVector.WITH_OFFSETS));
            writer.AddDocument(doc);
        }
    }

Timer/NewsAndSegmentIndex.cs

综合搜索：
1    获得关键字、当前页
2    验证非空 格式 
3    查询条件【
4    使用盘古分词算法分词，初始化Segment类，使用这个类切词
5    遍历每一个词，添加查询条件
6    设置查询的关键字间距】

7    打开目录
8    获得索引读取类IndexReader
9    初始化索引搜索类IndexSearcher
10    获得共多少条结果
11    在这些结果中进行搜索
12    获得搜索的总条数totalsize
13    设置每页的条数pagesize
14    获得搜索结果中的第m-n条搜索结果集合
15    遍历搜索结果集合【
16    获得搜索结果的文档id
17    根据文档id搜索到该文档
18    获得文档对应字段的信息
19    用这些信息实例化TD_RESULT [
20    如果id中含有"news"则url是新闻的Url/如果含有"segment"则是段落的url ]
21    把这些记过加入到最后结果集合
22    把结果集合解析到cshtml

综合搜索：

#region 综合搜索
                #region 逻辑
                //1    获得所有关键词 //获得当前页 pagenum 
                //2    遍历关键词 //用盘古分词的Segment进行切词 
                //3    添加按关键词查询 
                //4    设置关键词间距离 

                //5    打开目录并不加锁 获得目录 
                //6    打开目录 进行索引读取 
                //7    从索引读取中初始化搜索 
                //8    获得查询结果的100条结果
                //9    在这个结果中，按照query这个条件进行搜索 
                //10 获得搜索结果的第m-n条结果 （//获得总条数 totalszie //设置每页多少条 pagesize //获得搜索结果的 (pagenum-1)*PageSize,pagesize 的搜索结果 ）
                //11    遍历结果【
                //12    获得每一条结果的Lucene所分配的文档id 
                //13    根据文档id搜索到文档 
                //14    获得该文档的某个字段的值 
                //15    拼接url和title，添加到结果集合 （如果id中含有"news"则url是新闻的Url/如果含有"segment"则是段落的url ）】
                //16    把这个结果集合解析到某个cshtml  
                #endregion
                #region 获得请求
                string keywords = context.Request["keywords"].Trim();
                string pagenumStr = context.Request["pagenum"];
                //验证 非空
                if (string.IsNullOrWhiteSpace(keywords))
                {
                    return;
                }
                //获得当前页
                int pagenum = 1;
                if (!string.IsNullOrWhiteSpace(pagenumStr) && VolidHelper.CheckStringIsInt(pagenumStr))
                {
                    pagenum = Convert.ToInt32(pagenumStr);
                } 
                #endregion
                #region 查询条件
                //用盘古分词的Segment进行切词 
                PanGu.Segment segment = new PanGu.Segment();
                var wordInfos = segment.DoSegment(keywords); //获得切词集合
                //查询方式
                PhraseQuery query = new PhraseQuery(); //适用多个关键词的查询
                foreach (var wordInfo in wordInfos)
                {
                    query.Add(new Term("content", wordInfo.Word)); //添加查询条件
                }
                query.SetSlop(1000); //设置关键词间距离  
                #endregion
                //获得查询的结果集合
                List<TD_NewsSearchResult> results = new List<TD_NewsSearchResult>();
                FSDirectory directory = FSDirectory.Open(new DirectoryInfo(@"E:\RuPeng_Project\DiDao\DIDAO.Timer\NewsAndSegmentIndex"), new NoLockFactory()); //打开目录不加锁，并获得目录
                IndexReader reader = IndexReader.Open(directory, true); //打开目录，并获得索引读取类IndexReader
                IndexSearcher searcher = new IndexSearcher(reader); //通过索引读取类 初始化索引搜索类IndexSearcher 
                TopScoreDocCollector collector = TopScoreDocCollector.create(1000, true); //通过TopScoreDocCollector获得最多1000条的查询结果
                searcher.Search(query, null, collector); //按query条件 从查询结果collector 进行搜索
                int totalsize = collector.GetTotalHits(); //搜索结果的总条数 
                int pagesize = 10; //每页多少条  (pagenum-1)*pagesize,pagesize （从0开始取）
                ScoreDoc[] docs = collector.TopDocs((pagenum - 1) * pagesize, pagesize).scoreDocs; //获得搜索结果collector的第m-n条的文档结果ScoreDoc 
                foreach (ScoreDoc scoredoc in docs) //遍历文档结果集
                {
                    int docId = scoredoc.doc; //获得文档结果Lucene所分配的文档id 
                    Document doc = searcher.Doc(docId); //根据文档id搜索到文档
                    //long id = Convert.ToInt64(doc.Get("id")); //获得该文档的 字段id的值
                    string id = doc.Get("id"); //获得该文档的 字段id的值 "news_1"或"segement_1"
                    long categoryid = Convert.ToInt64(doc.Get("categoryid")); //获得该文档的 字段id的值
                    string title = doc.Get("title");
                    string content = doc.Get("content");
                    TD_NewsSearchResult nsr = new TD_NewsSearchResult();
                    //如果id中含有"news"则url是新闻的Url/如果含有"segment"则是段落的url 
                    string[] idArry = id.Split('_');
                    if (idArry[0] == "news")
                    {
                        nsr.URL = "/News/" + categoryid + "/" + idArry[1] + ".shtml";
                        nsr.TITLE = "新闻："+ title;
                    }
                    else if (idArry[0] == "segement")
                    {
                        nsr.URL = "/Course/CourseController_segment" + idArry[1] + ".ashx";
                        nsr.TITLE = "课程：" + title;
                    }
                    else
                    {
                        RazorHelper.RazorParse(context, "~/error.cshtml", new { Msg = "综合搜索失败，综合索引中 未找到 id=" + id });
                        return;
                    }
                    nsr.CONTENT = FrontHelper.HighLight(keywords,content);
                    results.Add(nsr);
                }
                RazorHelper.RazorParse(context, "~/News/NewsSearch.cshtml", new { results = results, keywords = keywords,
                                totalsize=totalsize, pagesize=pagesize,currpage=pagenum }); 
                #endregion

Front/News/NewsController.ashx?action=search

你可能感兴趣的:(Lucene.Net 站内搜索)

基于Boost库实现的站内搜索引擎敲着代码想睡觉 C++c++搜索引擎后端学习 c语言 vscode
基于Boost库实现的搜索引擎项目实现相关背景搜索引擎相关宏观原理正排索引和倒排索引正排索引倒排索引模拟一次查找大概流程项目技术栈和开发环境配置项目所使用到的技术栈开发环境的配置VSCode和插件Remote-SSH的安装Boost库的安装Jsoncpp库的安装cpp-httplib库的下载cppjieba库的下载cppjieba库的补充cppjieba库的使用（使用软连接）项目实际开发编写日志模
搜索引擎的高级语法 _Poseidon 搜索引擎 baidu 信息收集
文章目录精确搜索：双引号站内搜索：site通配符搜索：*减号缩小范围：-文档搜索：filetypeURL搜索：inurl标题搜索：intitle正文搜索：intext参考链接精确搜索：双引号“”指令表示完全匹配搜索。搜索结果中需包含双引号内的所有词，且顺序也需一致。语法：“关键词”示例：“JavaScript教程”站内搜索：site这是一个比较常用的搜索方法，site搜索，就是在站内进行搜索.语法
从零开始搭建.NET Core版搜索引擎（六）--Lucene工作原理及流程 ludewig 数据处理 .NET 学习实践搜索引擎 luccene.net .net core
在前面几篇中对于关键词索引的创建和检索已经基本实现，但如果想要再继续深入就有必要理解Lucene.NET的工作原理和工作流程。1.工作原理当我们想从大量的信息查询某个特定的信息时，不仅需要知道这个特定信息是否存在，而且需要知道这个特定信息在什么位置。这种情况下遍历所有信息去查找这个特定的信息并不是一个明智选择，查找的成本会极其巨大。建立索引则是一种很好的解决思路，索引类似目录、标签。就好比字典、书
从零开始搭建.NET Core版搜索引擎（八）--查询结果高亮显示 ludewig 数据处理 .NET 学习实践搜索引擎 lucene.net .net core
很多搜索引擎的检索结果都会将匹配的关键词高亮显示出来，便于用户的快速识别，Lucene.NET当然也提供高亮功能。1.高亮功能实现1.1.安装Lucene.NET.HighLightLucene.NET的高亮功能由Lucene.NET.HighLight包实现，使用NuGet管理器安装，建议与Lucene.NET保持相同版本。1.2.修改查询方法高亮显示是一个锦上添花的功能，所以打算把是否高亮设置
从零开始学习 Lucene.Net：.NET Core 中的全文搜索与索引管理江沉晚呤时 Net core C#mybatis c#lucene .net 开发语言 .netcore
Lucene.Net是一个开源的全文搜索引擎库，它是ApacheLucene项目的.NET移植版本。Lucene.Net提供了强大的搜索功能，广泛应用于文档搜索、日志分析、数据检索等场景。随着大数据的爆发，开发者越来越依赖高效的搜索引擎来实现复杂的搜索需求，而Lucene.Net则是一个不错的选择。本文将从零开始讲解如何在.NETCore中使用Lucene.Net，涵盖从创建索引到查询数据的完整过
python 个人所得税计算器 weixin_38609297 python 开发语言
个人所得税计算器很奇怪，为啥网上搜的各种个人所得税计算器那么难用，还不能精确的算出来，这不就是一个公式吗下面这个是北京为例的，2024年的个人所得税计算刚在站内搜索了下，几乎没有几个能真实的计算个税，都没有考虑五险一金，还有专项抵扣等下面这个代码是参考了社保的上下限，还有五险一金、专项抵扣等，代码中的缴纳比例填的都是默认值，默认最大的比例。可以精确的计算出员工的个人所得税信息#-*-coding:
Lucene.Net 分词器选择指南：盘古分词 vs 结巴分词的深度对比与未来趋势大富大贵7 mybatis
引言在大数据与自然语言处理的浪潮中，分词技术作为信息检索、文本分析、搜索引擎优化等领域的核心技术，扮演着至关重要的角色。Lucene.Net作为开源的全文检索库，其强大的文本处理能力，使得选择一个合适的分词器成为开发者和企业实现高效检索的关键。而在中文分词的实现中，盘古分词和结巴分词是目前最受关注的两种技术方案。本文将对比这两者的性能、功能和适用场景，探讨它们在Lucene.Net中的实现方式，并
Lucene.Net全文搜索引擎：架构解析与全流程实战指南 Microi风闲【全文检索】分词搜索引擎 lucene .net
文章目录引言：为什么选择Lucene.Net？一、Lucene.Net核心架构剖析1.1模块化设计二、Lucene.Net索引原理揭秘2.1倒排索引：搜索的基石2.2段（Segment）机制三、全流程实战：从0到1构建搜索引擎3.1环境准备3.2索引构建3.3搜索实现四、性能优化黄金法则4.1索引优化策略4.2搜索优化技巧五、常见问题与解决方案Q1：搜索结果评分不准？Q2：中文分词不准确？六、总结
ik分词和jieba分词哪个好_Lucene.net(4.8.0) 学习问题记录五: JIEba分词和Lucene的结合，以及对分词器的思考... weixin_39634997 ik分词和jieba分词哪个好
前言：目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作，不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NETCore2.0版本,而Lucene使用的版本是3.6.0，PanGu分词也是对应Lucene3.6.0版本的。不过好在Lucene.net已经有了Core2.0版本(4.8.0bate版)，而PanGu分词，目前有人正在做，貌似已经做完，只是还没有测试
Lucene.net(4.8.0) 学习问题记录五: JIEba分词和Lucene的结合，以及对分词器的思考 Dacc123 Lucene Lucene 分词
前言：目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作，不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NETCore2.0版本,而Lucene使用的版本是3.6.0，PanGu分词也是对应Lucene3.6.0版本的。不过好在Lucene.net已经有了Core2.0版本（4.8.0bate版），而PanGu分词，目前有人正在做，貌似已经做完，只是还没有测试
Lucene.Net 分词器选择指南：盘古分词 vs 结巴分词 Microi风闲【全文检索】分词 lucene .net mybatis
文章目录前言一、核心特性对比二、典型场景推荐1.选择盘古分词的场景2.选择结巴分词的场景三、关键指标实测对比1.分词质量测试（F1值）2.性能测试（单线程）四、如何选择？决策树五、进阶优化建议1.盘古分词优化方案2.结巴分词优化方案六、总结前言在构建基于Lucene.Net的中文搜索引擎时，分词器的选择直接影响搜索效果和性能。盘古分词（PanGu）和结巴分词（jieba）是两个主流选择，以下是它们
基于 .NET 8 + Lucene.Net + 结巴分词实现全文检索与匹配度打分实战指南 Microi风闲【全文检索】分词全文检索 .net lucene
文章目录前言一、技术选型与优势1.1技术栈介绍1.2方案优势二、环境搭建与配置2.1安装NuGet包2.2初始化核心组件三、索引创建与文档管理3.1构建索引3.2动态更新策略四、搜索与匹配度排序4.1执行搜索4.2自定义评分算法（扩展）五、高级优化技巧5.1近实时搜索（NRT）5.2批量处理优化5.3自定义停用词与词典六、常见问题与解决方案6.1分词不生效6.2索引更新延迟6.3版本兼容性错误七、
Lucene.net站内搜索—3、最简单搜索引擎代码邹琼俊搜索引擎 lucene .net 全文检索
目录Lucene.net站内搜索—1、SEO优化Lucene.net站内搜索—2、Lucene.Net简介和分词Lucene.net站内搜索—3、最简单搜索引擎代码Lucene.net站内搜索—4、搜索引擎第一版技术储备(简单介绍Log4Net、生产者消费者模式)Lucene.net站内搜索—5、搜索引擎第一版实现Lucene.net站内搜索—6、站内搜索第二版代码先看代码，后面再一一讲解引入命名
PHP实现站内搜索的开源利器——WindSearch rock365337 WindSearch php 开源搜索引擎
WindSearch是一个基于中文分词，由纯PHP开发全文检索引擎，可快速搭建PHP站点的站内搜索，他没有任何繁琐的安装配置、不需要维护调优、不占用服务器内存、可与PHP项目完美融合在一起。github地址：https://github.com/rock365/windsearch必须极速安装~使用composer安装：composerrequirerock365/windsearch或使用Git
PHP实现站内搜索的开源利器——WindSearch
WindSearch是一个基于中文分词，由纯PHP开发全文检索引擎，可快速搭建PHP站点的站内搜索，他没有任何繁琐的安装配置、不需要维护调优、不占用服务器内存、可与PHP项目完美融合在一起。github地址：https://github.com/rock365/windsearch必须极速安装~使用composer安装：composerrequirerock365/windsearch或使用Git
PHP搜索引擎WindSearch，新增Faker伪数据生成功能
WindSearch是一个基于中文分词，由纯PHP开发全文检索引擎，可快速搭建PHP站点的站内搜索，他没有任何繁琐的安装配置、不需要维护调优、不占用服务器内存、可与PHP项目完美融合在一起。Faker数据生成安装导入//将WindSearch代码下载到本地，再像下面这样引入require_once'yourdirname/windsearch/vendor/autoload.php';开始生成//
关于搜索需求，搜索架构的一切架构师之路_
前篇：《无限容量数据库架构设计》《MQ消息可达性+幂等性+延时性架构设计》《高可用+高并发+负载均衡架构设计》《关于数据库“扩展性”架构设计的一切》《关于互联网“一致性”架构设计的一切》本文再做总结，体系化介绍互联网搜索架构技术。一、搜索引擎的原理，架构与细节文章：《搜索引擎的原理，架构与细节》内容：全网搜索引擎的架构与流程站内搜索引起的架构与流程搜索引擎原理与核心数据结构：正排，倒排，分词，拉链
整合全文检索引擎 Lucene 添加站内搜索子模块七禾页话全文检索 lucene mybatis
整合全文检索引擎Lucene:添加站内搜索子模块1.什么是Lucene?有啥优势？Lucene是一个开源的全文检索引擎库，由Apache基金会维护，官网地址：https://lucene.apache.org/。它提供了丰富的文本处理和搜索功能，允许开发者在应用程序中集成强大的全文检索能力。以下是Lucene的一些主要特点和优势：全文检索：Lucene支持全文检索，可以在大量文本数据中快速而准确地
Elasticsearch 2301_78085386 elasticsearch 大数据搜索引擎
ElasticsearchES概述Elasticsearch，简称为ES，是一款非常强大的开源的高扩展的分布式全文检索引擎，可以帮助我们从海量数据中快速找到需要的内容,它可以近乎实时的存储、检索数据.还可以可以实现日志统计、分析、系统监控等功能.官网:https://www.elastic.co/cn例如京东,淘宝,头条等站内搜索功能mysql搜索匹配机制性能低,数量大的情况下影响性能采用正向索引
elasticsearch简单介绍甜美河边的钓鱼人 elasticsearch
1、elasticsearch简单介绍elasticsearch是基于操作文档的搜索引擎，里面使用了netty，luncen相关技术。它可以用作站内搜索，也可以结合Logstash，kibana等技术进行日志收集分析，使用聚合技术可以进行各种数据的聚合，并且和kibana一起展示条形图，饼图，map地理分布等功能。1.1、elasticsearch的安装因为是练习用的，所以我直接使用windows
ElasticSearch HW-- elasticsearch
一、适用场景全文搜索：1.电商搜索2.站内搜索3.文档管理系统4.论坛和社交媒体日志分析与监控：1.服务器日志2.应用日志3.运维监控数据分析：1.业务分析2.时序数据分析NoSQLJSON文档数据库：作为JSON文档数据库使用搜索推荐实现个性化搜索和推荐功能地理信息系统存储和查询带有地理信息的数据大规模监控系统二、为什么要安装分词器？IK分词器中针对中文分词提供了ik_smart和ik_max_
Elasticsearch的使用场景深入详解清水白石008 elasticsearch
Elasticsearch的使用场景深入详解Elasticsearch是一个开源的分散式搜索和分析引擎，以其强大的全文搜索、结构化搜索和分析能力而闻名。它可以广泛应用于各种领域，包括：1.全文搜索Elasticsearch最常用的场景是全文搜索，它可以快速、准确地从海量数据中检索出相关信息。例如：电商网站的商品搜索网站或应用程序的站内搜索文档管理系统的文档检索法律文件的检索2.日志分析Elasti
数值计算实验9 数值积分实验 :-D:） #数值计算实验报告数值计算 matlab
文章目录实验目的：实验内容：需要word文件请访问http://daxs.top站内搜索实验名称或者实验内容访问文章并且下载附件即可。实验目的：进一步熟练掌握变步长数值积分算法，提高编程能力和解决定积分问题的实践技能。实验内容：用龙贝格积分算法计算需要word文件请访问http://daxs.top站内搜索实验名称或者实验内容访问文章并且下载附件即可。
数值计算实验1 Matlab基础实验 :-D:） #数值计算实验报告数值计算 matlab
文章目录实验目的：实验内容：需要word文件请访问http://daxs.top站内搜索实验名称或者实验内容访问文章并且下载附件即可。实验目的：熟悉MATLAB系统的启动、退出、演示系统、帮助系统、MATLAB的运行环境，掌握Matlab矩阵、算符、表达式、数据结构、数据类型、函数与程序设计及其运行、画图等的基础知识。实验内容：MATLAB系统的启动、退出、演示系统、帮助系统，Matlab中Not
CPP项目：Boost搜索引擎函数指针搜索引擎
1.项目背景对于Boost库来说，它是没有搜索功能的，所以我们可以实现一个Boost搜索引擎来实现一个简单的搜索功能，可以更快速的实现Boost库的查找，在这里，我们实现的是站内搜索，而不是全网搜索。2.对于搜索引擎的相关宏观理解3.搜索引擎技术栈及项目环境技术栈：c/c++,c++11,STL,Boost准标准库，Jsoncpp，cppjieba，cpp-httplib,html5,css,js
全文检索 -- Solr服务器实现站内搜索（一） -- Solr-8.7.0新版本安装配置 JakeYangChina Java后台开发 java solr 后端
转载请注明出处：https://blog.csdn.net/JakeYangChina/article/details/109647848前言最近刚完成电商项目后台开发，对于商品的站内搜索采用的是Solr集群，Solr的版本是8.7.0，服务器采用的是apache-tomcat-9.0.17，因为是首次接触Solr，在配置过程中遇到了许多坑，特此记录下来方便以后查看，从网上能搜索到的文章基本上是低
ElasticSearch总结 xiaolong1894 elasticsearch 搜索引擎面试
一、基本概念Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎，基于Lucene的搜索服务器，采用Java语言编写，开发者可以通过RESTfulAPI轻松实现搜索功能。优点：分布式、全文检索、近实时搜索和分析、高可用、模式自由、RESTfulAPI。应用：站内搜索、NoSQL数据库、日志分析等。ELK基于Elasticsearch衍生出来了一系列开源软件，统称为Elasti
精益数据分析（三）——商业模式：电子商务粉红狐狸_dhf
1主营业务让访客在网站上买东西。相比于早期的站内搜索模式，站外（搜索关键词）搜索已成为主流，这意味着购买流程在买家访问网站以前，就在社交网络、在线社区等各个信息获取地开始了。2商业模式处于哪一个商业模式并不重要，重要的是清楚公司处于哪一种模式中，才能明确现阶段的主要任务。“次年重复购买率”是电商能够取得长久成功的先见指标。（1）用户获取模式如果年度重复购买率不足40%，则经营的重心应该放在用户获取
视频观看小站 TToolss 网站
[在此处输入文章标题]这种网站，永远不嫌多~视频小站，一次性满足所有观影需求！低端影视：https://ddrk.me/优点：1080P+全高清均可观看，无广告，支持站内搜索，观影体验不错。http://www.wuhaozhan.net此站点提供全网电影磁力链接的搜索功能，无法在线直接观看，可根据自己的视觉观看清晰度的需求选择，由于我家境贫寒，只能选择2k。轻度ADS。电影蜜蜂：https://
Elasticsearch的基本功能和使用 Adellle JAVA进阶 elasticsearch 大数据搜索引擎
Elasticsearch，简称为ES，是一款非常强大的开源的高扩展的分布式全文检索引擎，可以帮助我们从海量数据中快速找到需要的内容,它可以近乎实时的存储、检索数据.还可以可以实现日志统计、分析、系统监控等功能.官网:https://www.elastic.co/cn例如京东,淘宝,头条等站内搜索功能.ES环境搭建ES下载地址:https://www.elastic.co/cn/downloads
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts