wang_keng

lucence全文检索

首先呢，学习任何一门新的亦或是旧的开源技术，百度其中一二是最简单的办法，先了解其中的大概，思想等等。这里就贡献一个讲解很到位的ppt。已经被我转成了PDF，便于搜藏。

　　其次，关于第一次编程初探，建议还是查看官方资料。百度到的资料，目前Lucene已经更新到4.9版本，这个版本需要1.7以上的JDK，所以如果还用1.6甚至是1.5的小盆友，请参考低版本，由于我用的1.6，因此在使用Lucene4.0。

　　这是Lucene4.0的官网文档：http://lucene.apache.org/core/4_0_0/core/overview-summary.html

　　这里非常佩服Lucene的开元贡献者，可以阅读Lucene in Action，作者最初想要写软件赚钱，最后贡献给了Apache，跑题了。

　　最后，提醒学习Lucene的小盆友们，这个开源软件的版本更新不慢，版本之间的编程风格亦是不同，所以如果百度到的帖子，可能这段代码，用了4.0或者3.6就会不好使。

　　比如，以前版本的申请IndexWriter时，是这样的：

 IndexWriter indexWriter  =   new IndexWriter(indexDir,luceneAnalyzer, true );

　　但是4.0，我们需要配置一个conf，把配置内容放到这个对象中：

    IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer);
    IndexWriter iwriter = new IndexWriter(directory, config);

　　所以，请一定要参考官方文档的编程风格，进行代码的书写。

　　最后的最后，从官网上面下载下来的文件，已经上传至百度网盘，欢迎下载。

　　这是其中最常用的五个文件：

　　第一个，也是最重要的，Lucene-core-4.0.0.jar,其中包括了常用的文档，索引，搜索，存储等相关核心代码。

　　第二个，Lucene-analyzers-common-4.0.0.jar，这里面包含了各种语言的词法分析器，用于对文件内容进行关键字切分，提取。

　　第三个，Lucene-highlighter-4.0.0.jar，这个jar包主要用于搜索出的内容高亮显示。

　　第四个和第五个，Lucene-queryparser-4.0.0.jar，提供了搜索相关的代码，用于各种搜索，比如模糊搜索，范围搜索，等等。

废话说到这里，下面我们简单的讲解一下什么是全文检索。

　　比如，我们一个文件夹中，或者一个磁盘中有很多的文件，记事本、world、Excel、pdf，我们想根据其中的关键词搜索包含的文件。例如，我们输入Lucene，所有内容含有Lucene的文件就会被检查出来。这就是所谓的全文检索。

　　因此，很容易的我们想到，应该建立一个关键字与文件的相关映射，盗用ppt中的一张图，很明白的解释了这种映射如何实现。

　　在Lucene中，就是使用这种“倒排索引”的技术，来实现相关映射。

有了这种映射关系，我们就来看看Lucene的架构设计。

　　下面是Lucene的资料必出现的一张图，但也是其精髓的概括。

　　我们可以看到，Lucene的使用主要体现在两个步骤：

　　1 创建索引，通过IndexWriter对不同的文件进行索引的创建，并将其保存在索引相关文件存储的位置中。

　　2 通过索引查寻关键字相关文档。

　　下面针对官网上面给出的一个例子，进行分析：

 1 　　Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
 2 
 3     // Store the index in memory:
 4     Directory directory = new RAMDirectory();
 5     // To store an index on disk, use this instead:
 6     //Directory directory = FSDirectory.open("/tmp/testindex");
 7     IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer);
 8     IndexWriter iwriter = new IndexWriter(directory, config);
 9     Document doc = new Document();
10     String text = "This is the text to be indexed.";
11     doc.add(new Field("fieldname", text, TextField.TYPE_STORED));
12     iwriter.addDocument(doc);
13     iwriter.close();
14     
15     // Now search the index:
16     DirectoryReader ireader = DirectoryReader.open(directory);
17     IndexSearcher isearcher = new IndexSearcher(ireader);
18     // Parse a simple query that searches for "text":
19     QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, "fieldname", analyzer);
20     Query query = parser.parse("text");
21     ScoreDoc[] hits = isearcher.search(query, null, 1000).scoreDocs;
22     assertEquals(1, hits.length);
23     // Iterate through the results:
24     for (int i = 0; i < hits.length; i++) {
25       Document hitDoc = isearcher.doc(hits[i].doc);
26       assertEquals("This is the text to be indexed.", hitDoc.get("fieldname"));
27     }
28     ireader.close();
29     directory.close();

索引的创建

　　首先，我们需要定义一个词法分析器。

　　比如一句话，“我爱我们的中国！”，如何对他拆分，扣掉停顿词“的”，提取关键字“我”“我们”“中国”等等。这就要借助的词法分析器Analyzer来实现。这里面使用的是标准的词法分析器，如果专门针对汉语，还可以搭配paoding，进行使用。

1 Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);

　　参数中的Version.LUCENE_CURRENT，代表使用当前的Lucene版本，本文环境中也可以写成Version.LUCENE_40。

　　第二步，确定索引文件存储的位置，Lucene提供给我们两种方式：

　　1 本地文件存储

Directory directory = FSDirectory.open("/tmp/testindex");

　　2 内存存储

Directory directory = new RAMDirectory();

　　可以根据自己的需要进行设定。

　　第三步，创建IndexWriter，进行索引文件的写入。

IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer);
IndexWriter iwriter = new IndexWriter(directory, config);

　　这里的IndexWriterConfig，据官方文档介绍，是对indexWriter的配置，其中包含了两个参数，第一个是目前的版本，第二个是词法分析器Analyzer。

　　第四步，内容提取，进行索引的存储。

Document doc = new Document();
String text = "This is the text to be indexed.";
doc.add(new Field("fieldname", text, TextField.TYPE_STORED));
iwriter.addDocument(doc);
iwriter.close();

　　第一行，申请了一个document对象，这个类似于数据库中的表中的一行。

　　第二行，是我们即将索引的字符串。

　　第三行，把字符串存储起来（因为设置了TextField.TYPE_STORED,如果不想存储，可以使用其他参数，详情参考官方文档），并存储“表明”为"fieldname".

　　第四行，把doc对象加入到索引创建中。

　　第五行，关闭IndexWriter,提交创建内容。

　　这就是索引创建的过程。

关键字查询：

　　第一步，打开存储位置

DirectoryReader ireader = DirectoryReader.open(directory);

　　第二步，创建搜索器

IndexSearcher isearcher = new IndexSearcher(ireader);

　　第三步，类似SQL，进行关键字查询

QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, "fieldname", analyzer);
Query query = parser.parse("text");
ScoreDoc[] hits = isearcher.search(query, null, 1000).scoreDocs;
assertEquals(1, hits.length);
for (int i = 0; i < hits.length; i++) {
    Document hitDoc = isearcher.doc(hits[i].doc);
    assertEquals("This is the text to be indexed.",hitDoc.get("fieldname"));
}

　　这里，我们创建了一个查询器，并设置其词法分析器，以及查询的“表名“为”fieldname“。查询结果会返回一个集合，类似SQL的ResultSet，我们可以提取其中存储的内容。

　　关于各种不同的查询方式，可以参考官方手册，或者推荐的PPT

　　第四步，关闭查询器等。

ireader.close();
directory.close();

　　最后，博猪自己写了个简单的例子，可以对一个文件夹内的内容进行索引的创建，并根据关键字筛选文件，并读取其中的内容。

创建索引：

/**
     * 创建当前文件目录的索引
     * @param path 当前文件目录
     * @return 是否成功
     */
    public static boolean createIndex(String path){
        Date date1 = new Date();
        List<File> fileList = getFileList(path);
        for (File file : fileList) {
            content = "";
            //获取文件后缀
            String type = file.getName().substring(file.getName().lastIndexOf(".")+1);
            if("txt".equalsIgnoreCase(type)){
                
                content += txt2String(file);
            
            }else if("doc".equalsIgnoreCase(type)){
            
                content += doc2String(file);
            
            }else if("xls".equalsIgnoreCase(type)){
                
                content += xls2String(file);
                
            }
            
            System.out.println("name :"+file.getName());
            System.out.println("path :"+file.getPath());
//            System.out.println("content :"+content);
            System.out.println();
            
            
            try{
                analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
                directory = FSDirectory.open(new File(INDEX_DIR));
    
                File indexFile = new File(INDEX_DIR);
                if (!indexFile.exists()) {
                    indexFile.mkdirs();
                }
                IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer);
                indexWriter = new IndexWriter(directory, config);
                
                Document document = new Document();
                document.add(new TextField("filename", file.getName(), Store.YES));
                document.add(new TextField("content", content, Store.YES));
                document.add(new TextField("path", file.getPath(), Store.YES));
                indexWriter.addDocument(document);
                indexWriter.commit();
                closeWriter();
    
                
            }catch(Exception e){
                e.printStackTrace();
            }
            content = "";
        }
        Date date2 = new Date();
        System.out.println("创建索引-----耗时：" + (date2.getTime() - date1.getTime()) + "ms\n");
        return true;
    }

进行查询：

/**
     * 查找索引，返回符合条件的文件
     * @param text 查找的字符串
     * @return 符合条件的文件List
     */
    public static void searchIndex(String text){
        Date date1 = new Date();
        try{
            directory = FSDirectory.open(new File(INDEX_DIR));
            analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
            DirectoryReader ireader = DirectoryReader.open(directory);
            IndexSearcher isearcher = new IndexSearcher(ireader);
    
            QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, "content", analyzer);
            Query query = parser.parse(text);
            
            ScoreDoc[] hits = isearcher.search(query, null, 1000).scoreDocs;
        
            for (int i = 0; i < hits.length; i++) {
                Document hitDoc = isearcher.doc(hits[i].doc);
                System.out.println("____________________________");
                System.out.println(hitDoc.get("filename"));
                System.out.println(hitDoc.get("content"));
                System.out.println(hitDoc.get("path"));
                System.out.println("____________________________");
            }
            ireader.close();
            directory.close();
        }catch(Exception e){
            e.printStackTrace();
        }
        Date date2 = new Date();
        System.out.println("查看索引-----耗时：" + (date2.getTime() - date1.getTime()) + "ms\n");
    }

全部代码:

 
     
   
package test;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileReader;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;

import jxl.Cell;
import jxl.Sheet;
import jxl.Workbook;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.LongField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.usermodel.Range;

/**
* @author xinghl
*
*/
public class IndexManager{
   private static IndexManager indexManager;
   private static String content="";
   
   private static String INDEX_DIR = "D:\\luceneIndex";
   private static String DATA_DIR = "D:\\luceneData";
   private static Analyzer analyzer = null;
   private static Directory directory = null;
   private static IndexWriter indexWriter = null;
   
   /**
    * 创建索引管理器
    * @return 返回索引管理器对象
    */
   public IndexManager getManager(){
       if(indexManager == null){
           this.indexManager = new IndexManager();
       }
       return indexManager;
   }
   /**
    * 创建当前文件目录的索引
    * @param path 当前文件目录
    * @return 是否成功
    */
   public static boolean createIndex(String path){
       Date date1 = new Date();
       List<File> fileList = getFileList(path);
       for (File file : fileList) {
           content = "";
           //获取文件后缀
           String type = file.getName().substring(file.getName().lastIndexOf(".")+1);
           if("txt".equalsIgnoreCase(type)){
               
               content += txt2String(file);
           
           }else if("doc".equalsIgnoreCase(type)){
           
               content += doc2String(file);
           
           }else if("xls".equalsIgnoreCase(type)){
               
               content += xls2String(file);
               
           }
           
           System.out.println("name :"+file.getName());
           System.out.println("path :"+file.getPath());
//            System.out.println("content :"+content);
           System.out.println();
           
           
           try{
               analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
               directory = FSDirectory.open(new File(INDEX_DIR));
   
               File indexFile = new File(INDEX_DIR);
               if (!indexFile.exists()) {
                   indexFile.mkdirs();
               }
               IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer);
               indexWriter = new IndexWriter(directory, config);
               
               Document document = new Document();
               document.add(new TextField("filename", file.getName(), Store.YES));
               document.add(new TextField("content", content, Store.YES));
               document.add(new TextField("path", file.getPath(), Store.YES));
               indexWriter.addDocument(document);
               indexWriter.commit();
               closeWriter();
   
               
           }catch(Exception e){
               e.printStackTrace();
           }
           content = "";
       }
       Date date2 = new Date();
       System.out.println("创建索引-----耗时：" + (date2.getTime() - date1.getTime()) + "ms\n");
       return true;
   }
   
   /**
    * 读取txt文件的内容
    * @param file 想要读取的文件对象
    * @return 返回文件内容
    */
   public static String txt2String(File file){
       String result = "";
       try{
           BufferedReader br = new BufferedReader(new FileReader(file));//构造一个BufferedReader类来读取文件
           String s = null;
           while((s = br.readLine())!=null){//使用readLine方法，一次读一行
               result = result + "\n" +s;
           }
           br.close();    
       }catch(Exception e){
           e.printStackTrace();
       }
       return result;
   }
   
   /**
    * 读取doc文件内容
    * @param file 想要读取的文件对象
    * @return 返回文件内容
    */
   public static String doc2String(File file){
       String result = "";
       try{
           FileInputStream fis = new FileInputStream(file);
           HWPFDocument doc = new HWPFDocument(fis);
           Range rang = doc.getRange();
           result += rang.text();
           fis.close();
       }catch(Exception e){
           e.printStackTrace();
       }
       return result;
   }
   
   /**
    * 读取xls文件内容
    * @param file 想要读取的文件对象
    * @return 返回文件内容
    */
   public static String xls2String(File file){
       String result = "";
       try{
           FileInputStream fis = new FileInputStream(file);   
           StringBuilder sb = new StringBuilder();   
           jxl.Workbook rwb = Workbook.getWorkbook(fis);   
           Sheet[] sheet = rwb.getSheets();   
           for (int i = 0; i < sheet.length; i++) {   
               Sheet rs = rwb.getSheet(i);   
               for (int j = 0; j < rs.getRows(); j++) {   
                  Cell[] cells = rs.getRow(j);   
                  for(int k=0;k<cells.length;k++)   
                  sb.append(cells[k].getContents());   
               }   
           }   
           fis.close();   
           result += sb.toString();
       }catch(Exception e){
           e.printStackTrace();
       }
       return result;
   }
   /**
    * 查找索引，返回符合条件的文件
    * @param text 查找的字符串
    * @return 符合条件的文件List
    */
   public static void searchIndex(String text){
       Date date1 = new Date();
       try{
           directory = FSDirectory.open(new File(INDEX_DIR));
           analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
           DirectoryReader ireader = DirectoryReader.open(directory);
           IndexSearcher isearcher = new IndexSearcher(ireader);
   
           QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, "content", analyzer);
           Query query = parser.parse(text);
           
           ScoreDoc[] hits = isearcher.search(query, null, 1000).scoreDocs;
       
           for (int i = 0; i < hits.length; i++) {
               Document hitDoc = isearcher.doc(hits[i].doc);
               System.out.println("____________________________");
               System.out.println(hitDoc.get("filename"));
               System.out.println(hitDoc.get("content"));
               System.out.println(hitDoc.get("path"));
               System.out.println("____________________________");
           }
           ireader.close();
           directory.close();
       }catch(Exception e){
           e.printStackTrace();
       }
       Date date2 = new Date();
       System.out.println("查看索引-----耗时：" + (date2.getTime() - date1.getTime()) + "ms\n");
   }
   /**
    * 过滤目录下的文件
    * @param dirPath 想要获取文件的目录
    * @return 返回文件list
    */
   public static List<File> getFileList(String dirPath) {
       File[] files = new File(dirPath).listFiles();
       List<File> fileList = new ArrayList<File>();
       for (File file : files) {
           if (isTxtFile(file.getName())) {
               fileList.add(file);
           }
       }
       return fileList;
   }
   /**
    * 判断是否为目标文件，目前支持txt xls doc格式
    * @param fileName 文件名称
    * @return 如果是文件类型满足过滤条件，返回true；否则返回false
    */
   public static boolean isTxtFile(String fileName) {
       if (fileName.lastIndexOf(".txt") > 0) {
           return true;
       }else if (fileName.lastIndexOf(".xls") > 0) {
           return true;
       }else if (fileName.lastIndexOf(".doc") > 0) {
           return true;
       }
       return false;
   }
   
   public static void closeWriter() throws Exception {
       if (indexWriter != null) {
           indexWriter.close();
       }
   }
   /**
    * 删除文件目录下的所有文件
    * @param file 要删除的文件目录
    * @return 如果成功，返回true.
    */
   public static boolean deleteDir(File file){
       if(file.isDirectory()){
           File[] files = file.listFiles();
           for(int i=0; i<files.length; i++){
               deleteDir(files[i]);
           }
       }
       file.delete();
       return true;
   }
   public static void main(String[] args){
       File fileIndex = new File(INDEX_DIR);
       if(deleteDir(fileIndex)){
           fileIndex.mkdir();
       }else{
           fileIndex.mkdir();
       }
       
       createIndex(DATA_DIR);
       searchIndex("man");
   }
} 
     
   

运行结果：

　　所有包含man关键字的文件，都被筛选出来了。

　文章转载至——xingoo

每天了解一个不同的证书类型之红帽篇咕噜Yuki0609 linux
红帽是一家专注于开源技术的公司，其业务涵盖了Linux系统的发行、云计算、容器化应用、人工智能等，并且在全球市场上有广泛的用户群体。同时，红帽也在不断加强其在开源技术领域的研发，不断推出新的产品和服务，以满足客户的需求。因此，红帽公司在开源技术领域中处于领先地位，并且在市场中有着良好的发展前景。红帽证书分为三个级别：红帽认证系统管理员（RHCSA）是最基础的认证级别，要求考生掌握Linux系统的安
php案例分析百度云_基于阿里云平台的大数据教学案例 —— B站弹幕数据分析 weixin_39892311 php案例分析百度云
简介：实验基于所学的大数据处理知识，结合阿里云大数据相关产品，分组完成一个大数据分析项目，数据集可以使用开源数据集或自行爬取，最终完成一个完整的实验报告：1、能够使用阿里云大数据相关产品完成数据分析、数据建模与模型优化2、能够基于分析结构构建可视化门户或可视化大屏，分析和呈现不少于5个3、分析案例有实用价值并能够形成有效结论4、能够将开源技术与阿里云产品结合，综合利用提升开发效率，降低成本5、能够
（二十）Flink Paimon springk Flink全景解析大数据实时数据实时数据处理 paimon flink paimon
数据湖、湖仓一体是当前大数据领域技术发展的重要趋势。近几年开源数据湖技术如ApacheHudi、ApacheIceberg、ApachePaimon、DeltaLake等不断涌现，基于湖仓一体架构的统一元数据管理、数据治理也越来越受到关注。从传统数仓到数据湖、湖仓一体架构，从流批一体计算到基于数据湖的流批一体存储，越来越多的企业基于开源技术，在集成、计算、存储、查询分析等方面不断优化，建设形成适合
Orillusion感谢谷歌GDG DevFest开发者大会2023（北京）的推荐前端
谷歌开发者社区（GoogleDeveloperGroups）是谷歌开发者部门发起的全球项目，是面向对Google和开源技术、开放技术感兴趣的开发者社区，由对谷歌开发技术感兴趣的开发者们主导。其内容涵盖Web、Android、TensorFlow、Flutter和其它GoogleAPI等。至2020年11月，全球已有1000多个GDG社区，分布在130多个国家。中国大陆有27个GDG社区，中国台湾有
Orillusion感谢谷歌GDG DevFest开发者大会2023（北京）的推荐前端
谷歌开发者社区（GoogleDeveloperGroups）是谷歌开发者部门发起的全球项目，是面向对Google和开源技术、开放技术感兴趣的开发者社区，由对谷歌开发技术感兴趣的开发者们主导。其内容涵盖Web、Android、TensorFlow、Flutter和其它GoogleAPI等。至2020年11月，全球已有1000多个GDG社区，分布在130多个国家。中国大陆有27个GDG社区，中国台湾有
技术产品研发型企业的发展困境数蚕
目前中小企业想要发展自己的业务，必须使用到底层架构技术，于是企业多采用三种技术方案，一、招相关技术人员，并为之长期投入技术成本；二、使用相关开源技术框架，并培养相关业务人员；三、购买大型软件基础服务公司提供的云服务，并为之按量或时付费。其中方案一多为传统型生产型软件企业，其优点是人员稳定性强，研发周期稳定，市场发布规律，潜在用户群体流失性低；长期来看，对企业人员稳定，技术沉淀，都有着十分重要的贡献
基于WebGPU的AI原生3D引擎将会迎来新机遇！Orillusion在GOTC上做主题演讲！前端
全球开源技术峰会（GlobalOpen-sourceTechnologyConferencGOTC2023由开放原子开源基金会、Linux基金会亚太区、上海浦东软件园和开源中国联合发起，于5月27日至28日在上海顺利举行。GOTC是面向全球开发者的一场盛大开源技术盛宴，大会以行业展览、主题发言、专题论坛、开源市集的形式展现，与会者将一起探讨元宇宙、3D与游戏、eBPF、Web3.0、区块链等热门技
C#/.NET/.NET Core学习、工作 He少年 .net .netcore c#数据结构
‍C#/.NET/.NETCore学习、工作、面试指南让现在的自己不再迷茫✨✨✨。DotNetGuideDotNetGuide技术社区是一个面向.NET开发者的开源技术社区，旨在为开发者们提供全面的C#/.NET/.NETCore相关学习资料、技术分享和咨询、项目推荐、招聘资讯和解决问题的平台。在这个社区中，开发者们可以分享自己的技术文章、项目经验、遇到的疑难技术问题以及解决方案，并且还有机会结识
Fisco Bcos 去远方追逐
公司要发展区块链相关的技术。由此技术部对联盟链的底层平台进行了技术选型。目前我们选择的是金链盟的FISCOBCOS。以下是具体的访问地址。经过我们运维团队的搭建，这套平台我们可以自主控制，而且他们的沟通群和技术支持还不错。要想从0开始搞的，不妨借鉴一下。FISCOBCOS以一揽子开源技术方案为核心，全面构建了满足分布式商业发展要求的金融级区块链基础设施，并以此孵化区块链上的应用生态。image.p
vue 文字转语音mp3_vue 语音合成 - 梦魂清风的个人空间 - OSCHINA - 中文开源技术交流社区... 左锦辉 vue 文字转语音mp3
1、百度语音restAPIhttps请求，在线语音合成免费tex必填合成的文本，使用UTF-8编码。小于2048个中文字或者英文数字。(文本在百度服务器内转换为GBK后，长度必须小于4096字节)tok必填开放平台获取到的开发者access_token(见上面的“鉴权认证机制”段落)cuid必填用户唯一标识，用来计算UV值。建议填写能区分用户的机器MAC地址或IMEI码，长度为60字符以内ctp必
关于RedHat Linux各版本介绍 jackgogogo 程序人生 linux redhat 服务器数据库产品 server
关于RedHatLinux各版本介绍关键词:RHEL4U2ASWSES区别不同RedHat是全球最大的开源技术厂家，其产品RedHatLinux也是全世界应用最广泛的Linux。国内的代理：http://www.mylinux.cn/redhat.htm单是RedHat也有多个版本可以选择，如下：
【开源精选导航】GitHub-Chinese-Top-Charts：一榜在手，优质中文项目轻松找寻 GitCode 官方 gitcode 开源
各位热爱开源技术的朋友们，你们是否有过这样的困扰：面对浩瀚的GitHub海洋，想找寻那些具有高质量中文文档的优秀开源项目却无从下手？今天，我们就为大家揭晓一个宝藏般的开源项目——GitHub中文项目集合（访问地址：https://gitcode.com/GrowingGit/GitHub-Chinese-Top-Charts/overview），它就如同你的私人开源项目顾问，帮你轻松跨过语言鸿沟，
整理一份程序员常用的各类工具、技术站点 python爬虫人工智能大数据
点击上方“测试开发技术”，选择“加为星标”优质文章，第一时间送达！1.技术站点HackerNews：非常棒的针对编程的链接聚合网站MSDN：微软相关的官方技术集中地，主要是文档类infoQ：企业级应用，关注软件开发领域OSChina：开源技术社区，开源方面做的不错哦博客园、51CTO、CSDN：常见的技术社区，各有专长stackoverflow：IT技术问答网站GitHub：全球最大的源代码管理平
混战在帝都的妹纸一枚，整理于Github上的工具合集 ch3rry 敏捷开发
来自：SegmentFault作者：妹纸一枚链接：http://segmentfault.com/q/1010000002404545原标题：GitHub上整理的一些工具，求补充技术站点HackerNews：非常棒的针对编程的链接聚合网站Programmingreddit：同上MSDN：微软相关的官方技术集中地，主要是文档类infoq：企业级应用，关注软件开发领域OSChina：开源技术社区，开源
Open Assistant 真的可以平替拆GPT吗一号专家智囊团
OpenAssistant是一个开源项目，为构建对话式人工智能助手提供了一个框架。它允许开发人员创建聊天机器人、语音助手和其他可以用自然语言与用户交互的对话界面。它建立在几种流行的开源技术之上，包括TensorFlow、Keras和Flask。它提供了一组用于处理自然语言处理、意图识别和对话管理的预构建组件，以及用于训练和部署模型的工具。OpenAssistant的一个主要优点是它的灵活性。它可以
“Linux 中国” 开源社区宣布停止运营 Lorin 洛林互联网资讯 linux 运维服务器
今日，“Linux中国”微信公众号发布消息，宣布该社区及其相关平台将无限期停止更新和运营，包括其主网、微信公众号、视频号，以及《硬核观察》栏目。主理人“硬核老王”在公告中透露，停止运营的原因包括以下几个方面：首先，“Linux中国”已完成了其历史使命。最初，他们的愿景是建立一个传播开源技术的公益型社区。然而，随着时间的推移，开源文化和与Linux相关的技术已经广泛传播，因此继续运营对推动该领域的作
白鲸开源荣膺2023年度大数据产业最具投资价值企业奖项 DolphinScheduler社区大数据
北京时间2024年2月20日，中国领先的开源技术公司，白鲸开源科技有限公司（以下简称"白鲸开源"）荣幸宣布，该公司获得了第六届"年度金猿季大型主题策划活动"颁发的"2023大数据产业年度最具投资价值"奖项。这一殊荣是对白鲸开源在大数据领域取得的卓越成就和突出贡献的认可。金猿季推动产业升级"年度金猿季大型主题活动"由金猿、数据猿、上海大数据联盟共同组成的金猿组委会发起。本届金猿季以"小趋势·大未来"
深掘开源安全需求，破解开源治理难题开源网安开源安全产品面面观安全开源开源软件软件成分分析 sca
当下，中国金融科技行业在数字支付、数字信贷、金融风控等领域取得了很多创新成果，大幅提升了金融数字化和智能化水平，已经在金融科技的全球竞争中走在前列。在此进程中，开源技术发挥了不可或缺的重要作用，根据我国金融行业开源技术应用社区调研结果显示，金融机构中超过90%的企业引入了开源软件，近四成金融机构使用超过1000个开源软件。开源技术的广泛应用，不仅加速了数字产品的研发周期，降低了创新成本，还以社区协
怎样才是优秀的程序员？乐之者v 工作-软技能职场和发展
工作工作，学习，效率非常高。知道该做什么事情，什么事情优先级高。独立思考的能力，不盲目听从。目标多给自己定目标。心仪的薪酬想要X万，Y点下班。技术熟悉开源技术。学习有长期价值的技术。十年后还有用的技术。linux、mysql、redis、kafka、netty.学习系统性地学习，而不止于碎片知识。善于向优秀的人学习~每解决一个问题，就多进步一点点。知其然，还知其所以然。看书，看官方文档，阅读源码。
第一章初识Docker 小白之比白更白 Docker docker 容器运维
什么是Docker？Docker的主要目的是“build,ShipandRunAnyApp,Anywhere"，即通过对应用组件的封装、分发、部署、运行等生命周期的管理，达到应用组件级别的”一次封装，到处运行“。这里的应用组件，既可以是一个Web应用也可以是一套数据库服务，甚至是一个操作系统或编译器。Docker基于Linux的多项开源技术提供了搞笑、敏捷和轻量级的容器方案，并且支持在多种主流平台
Solr的原理及使用传而习乎
1.Solr的简介Solr是一个独立的企业级搜索应用服务器，它对外提供类似于Web-service的API接口。用户可以通过http请求，向搜索引擎服务器提交一定格式的XML文件，生成索引；也可以通过HttpGet操作提出查找请求，并得到XML格式的返回结果。2.工作原理solr是基于Lucence开发的企业级搜索引擎技术，而lucence的原理是倒排索引。那么什么是倒排索引呢？接下来我们就介绍一
一些开源革命的幕后人物发疯的小猿轻知识笔记
文章目录《FacesofOpenSource》1.INTERNET2.WWW3.UNIX4.BSD5.LINUX6.LANGUAGES7.ROS8.XWINDOW《FacesofOpenSource》是一本关于开源革命幕后人物的持续摄影记录。该项目由著名或无名英雄的肖像组成，他们致力于创造和推进我们的开源技术。此项目的链接来源：https://www.facesofopensource.com/摄
Linux 磁盘IO 祁小彬
原文：MySQL调优基础(四)Linux磁盘IO-IT--小哥的个人空间-OSCHINA-中文开源技术交流社区一、IO处理过程磁盘IO经常会成为系统的一个瓶颈，特别是对于运行数据库的系统而言。数据从磁盘读取到内存，在到CPU缓存和寄存器，然后进行处理，最后写回磁盘，中间要经过很多的过程，下图是一个以write为例的Linux磁盘IO子系统的架构：image可以看到IO操作分成了四个层面：1）文件系
基于JAVA,SpringBoot,HTML宠物商店交易管理系统设计程序猿大波 Java java spring boot 开发语言
摘要：本研究旨在设计并实现一个基于Java,SpringBoot框架以及HTML前端技术的宠物商店交易管理系统。系统采用模块化的设计思想，将整个宠物商店的交易管理流程数字化和自动化，以提高管理效率，优化用户体验，并确保交易过程的透明度和安全性。在技术架构方面，后端采用SpringBoot框架，利用其自动配置、独立运行以及与众多开源技术的无缝集成能力，实现业务逻辑层和数据访问层的快速开发。Sprin
基于Kubernetes（K8s）构建企业容器云基础运行环境赵文宇（温玉） cncfstack kubernetes 容器云原生
cncfstack新文章上线：书名：《云原生解决方案》地址：https://zhaowenyu.com/cncf-solution访问：文章底部“阅读原文”或访问域名云原生计算是云计算发展新的里程碑阶段，是当今与未来很长一段时间中IT发展的技术基础。但当我们初次接触到云原生技术栈时，特别是云原生全景图（CloudNativeLandscape），会看到大量的开源技术与云原生生态，会感叹他的宏大与复
探索技术的无限可能-云原生计算2023年度奖项字节跳动云原生计算云原生大数据
在过去的一年里，字节跳动云原生计算团队获得了「DataFun年度数据智能先锋奖」、「开源中国-优秀开源技术团队」和「火山引擎开发者社区-年度优质内容」奖项。这些奖项既是鼓励，也是鞭策。在未来技术的道路上，我们将继续与大家同行，共同探索技术的无限可能！再次感谢大家对云原生计算团队的关注～Datafun年度数据智能先锋奖规模化的数据智能应用带来无数变量的冲突，不同的权衡取舍造就了不同的技术创新。有多少
程序员必备的20个学习网站 wd_cloud 个人开发开发语言团队开发
今天好学编程小编整理了20个程序员必备的学习网站，此篇对于新手程序员比较有用，技术老鸟们也可以查缺补漏。话不多说，纯纯干货呈上，赶紧点个赞+收藏，以后会用得上！技术网站类1、博客园一个面向开发者的知识分享社区，聚集许多优秀的开发者，分享知识、信息以及技术讨论。2、CSDN这个不用多说吧，中文最大的技术社区，全球知名中文IT技术交流平台，超多大神在这里！3、开源中国目前国内最大的开源技术社区，资源、
使用 Woodpecker 与 Gitea 搭建纯开源的 CI 流程｜极限降本 -白泽- golang 运维 CI gitea 开源 ci/cd
最近开源了一个挂机冒险游戏《模拟龙生》，有热心同学不仅帮忙做优化，还连夜在给游戏加页面，泪目。详见文末小结部分。一、前言大家好，这里是白泽。这篇文章是《WoodpeckerCI设计分析》的续接，将通过阅读Woodpecker和Gitea的源代码，解决前一篇文章最后遗留的问题，并最终实现本地部署Woodpecker和Gitea，实现持续集成（CI）全流程使用开源技术，极限降本。遗留问题：通过dock
麒麟系统—— openKylin 安装到虚拟机以及开放SSH通过工具连接盗理者 Linux ssh 运维
麒麟系统——openKylin安装到虚拟机以及开放SSH通过工具连接1.在VMware中安装openKylin麒麟系统步骤1：准备VMware环境步骤2：创建新的虚拟机步骤3：安装openKylin麒麟系统步骤4：调整分别率步骤5：安装SSH2.使用OpenSSH进行连接步骤1：在Windows上安装FinalShell步骤2：设置配置步骤3：连接Windows与麒麟系统随着开源技术的不断进步，国
调研 7 个开源项目后，这家数据合规平台如何构建高性能网关阿里云云原生开源阿里云云原生
作者：张俊，杭州用九智汇科技有限公司系统架构师用九智汇介绍用九智汇是一家面向企业提供数据合规、隐私保护相关产品和解决方案的数据合规公司，致力于帮助客户在合法合规、充分保护用户隐私的基础上发挥数据的最大价值，已服务众多世界500强企业。当前我们的产品交付主要基于云原生相关的基础设施和开源技术栈，如Kubernetes、Istio、ApacheDubbo、AlibabaNacos等，既支持以SaaS的
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情