小小鱼儿小小林

阿里云的一道面试题：写一个爬取文档树和通过输入关键字检索爬取的内容的demo

目录

前言

一、面试内容

1、电话面试和项目实践题目

2、动手题目：文档爬取与搜索

3、研究题目

①查询输入关键词，给出最佳匹配解决思路

二、启动solr

1、配置步骤

2、solr的界面说明和使用

三、开始爬取

代码示例：

四、通过关键词检索

代码示例：

五、前台页面

前台代码示例：

六、运行效果图

七、总结：(附代码下载)

前言

前几天收到外派阿里的一个面试，作为自信、高傲的我，虽然是外派，但是对于阿里还是有一丝崇拜之心的，就像高考想进清华北大，工作想进腾讯阿里是一样的，当然除了校招985/211能进阿里之外，其他想通过社招进阿里的，那是难上加难，起码在某个领域是专家级别的。所以难得有机会，就试试阿里的面试呗。

一、面试内容

1、电话面试和项目实践题目

首先是电话面试：这个一般都没什么问题吧，好好复习多看书，少吃零食多睡觉...这样肯定是能够回答出来的

其次是出一道动手写demo题目，如下

文档链接： https://help.aliyun.com/document_detail/48851.html

爬取左侧文档树中所有的文档列表

查询页面输入关键词或描述性语言，给出最佳匹配的3个文档（匹配度从高到低排序）。

提供：

1. 代码

2. 匹配思路

加分项：对于描述性语言如何给出推荐的文档。例如用户输入：我的日志采集不到了

大部分人一听说要写demo就慌了，别怕，我这不是分享经验和代码示例给你们吗，所以好好看完这篇文章，过了应该是没问题的，我反正是过了。

2、动手题目：文档爬取与搜索

3、研究题目

首先，进链接看一下，咱们瞅一瞅到底是什么东东，原来是阿里云的帮助文档，看来这个简单的demo其实就是一个根据用户输入的关键词搜索到对应解决方法的一个小项目。

第一小步，爬取内容这一块应该不是很难，不管是用java还是Python都可以实现难点是第的，只不过Python可能简单一点，java的话写的代码会多一点，当然小编目前还是想先学精java这一块，所以演示的是java代码完成的，至于Python的话，先学好学精一门语言，再去拓展另外的语言，这样才能更好的辅助你。

难点在于第二小步，“查询页面输入关键词或描述性语言，给出最佳匹配的3个文档（匹配度从高到低排序）”，

咱们先不爬取，因为爬取的话肯定是得封装好想要的格式的，在咱们还没有想到查询关键词这功能的时候，先保留。

①查询输入关键词，给出最佳匹配解决思路

这里你当然可以自己写算法，写匹配，但是这样的话匹配的肯定不是很准确的，而且要在一天之内写出来，几乎是不可能的，所以，咱们看看前辈们有没有对于这类有更好的解决办法呢，踩在巨人的肩膀上会事半功倍。

其实有跟多方法可以实现类似的功能，

譬如通过分词器搜索：Jieba分词、Ansj分词.......具体其他分词效果可以戳这里：了解11大开源中文分词器

或者类似搜索引擎服务器的开源框架：Elasticsearch、Lucene......具体其他搜索引擎服务可以戳这里：了解13大开源搜索引擎

小编这里演示的是用solr搜索引擎实现这个爬取和检索的demo项目

二、启动solr

solr的下载地址：http://archive.apache.org/dist/lucene/solr/ 最好下载低版本的，高版本的需要更高的jdk版本，我jdk是1.7的，下载的solr的版本是4.7.0的，或者在文末下载我做的demo的时候，我也会将用到的东西都放在里面。

1、配置步骤

① 下载下来后，解压

② cmd进入这个目录里：xxxxx/solr-4.7.0/example

③ 执行命令：java -jar start.jar

④ 访问是否启动成功，在浏览器输入http://localhost:8983/solr 就可以访问，表示启动成功

2、solr的界面说明和使用

具体的solr的这里面的其他功能我就不具体介绍了，大家可以参考网上资料，进一步加深对solr的理解和使用

三、开始爬取

首先在项目中引入solr的maven包


      org.apache.solr
      solr-solrj
      4.7.0

爬取很简单，就是模拟浏览器去访问内容就可以了，我们可以看到要爬取的网站左边那一块所有的文字内容都是在

里面的，

这就简单了，所以我们就可以将爬取的数据，经过正则匹配，就可以拿到想要的所有的文字标题信息了

代码示例：

 /**
     * 爬取数据
     * @return
     */
    @ResponseBody
    @RequestMapping("/getDocs")
    public String getDocs() {
        Map mapReturn = new HashMap<>(); //返回结果
        try {
        //爬取前先在solr上建林索引属性
        alibabaService.addDefaultField();

        //开始爬取指定url的数据
        String htmlResult = GetAliApi.sendGet("https://help.aliyun.com/document_detail/48851.html", "");
        //获取到  树文档的内容
        String[] mainMenuListContainer = htmlResult.split("")[1].split("");
        //log.debug(mainMenuListContainer[0]);
        //log.debug("------------------------------");

        //进行正则获取数据
            String searchReg = "(.*?)";
            Pattern pattern = Pattern.compile(searchReg); 	// 讲编译的正则表达式对象赋给pattern
            Matcher matcher = pattern.matcher(mainMenuListContainer[0]);

            int i = 0;
            String pre = "A";
            while (matcher.find()) {
                i++;
                String title = matcher.group(1);
                log.debug(title);
                //将数据放到solr里，添加索引
                Alidocs alidocs = new Alidocs();
                alidocs.setId(pre+i);
                alidocs.setTitle(title);
                alibabaService.addIndex(alidocs);
            }

            mapReturn.put("returnCode","00");
            mapReturn.put("content","爬取成功");
        }catch (Exception e){
            e.printStackTrace();
            mapReturn.put("returnCode","-1");
            mapReturn.put("content","爬取失败,请重试");
        }
        String mapStr = JSONObject.toJSONString(mapReturn);
        return mapStr;

    }

addDefaultField()方法和addIndex()方法：

 // 添加默认索引属性
    public void addDefaultField() throws SolrServerException, IOException {
        // 声明要连接solr服务器的地址
        String url = "http://localhost:8983/solr";
        SolrServer solr = new HttpSolrServer(url);
        SolrInputDocument doc = new SolrInputDocument();
        doc.addField("id", "默认情况下必须添加的字段，用来区分文档的唯一标识");
        doc.addField("title", "默认的名称属性字段");
        solr.add(doc);

        solr.commit();
    }


 // 添加索引
    public void addIndex(Alidocs alidocs) throws SolrServerException, IOException {
        // 声明要连接solr服务器的地址
        String url = "http://localhost:8983/solr";
        SolrServer solr = new HttpSolrServer(url);
        solr.addBean(alidocs);
        solr.commit();
    }

sendGet()方法：

 public static String sendGet(String url, String param) {
        String result = "";
        String urlName = url + "?" + param;
        try {

            URL realURL = new URL(urlName);
            URLConnection conn = realURL.openConnection();
            //伪造ip访问
            String ip = randIP();
            System.out.println("目前伪造的ip："+ip);
            conn.setRequestProperty("X-Forwarded-For", ip);
            conn.setRequestProperty("HTTP_X_FORWARDED_FOR", ip);
            conn.setRequestProperty("HTTP_CLIENT_IP", ip);
            conn.setRequestProperty("REMOTE_ADDR", ip);
            conn.setRequestProperty("Host", "help.aliyun.com/");
            conn.setRequestProperty("accept", "*/*");
            conn.setRequestProperty("connection", "Keep-Alive");
            conn.setRequestProperty("user-agent", "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.146 Safari/537.36");
            conn.setRequestProperty("Referer","https://help.aliyun.com/"); //伪造访问来源
            conn.setRequestProperty("Origin", "https://help.aliyun.com/"); //伪造访问域名
            conn.connect();
            Map> map = conn.getHeaderFields();
            for (String s : map.keySet()) {
                System.out.println(s + "-->" + map.get(s));
            }
            BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream(), "utf-8"));
            String line;
            while ((line = in.readLine()) != null) {
                result += "\n" + line;
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return result;
    }

这样，基本上就爬取的功能就完成了，我们可以看到爬取的是想要的信息

四、通过关键词检索

检索就更简单了，因为用的是solr搜索引擎的服务，所以只要根据solr的api，对数据进行传入就可以检索了，他自动会进行分词筛选，根据匹配度将数据进行返回。

代码示例：

 /**
     * 通过关键词获取数据
     * @param title
     * @return
     */
    @ResponseBody
    @RequestMapping("/findDocs")
    public String findDocs(String title)  {
        Map mapReturn = new HashMap<>(); //返回结果
        try {
            String result = alibabaService.findIndex(title);
            mapReturn.put("returnCode","00");
            mapReturn.put("content",result);
        }catch (Exception e){
            e.printStackTrace();
            mapReturn.put("returnCode","-1");
            mapReturn.put("content","查询异常");
        }
        String mapStr = JSONObject.toJSONString(mapReturn);
        return mapStr;
    }

findIndex()方法：

 // 查找索引
    public String findIndex(String titleInput) throws SolrServerException {
        // 声明要连接solr服务器的地址
        String url = "http://localhost:8983/solr";
        SolrServer solr = new HttpSolrServer(url);

        // 查询条件
        SolrQuery solrParams = new SolrQuery();
        solrParams.setStart(0);
        solrParams.setRows(10);
        solrParams.setQuery("title:"+titleInput);
        // 开启高亮
        solrParams.setHighlight(true);
        solrParams.setHighlightSimplePre("");
        solrParams.setHighlightSimplePost("");

        // 设置高亮的字段
        solrParams.setParam("hl.fl", "title");
        // SolrParams是SolrQuery的子类
        QueryResponse queryResponse = solr.query(solrParams);

        // (一)获取查询的结果集合
        SolrDocumentList solrDocumentList = queryResponse.getResults();


        List contentList = new LinkedList();
        for (SolrDocument solrDocument : solrDocumentList) {
           Map map = new HashMap<>();
           map.put("id",solrDocument.get("id"));
           map.put("title",solrDocument.get("title"));
           contentList.add(map);

        }
        return contentList.toString();
    }

五、前台页面

最后就是前台页面，做的不是很好，因为比较赶时间，只给了一天时间，白天又要上班，只能晚上花几个小时研究后台代码，前台的就先不管了，你们如果有时间的话可以美化美化

前台代码示例：

<%--
  Created by IntelliJ IDEA.
  User: yjl
  Date: 2019-03-13
  Time: 20:03
  To change this template use File | Settings | File Templates.
--%>
<%@ page contentType="text/html;charset=UTF-8" language="java" %>


    阿里测试题
    
    
    
    
    
    



    1、先爬取文档数据
    开始爬取


    
        搜索关键词
        
            
        
    


    查询

六、运行效果图

这样基本上就ok了，也是简单的完成了，跟我预期的还是有点差距的，但是呢，为了赶时间，还是赶紧的发过去了，我是晚上22：21左右发过去的，本来以为面试官得明天才能给出结果，但是呢阿里这么牛X的公司，这么牛不是没有道理的，面试官当场就给我回复了，说我的通过了，有这么敬业的程序员，这样的公司能不牛吗

七、总结：(附代码下载)

1.先得启动solr
解压，在 xxxxx/solr-4.7.0/example 目录 cmd
执行命令：java -jar start.jar

2、启动项目 aliTestProject
然后先点击爬取，等待一会儿，等页面出现【爬取成功】字样，即可进行查询

3、查询效果图

整个项目代码下载链接：https://download.csdn.net/download/qq_27471405/11019809

参考文章：

https://blog.csdn.net/u013087513/article/details/76034373

https://my.oschina.net/apdplat/blog/412921

https://blog.csdn.net/business122/article/details/78064092

https://blog.csdn.net/qing419925094/article/details/42142117

感谢原作者的分享，让技术人能够更快的解决问题

你可能感兴趣的:(Java)

web前端进阶之Javascript设计模式面向对象篇 jia林
前言：在此说明Javascript设计模式所讲内容和知识点来自双越老师（wangEditor富文本开源作者）的视频，内容通俗易懂，受益匪浅，结合自己的学习心得整理成笔记，与大家分享，愿在前端的道路上越走越远.....从“写好代码”到“设计代码”的过程，不仅是技术的提升，更是编程思维的提升，而这其中最关键的就是设计模式，是否理解并掌握设计模式，也是衡量程序员能力的标准之一。学习前提使用过jquery
快速排序Java代码简洁实现 SKY技术修炼指南算法
学习过数据结构的同学们都知道，快速排序算法是一种时间复杂度为O(nlogn)的排序算法，在各种排序算法中算是较为高效的方法，企业面试中也经常有手撕快排的环节。本文将阐述算法的基本思想，并用Java代码的形式实现快速排序代码。算法思想快速排序主要采用分治的基本思想，每次将一个位置上的数据归位，此时该数左边的所有数据都比该数小，右边所有的数据都比该数大，然后递归将已归位的数据左右两边再次进行快排，从而
如何防止重复提交订单？天天摸鱼的java工程师 java
如何防止重复提交订单？作者：Java后端开发工程师一、背景介绍：为什么会产生重复提交？在电商平台中，用户提交订单是一个非常敏感的动作。这通常涉及：库存扣减优惠券核销支付下单消息发送但用户总喜欢：点两次“提交订单”按钮网络卡顿时刷新页面使用浏览器回退再次提交结果就是：重复提交订单，造成资源浪费，甚至业务损失！二、问题分析：重复提交的常见场景场景示例用户行为多次点击按钮、浏览器刷新接口幂等性差接口无幂
如何设计一个高并发短链接服务（如 bit.ly）？天天摸鱼的java工程师 java
如何设计一个高并发短链接服务（如bit.ly）？引言：在社交媒体营销、短信推广等场景中，短链接服务已成为互联网基础设施的关键组件。全球每天有数十亿短链接被创建，如Bitly、TinyURL等服务每天处理数十亿请求。作为一名拥有8年经验的Java架构师，我曾主导设计过日处理千万级短链接的系统。今天我将从原理到实现，深度解析如何构建一个高性能、高可用、可扩展的短链接服务。一、业务场景与技术挑战1.1核
如何将电商单体应用拆分为微服务？拆分粒度如何权衡？天天摸鱼的java工程师微服务 java
如何将电商单体应用拆分为微服务？拆分粒度如何权衡？引言：在电商行业高速发展的今天，系统扩展性和交付速度成为核心竞争力。许多企业初期采用单体架构快速上线，但随着业务规模扩大，单体应用逐渐成为制约发展的瓶颈。你是否也面临这样的挑战：代码库臃肿不堪、发布周期越来越长、局部故障导致全局瘫痪、技术栈升级举步维艰？作为一名有8年开发经验的Java工程师，我曾主导多个大型电商系统的微服务拆分。今天我将分享从业务
如何设计一个社交平台的关注/粉丝系统？一位8年Java开发者的架构心路天天摸鱼的java工程师 java 架构开发语言
如何设计一个社交平台的关注/粉丝系统？——一位8年Java开发者的架构心路当你的社交平台面临百万用户实时互动，如何确保关注操作毫秒级响应？如何保证粉丝列表的实时性和一致性？这个看似基础的功能背后，隐藏着读写扩散、数据一致性、热点用户等架构难题。本文将带你从业务模型到代码落地，构建一个支撑千万级关系的社交系统。一、业务场景与核心挑战典型关注业务流程：未关注已关注用户A关注用户B关系检查写入关注关系更
junit mockito_如何学习Java中的单元测试：JUnit和Mockito课程 dfsgwe1231 单元测试编程语言 python 人工智能 java
junitmockito大家好，今天我将讨论JUnit和单元测试，这是任何软件开发人员的关键技能之一。您可能已经知道JUnit和Mockito是Java应用程序中最受欢迎的两个测试库，并且几乎在每个Java应用程序类路径中都可以找到它们。我经常与Java开发人员见面并一起工作，这些Java开发人员非常了解Java但还没有编写单个单元测试。当我问他们为什么不编写单元测试时，他们提出了许多借口，例如他
（二十三）Java反射机制深度解析：原理、应用与最佳实践 MeyrlNotFound JAVA 开发语言 java
一、反射机制概述1.1什么是反射机制Java反射机制（Reflection）是Java语言中一种强大的内省（introspection）能力，它允许程序在运行时（runtime）获取类的内部信息，并能直接操作类或对象的内部属性及方法。这种"动态性"使得Java程序可以突破编译时的限制，实现许多灵活的功能。反射的核心思想是：在运行时而非编译时获取类型信息并执行操作。这与传统的静态编程形成鲜明对比，在
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
java list使用奋斗live
一、增加、删除、查询可使用add、remove、get方法，如下System.out.println("list的添加、获取和删除元素");Listanimal=newArrayListanimal=newArrayListanimal=newArrayListanimal=newArrayListanimal=newArrayListanimal=newArrayListphone=newArr
JUC——创建线程的方法机器滴小白 JAVA学习笔记 java 开发语言 JUC 并发编程
1.继承Thread类原理：通过继承Thread类并重写其run()方法，定义线程的执行逻辑。（Thread类实现了Runnable接口）调用start()方法启动线程（JVM会自动调用run()）。特点简单直接，适合快速实现线程逻辑。局限性：Java是单继承的，继承Thread后无法再继承其他类。//1.继承Thread类classMyThreadextendsThread{@Overridep
java 结合 FreeMarker 和 Docx4j 来生成包含图片的 docx 文件 liangblog Java生产环境全栈开发 Java进阶 java python 开发语言
使用FreeMarker生成HTML，然后通过Docx4j将HTML转换为.docx文件;步骤1.添加依赖确保你的项目中包含了FreeMarker和Docx4j的依赖。以下是Maven的pom.xml示例：
前端实现多文件下载功能的思路与代码分享好运仔dzl 技术开发 java 开发语言
73万字的Java面试题库【全网最详细-找工作/实习必备神器】：https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzE5MTY1NzczOA==&action=getalbum&album_id=4057608455186808839Java面试题库ps：网上面试题多而杂，自己整理了一套面试题，我靠这套面试题2年经验拿15k~前端实现多文件下载功能的思路
如何在 Stimulsoft JavaScript 报表组件中，设置设计器与查看器主题风格 CodeCraft Studio 控件报表图表开发 javascript 开发语言 ecmascript Stimulsoft Dashboard Report 报表仪表盘工具
在现代软件开发中，图形用户界面（GUI）不仅仅是功能的承载体，更是用户体验的关键组成部分。一个美观、统一且具备高度可定制性的界面，能够显著提升系统的专业感和使用效率。Stimulsoft作为功能强大的报表和仪表板解决方案提供商，其JavaScript版本（StimulsoftReports.JS与StimulsoftDashboards.JS）为开发者提供了丰富的内置主题支持，助力快速构建符合品牌
[Java实战]Spring Boot 整合 Freemarker (十一) 曼岛_ Java实战 java spring boot 开发语言
[Java实战]SpringBoot整合Freemarker(十一)引言ApacheFreeMarker作为一款高性能的模板引擎，凭借其简洁语法、卓越性能和灵活扩展性，在JavaWeb开发中占据重要地位。结合SpringBoot的自动化配置能力，开发者能快速构建动态页面、生成报表或定制代码。本文将系统讲解整合流程、实战技巧、性能优化方案，并针对企业级场景提供深度解决方案。一、Freemarker核
Blazor使用TXTextControl控件编辑报告落叶飞花_ javascript 开发语言
文章目录1环境2课程链接3学习使用（加载TextControl控件）3.1DocumentEditor3.2DocumentViewer4javascriptApi列表5加载文档（TextControl加载文档，JS互操作）6开启修改跟踪（word中的修订）7文档修改保存8文档编辑，拖拽展示图片9文档编辑，使用ApplicationField10模板设计11插入图片11.1拖拽插入图片11.2Me
Java线程池
Executor接口Executor接口是线程池的基类，基本上所有的线程池类都直接或间接继承此类。接口定义publicinterfaceExecutor{voidexecute(Runnablecommand);}ExecutorService接口接口定义ExecutorService接口继承自Executor接口。publicinterfaceExecutorServiceextendsExec
Java 原生 HTTP Client en-route 微服务之间如何调用 java http 开发语言
介绍Java原生HttpClient是从Java11开始引入的标准库，用于简化HTTP请求的发送与响应处理。它支持同步和异步请求，并内置对HTTP/1.1和HTTP/2协议的支持。HttpClient提供了易用的API来设置请求头、请求体、处理响应以及配置SSL/TLS加密等安全功能。一个简单的例子发送GET请求并将打印ResponseHttpClientclient=HttpClient.new
如何用 Mockito 玩转单元测试 en-route 单元测试
介绍Mockito是一个广泛使用的Java测试框架，它提供了简洁而强大的功能，用于模拟（mock）和验证对象的行为，尤其是在单元测试中。当我们需要测试某个类的功能时，但又不希望依赖其外部组件或复杂的对象时，可以使用Mockito来创建模拟对象，这些模拟对象可以控制方法返回值、抛出异常或执行特定的逻辑。Mockito使得测试变得更加独立、可靠和可维护，特别是在测试依赖较多或外部系统交互的代码时。从一
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
Javascript 严格模式use strict详解滴水成川 JavaScript学习记录 javascript use strict
一、概述除了正常运行模式，ECMAscript5添加了第二种运行模式："严格模式"（strictmode）。顾名思义，这种模式使得Javascript在更严格的条件下运行。设立"严格模式"的目的，主要有以下几个：-消除Javascript语法的一些不合理、不严谨之处，减少一些怪异行为;-消除代码运行的一些不安全之处，保证代码运行的安全；-提高编译器效率，增加运行速度；-为未来新版本的Javascr
List和Map的区别雪碧聊技术 Java八股文 list 数据结构
欢迎来到我的Java八股文专栏！各位程序员小伙伴们好呀~我是雪碧聊技术，很高兴能在CSDN与大家相遇！✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点，内容涵盖：Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏？精准定位：直击大厂Java面试高频考点系统全面：从基础到进阶，构建完整知识体系实战导向：理论
领域驱动设计精要我是廖志伟 Java场景面试宝典 DDD Domain-Driven Design Software Architecture
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
DDD核心知识解析我是廖志伟 Java场景面试宝典 DDD Software Design Business Logic
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
ShardingSphere核心机制解析我是廖志伟 Java场景面试宝典 Database Middleware Distributed Database ShardingSphere
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
JVM与Spring Boot核心解析我是廖志伟 Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计（DDD）实践解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring框架核心技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计实践解析我是廖志伟 Java场景面试宝典 DDD Domain-Driven Design Strategic Design
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC 框架解析我是廖志伟 Java场景面试宝典 Spring MVC Web Development Frameworks
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他