fansy1990

Hadoop Web项目--Mahout0.10 MR算法集锦

1. 涉及技术及下载

项目开发使用到的软件有：Myeclipse2014，JDK1.8，Hadoop2.6，MySQL5.6，EasyUI1.3.6，jQuery2.0，Spring4.1.3，Hibernate4.3.1，Struts2.3.1，Maven3.2.1，Mahout0.10。
项目下载地址：https://github.com/fansy1990/mahout1.0，项目部署参考：http://blog.csdn.net/fansy1990/article/details/46481409 。

2. 项目介绍

此项目是在Hadoop Web项目–Friend Find系统基础之上整理Mahout0.10版本中MR程序的调用测试而成，重点演示如何调用Mahout0.10的MR算法、如何把MR算法嵌入到Web项目中，附带数据生成及数据查看、MR 任务监控等功能。
Mahout0.10的MR算法主要参考下面的文件：

此文档里面含有了覆盖常用工具类、聚类算法、分类算法、推荐算法等的MR调用mahout命令以及其对应的实现类。
此篇博客接下来将按照下面的内容进行编写：

项目部署及运行；
项目实现原理；
如何进行项目二次开发；
项目目前功能简单介绍；
总结；

3. 项目部署及运行

3.1 下载、部署

下载工程，参考上面的连接https://github.com/fansy1990/mahout1.0，并参考http://blog.csdn.net/fansy1990/article/details/46481409把它部署到Tomcat上；
（默认，在上面步骤中已经配置好了mysql数据库，数据库的配置参考src/main/resources/db.properties文件）这里直接在Tomcat上运行项目，即可初始化好mysql对应的数据表（这里只有一个，即Hadoop集群配置表），打开浏览器在左边导航栏访问Hadoop集群配置表页面，进行配置（配置自己的集群）；或直接在mysql数据库中进行配置即可。配置项包括（这里默认是使用node101机器的配置）：

mapreduce.app-submission.cross-platform=true
fs.defaultFS=hdfs://node101:8020
mapreduce.framework.name=yarn
yarn.resourcemanager.address=node101:8032
yarn.resourcemanager.scheduler.address=node101:8030
mapreduce.jobhistory.address=node101:10020

3.2 注意事项

设置Hadoop云平台系统linux的时间和运行tomcat的机器的时间一样，因为在云平台任务监控的时候使用了时间作为监控停止的信号。否则，监控模块将会有问题。
此项目中并没有开发任何MR程序，所以不需要拷贝源码到Hadoop的lib目录（如果在进行二次开发时，开发了相关的MR，则需要拷贝）；
项目部署好后，访问项目url，即可看到下面的界面：

4. 实现原理

项目组织架构：

4.1 页面框架

页面采用html+jQuery+easyUI开发，整个页面使用easyUI的layout标签，左边导航栏使用easyUI的tree标签，其数据使用json格式存储在src\main\webapp\tree_data.json文件中。
针对某个页面，其json配置如下：

{
“id”:152,
“text”:”fkmeans+”,
“attributes”:{
“folder”:”0”,
“url”:”clustering/fuzzykmeans.jsp”
}
}

这样在点击左边导航栏fkmeans+导航时，即可在右边弹出clustering/fuzzykmeans.jsp页面。其js代码如下：

$('#navid').tree({
        onClick: function(node){
//          alert(node.text+","+node.url);  // alert node text property when clicked
            console.info("click:"+node.text);
            if(node.attributes.folder=='1'){
                return ;
            }
            console.info("open url:"+node.attributes.url)   
            var url;
            if (node.attributes.url) {
                url = node.attributes.url;
            } else {
                url = '404.jsp';
            }
            console.info("open "+url);
            layout_center_addTabFun({
                title : node.text,
                closable : true,
                iconCls : node.iconCls,
                href : url
            });
        }
    });

其中 layout_center_addTabFun函数如下：

function layout_center_addTabFun(opts) {
var t = $(‘#layout_center_tabs’);
if (t.tabs(‘exists’, opts.title)) {
t.tabs(‘select’, opts.title);
} else {
t.tabs(‘add’, opts);
}
console.info(“打开页面：”+opts.title);
}

这个函数主要是判断右边窗口是否有名字为给定title的页面，如果没有，则打开这个页面。
js全部代码如下：

其中basic.js是首页的js文件，包含一些公共的js函数等；hconstants.js主要是针对Hadoop配置表进行的操作；jquery*.js对应的两个文件为jQuery的必须文件；mr*.js对应则是MR不同类别算法对应的js处理文件；preprocess.js为数据构造、数据查看的js处理；

4.2 请求提交逻辑

请求提交主要包括：MR算法任务提交，非MR算法任务提交，其他请求提交。这里都采用统一的提交逻辑，如下：

4.2.1 页面提交

这里所有页面提交都直接使用easyUI的< a > 标签，同时在js里面绑定其提交的点击触发函数。在函数里面需要首先获取页面参考（如果是MR监控任务，则需要先判断是否已经有监控页面，需要提示关闭当前监控页面），接着弹出框提示正在执行，最后统一提交到公共函数callByAJax中。这里列举三种提交的典型js代码：
1. 提交MR任务个数固定的MR任务

//evaluateFactorization---
    $('#evaluateFactorization_submit').bind('click', function(){
        // 检查是否有“MR监控页面”，如果有，则退出，并提示关闭
        if(exitsMRmonitor()){
            return ;
        }   
        var input=$('#evaluateFactorization_input').val();
        var output=$('#evaluateFactorization_output').val();
        var userFeatures=$('#evaluateFactorization_userFeatures').val();
        var itemFeatures=$('#evaluateFactorization_itemFeatures').val();
        // 弹出进度框
        popupProgressbar('推荐MR','evaluateFactorization任务提交中...',1000);
        // ajax 异步提交任务  
        callByAJax('cloud/cloud_submitJob.action',{algorithm:"EvaluateFactorizationRunnable",jobnums:'1',       arg1:input,arg2:output,arg3:userFeatures,arg4:itemFeatures});       
    });
    // ------evaluateFactorization

2 提交MR个数不固定的MR任务

// kmeans---
    $('#kmeans_submit').bind('click', function(){
        // 检查是否有“MR监控页面”，如果有，则退出，并提示关闭
        if(exitsMRmonitor()){
            return ;
        }   
        var input=$('#kmeans_input').val();//
        var output=$('#kmeans_output').val();//
        var clusters=$('#kmeans_clusters').val();//
        var k=$('#kmeans_k').val();
        var convergenceDelta=$('#kmeans_convergenceDelta').val();
        var maxIter=$('#kmeans_maxIter').val();
        var clustering=$('#kmeans_clustering').combobox("getValue");
        var distanceMeasure=$('#kmeans_distanceMeasure').combobox("getValue");
        var jobnums_=parseInt(k); // 一共的MR个数
        if("true"==clustering){
            jobnums_=jobnums_+1;
        }
        jobnums_=jobnums_+"";
        // 弹出进度框
        popupProgressbar('聚类MR','kmeans任务提交中...',1000);
        // ajax 异步提交任务
        callByAJax('cloud/cloud_submitIterMR.action',{algorithm:"KMeansDriverRunnable",jobnums:jobnums_,
            arg1:input,arg2:output,arg3:clusters,arg4:k,
    arg5:convergenceDelta,arg6:maxIter,arg7:clustering,arg8:distanceMeasure});
    });
    // ------kmeans

这里把不定MR个数的任务和定MR个数的任务区分开来了，其实是可以不用区分的，因为在返回结果都是一个Map，根据map结果来进行操作的。不过需要在不同的实现中设置标志位（具体参考下面的实现分析）
3 提交非MR任务

$('#upload_submit').bind('click', function(){
        var input=$('#upload_input').val();
        var output=$('#upload_output').val();
        // 弹出进度框
        popupProgressbar('数据上传','数据上传中...',1000);
        // ajax 异步提交任务
        callByAJax('cloud/cloud_submitJobNotMR.action',{algorithm:'Upload',
            arg1:input,arg2:output});
    });

这里要注意MR任务和非MR任务是需要区分的，因为非MR任务使用的是同步模式（这里同步模式不是指aJax的同步，而是指实现方式），即用户点击后，会一直弹出正在处理的提示，然后等后台处理完成，返回结果才会关闭弹窗，同时把结果直接展现在原网页。但是MR的任务会启动多线程，当多线程成功启动后，直接关闭提示框，同时打开MR任务监控页面，开启页面定时刷新任务，向后台获取任务执行情况信息。
callByAJax函数如下：

// 调用ajax异步提交
// 任务返回成功，则提示成功，否则提示失败的信息
function callByAJax(url,data_){
    $.ajax({
        url : url,
        data: data_,
        async:true,
        dataType:"json",
        context : document.body,
        success : function(data) {
            closeProgressbar();
            console.info("close the progressbar,flag:"+data.flag);
            var retMsg;
            if("true"==data.flag){
                retMsg='操作成功！';
                if(typeof data.return_show !="undefined"){// 读取文件
                    var return_id = "#"+data.return_show+"";
//                  var obj=document.getElementById(data.return_show);
                    $(return_id).html(data.return_txt);
                    console.info('defined:'+data.return_show);
                }
            }else{
                retMsg='操作失败！';
                if(typeof data.return_show !="undefined"){// 读取文件
                    var return_id = "#"+data.return_show+"";
                    $(return_id).html(data.msg);
                }
            }
            $.messager.show({
                title : '提示',
                msg : retMsg
            });
            if("true"==data.flag&&"true"==data.monitor){// 添加监控页面
                // 使用单独Tab的方式
                layout_center_addTabFun({
                    title : 'MR算法监控',
                    closable : true,
                    href : 'monitor/monitor.jsp'
                });
            }
        }
    });
}

4.2.2 MR实现

所有的MR任务提交到Action后，都会启动一个线程来专门运行MR任务，这样就可以直接返回前台页面，提示任务已经成功提交。
Action中对应的代码如下：

/**
     * 提交变jobnum的任务，暂未添加
     * 
     */
    public void submitIterMR(){
        Map map = new HashMap();
        try {
            //提交一个Hadoop MR任务的基本流程
            // 1. 设置提交时间阈值,并设置这组job的个数
            //使用当前时间即可,当前时间往前10s，以防服务器和云平台时间相差
                    HUtils.setJobStartTime(System.currentTimeMillis()-10000);// 
            // 由于不知道循环多少次完成，所以这里设置为最大值，
            // 当所有MR完成的时候，在监控代码处重新设置JOBNUM；
            HUtils.setALLJOBSFINISHED(false);
            HUtils.JOBNUM=Integer.parseInt(jobnums);
            // 2. 使用Thread的方式启动一组MR任务
            // 2.1 生成Runnable接口
            RunnableWithArgs runJob = (RunnableWithArgs) Utils.getClassByName(
                    Utils.THREADPACKAGES+algorithm);
            // 2.2 设置参数
            runJob.setArgs(new String[]{arg1,arg2,arg3,arg4,arg5,arg6,arg7,arg8,arg9,arg10,arg11});
            // 2.3 启动Thread
            new Thread(runJob).start();
            // 3. 启动成功后，直接返回到监控，同时监控定时向后台获取数据，并在前台展示；
            map.put("flag", "true");
            map.put("monitor", "true");
        } catch (Exception e) {
            e.printStackTrace();
            map.put("flag", "false");
            map.put("monitor", "false");
            map.put("msg", "任务启动失败！");
        }
        Utils.write2PrintWriter(JSON.toJSONString(map));
    }

这里采用统一接口把所有的提交都整合到一个函数中，算法参数采用匿名的方式，不管前台传送了多少个，都用所有的参数来接收。然后使用Java反射来生成实际执行任务的类，并启动多线程。最后返回的map数据根据需要需要设置监控的flag为true（和callByAJax函数中的标识对应）。

所有MR任务都必须实现下面的接口：

/**
 * 带有参数的Runnable接口
 * @author fansy
 * @date 2015-8-4
 */
public interface RunnableWithArgs extends Runnable {
    public abstract void setArgs(String[] args);
}

该接口有两点需要注意，其一，它继承了Runnable接口；其二，它自定义了一个setArgs函数；
下面来看一个实现，以kmeans算法的调用为例：

/**
 * @author fansy
 * @date 2015-8-4
 */
public class KMeansDriverRunnable implements RunnableWithArgs {
    private String input;
    private String output;
    private String clusters;
    private String k;
    private String convergenceDelta;
    private String maxIter;
    private String clustering;
    private String  distanceMeasure;
    @Override
    public void run() {
        String[] args=null;
        if("true".equals(clustering)){
            args=new String[17];
            args[16]="-cl";
        }else{
            args= new String[16];
        }
        args[0]="-i";
        args[1]=input;
        args[2]="-o";
        args[3]=output;
        args[4]="-c";
        args[5]=clusters;
        args[6]="-k";
        args[7]=k;
        args[8]="-cd";
        args[9]=convergenceDelta;
        args[10]="-x";
        args[11]=maxIter;
        args[12]="-dm";
        args[13]=distanceMeasure;
        args[14]="--tempDir";
        args[15]="temp";
        Utils.printStringArr(args);
        try {
            HUtils.delete(output);
            HUtils.delete("temp");
            HUtils.delete(clusters);
            int ret = ToolRunner.run(HUtils.getConf()   ,new KMeansDriver() , args);
            if(ret==0){// 所有任务运行完成
                HUtils.setALLJOBSFINISHED(true);
            }
        } catch (Exception e) {
            e.printStackTrace();
            // 任务中，报错，需要在任务监控界面体现出来
            HUtils.setRUNNINGJOBERROR(true);
            Utils.simpleLog("KMeansDriver任务错误！");
        }
    }
    @Override
    public void setArgs(String[] args) {
        this.input=args[0];
        this.output=args[1];
        this.clusters=args[2];
        this.k=args[3];
        this.convergenceDelta=args[4];
        this.maxIter=args[5];
        this.clustering=args[6];
        this.distanceMeasure=args[7];
    }
}

首先，这里需要实现setArgs函数，这个函数就是把匿名的算法参数全部实名化（实际上，这里可以不用这一步操作的，但是为了代码的可读性，还是建议这样做）。接着，在run函数中，根据传进来的算法参数构造MR算法需要使用的算法参数，然后直接提交MR任务即可。
这里需要注意：
1. 当任务运行出错时需要设置标志位，方便在任务监控时，前台向后台获取任务状态信息时，提示错误；
2. 固定个数的MR任务和非固定个数的MR任务的不同点是当非固定个数的MR提前运行完成（比如kmeans算法如果设置了循环次数为10，那么假如当循环次数达到了8次时，其阈值满足条件，退出了循环），那么就要实时更改MR任务的次数（非固定个数MR任务最开始设置任务全部个数是按照最大值来设置的），并设置相关标识，即不用再进行监控。

4.2.3 非MR实现

与MR实现类似，非MR实现的Action函数如下：

/**
     * 提交非MR的任务
     * 算法具体参数意思对照jsp页面理解，每个实体类会把arg1~arg11 转换为实际的意思
     * @throws ClassNotFoundException 
     * @throws IllegalAccessException 
     * @throws InstantiationException 
     */
    public void submitJobNotMR() throws InstantiationException, IllegalAccessException, ClassNotFoundException{
        Map map = new HashMap();
        INotMRJob runJob = (INotMRJob) Utils.getClassByName(
                Utils.THREADNOTPACKAGES+algorithm);
        // 2.2 设置参数
        runJob.setArgs(new String[]{arg1,arg2,arg3,arg4,arg5,arg6,arg7,arg8,arg9,arg10,arg11});
        map= runJob.runJob();
        Utils.write2PrintWriter(JSON.toJSONString(map));
        return ;
    }

所有非MR任务都要实现INotMRJob接口，该接口定义如下：

/**
 * 提交非MR任务的基类
 * @author fansy
 * @date 2015年8月5日
 */
public interface INotMRJob {
    public void setArgs(String[] args);
    public Map runJob();
}

两个函数分别对应RunnableWithArgs的两个函数。
一个读取HDFS文件的具体实现如下：

/**
 * 读取HDFS txt文件
 * @author fansy
 * @date 2015年8月5日
 */
public class ReadTxt implements INotMRJob {
    private String input;
    private String lines;
    @Override
    public void setArgs(String[] args) {
        this.input=args[0];
        this.lines=args[1];
    }
    @Override
    public Map runJob() {
        Map map = new HashMap();
        String txt =null;
        map.put("return_show", "readtxt_return");
        try{
            txt = HUtils.readTxt(input, lines, "
");
            txt ="文件的内容是:
"+txt;
            map.put("flag", "true");    
            map.put("return_txt", txt);
        }catch(Exception e){
            e.printStackTrace();
            map.put("flag", "false");
            map.put("monitor", "false");
            map.put("msg", input+"读取失败！");
        }
        return map;
    }
}

4.2.4 结果返回

非MR任务结果返回直接在原网页展示，在callByAJax中判断相应的标志位如果不为空，那么就是需要展示在原网页的，原网页中必须有相应的组件来显示，比如下面的网页代码：

<div id="upload_return" style="padding-left: 30px;font-size: 20px;padding-top:10px;">div>

MR的任务则会开启监控，在监控页面展现任务的执行情况。

5. 二次开发

二次开发实际就是在此版本的基础上添加自己的功能而已。一共包含下面几个步骤：
1. 编写测试函数
比如要添加一个fuzzykmeans的算法，那么就在src/test/java里面编写测试函数，如下：

编写测试函数的主要目的是，研究算法的参数以及输入数据的格式等。
2. 添加json导航栏数据
在tree_data.json中添加对应的算法，如下：

3. 编写页面
参考1.中的所有算法需要参数来编写jsp页面，如下图：

4. 编写页面处理js
根据jsp页面中的按钮，来编写按钮的触发事件，如下：

5. 实现请求提交接口实现
编写请求提交接口的实现分为两种，如果是MR任务则实现RunnableWithArgs接口，如果是非MR任务则实现INotMRJob接口即可。如下图所示：

6. 运行项目并测试
打开浏览器，访问刚开发的功能，点击页面中的按钮进行测试，如下：

6. 项目功能介绍

Hadoop集群配置连接查看、修改

在这里可以进行集群参数的配置，主要是连接Hadoop集群的参数；
2. 数据构造和查看
文件上传界面如下：

文件上传主要包括两个功能，其一就是把本地文件上传到HDFS文件；其二就是针对各个算法的数据初始化，这里的初始化基本都是把本地文件（这些文件在src/main/resources/data中已经存在）上传到HDFS指定目录，这里关于目录构造可以参考Upload.java文件：

/**
* 数据上传
* 统一命名：
上传本地文件：WEB-INF/classes/data//.
上传HDFS文件：/user/root///input.
* @author fansy
* @date 2015年8月5日
*/

其他的基本是数据查看之类的，最后一个分类数据生成，是针对输入数据需要是序列化的数据，所以这里直接生成序列化数据在HDFS指定的目录即可。
3. 相关Mahout算法
相关MR算法中，页面都有默认的参数，比如：

这里的输入数据路径是根据前面Upload里面生成的路径是一致的，有些MR算法需要先运行其他MR算法，然后才能运行，这时其输入路径就是上一个MR算法对应的输出了。

7. 总结

Mahout MR算法调用其实并不难，难在了解算法的输入数据格式、算法的参数设置等；
本篇在 MR调用上面其实并没有很多内容，较多的是js的处理以及ssh框架的应用；
在MR的监控上面实现的思路也是可以借鉴的；
可以git该项目，然后自己编程实现某个算法的全部过程，这样学习起来乐趣更多（建议实现TrainLogistic相关）；
Mahout MR算法已经不再更新，建议可以在Hadoop MR的基础上学习Spark。

分享，成长，快乐

脚踏实地，专注

转载请注明blog地址：http://blog.csdn.net/fansy1990

.NET依赖注入IOC你了解吗？
IOC在WebAPI中是经常使用的，但是在一些WPF项目并不是经常使用或者被人熟知的，我把相关依赖注入的内容又做了一次学习和整理什么是依赖注入？依赖注入是一种设计模式和软件设计原则，用于实现控制反转。它的核心思想是：将对象所依赖的其他对象的创建和管理职责从对象内部转移到外部容器或框架，从而降低代码的耦合度，提高可测试性、可维护性和灵活性。依赖注入的主要优点降低耦合度（Decoupling）：○组件
react（基础篇）盛码笔记 react.js javascript 前端
React由Meta公司研发，用于构建Web和原生交互界面的库。React官方中文文档查看JSX（一）React组件用户界面的一部分，通俗的来讲，最小的元素组成的单元，可以实现部分逻辑与功能房子的门就可以看成一个组件，由木板和木方组成，有一定功能和作用，多个组件组合就可以形成房子了。组件之间可以相互嵌套，重复使用React组件React中，组件就是一个首字母大写的函数，内部存放组件的逻辑和视图UI
从 C# 到 Python：项目实战第五天的飞跃 AI、少年郎数据库 c#开发语言
在前面三天的学习中，我们已经掌握了Python的基础语法、数据结构以及一些核心库的使用。今天，我们将通过三个实战项目，深入对比C#和Python在命令行工具开发、Web应用开发以及数据处理方面的差异，感受Python在实际项目中的强大魅力。一、命令行工具开发：文件批量处理命令行工具是开发者日常工作中经常用到的工具，无论是文件处理、数据转换还是系统管理，都离不开命令行工具的身影。下面我们就来对比一下
HDFS文件系统
HDFS文件系统是hadoop生态系统的核心，主要用于分布式文件存储，它具备高可用，流式读取，文件结构简单，跨平台的特点，它的集群采用的是主从结构，分为命名节点和数据节点，命名节点主要用于元数据管理（例如对目录，文件的创建，数据块与数据节点的关系维护管理）及数据节点管理（例如数据节点之间数据的复制，节点状态的维护，节点间数据的均衡），该文件系统最基本的存储单位是block即数据块，默认大小是64M
精通日志管理：掌握SLF4J与Logback的最佳实践杨小扩 Spring Boot 从入门到精通 logback spring spring boot java
摘要:在前面的章节中，我们已经构建了能够灵活配置的WebAPI。然而，一个应用在运行时，其内部发生了什么？收到了哪些请求？执行了哪些业务逻辑？出现了什么错误？要回答这些问题，我们必须依赖日志。本章，我们将深入探讨SpringBoot中默认且强大的日志体系：SLF4J作为日志门面，Logback作为日志实现。我们将学会如何优雅地在代码中打印日志、如何通过配置文件控制日志的级别和输出格式，以及如何将日
Vite：下一代前端构建工具的革命布兰妮甜 vite javascript 前端构建工具
Hi，我是布兰妮甜！在现代前端开发领域，构建工具的选择对开发体验和项目效率有着决定性影响。从早期的Grunt、Gulp到Webpack、Rollup，前端构建工具不断演进。而Vite的出现，则彻底改变了传统构建工具的工作模式，为开发者带来了前所未有的开发体验。本文将深入探讨Vite的设计哲学、核心特性、工作原理以及实际应用场景。文章目录一、什么是Vite？二、Vite的核心设计理念2.1利用浏览器
Flink-Hadoop实战项目 Dylan_muc hadoop hdfs flink
项目说明文档1.项目概述1.1项目简介本项目是一个基于ApacheFlink的大数据流处理平台，专门用于处理铁路系统的票务和车次信息数据。系统包含两个核心流处理作业：文件处理作业和数据合并作业，采用定时调度机制，支持Kerberos安全认证，实现从文件读取到数据仓库存储的完整数据处理链路。1.2技术栈流处理引擎:ApacheFlink1.18.1存储系统:HDFS(Hadoop分布式文件系统)数据
google-web浏览器域名和公网ip下服务无法访问局域网ip服务风一样的男子& tcp/ip 前端网络
因为google的安全策略导致的防止非安全上下文向更多专用IP地址发出子资源请求说白了就是防止公网上的资源直接向局域网ip发起请求，火狐目前可以这么干如果谷歌也想解开这个限制，那么你需要简单配置一下：chrome://flags/#block-insecure-private-network-requests在谷歌浏览器里打开这个代码将Default改为Disabled然后Relaunch即可
大数据技术是解决什么问题的？ @佳瑞大数据
基础知识1TB（太字节）=1024GB1PB（拍字节）=1024TB大数据核心框架HadoopHadoop作为大数据技术生态的核心框架，主要解决了海量数据（TB/PB级）的存储、处理和分析难题，尤其是在传统数据库（如MySQL）和单机计算无法应对的场景下，提供了低成本、高可靠、可扩展的解决方案。其核心解决的问题可归纳为以下几点：海量数据的存储问题传统痛点：单机存储容量有限（如单服务器硬盘通常在TB
Linux机器上Selenium+Python3+Chrome使用driver.get()只能获取到标签而没有内容的解决方法
代码：#!/usr/bin/python3#coding=utf8fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionschrome_options=Options()chrome_options.add_argument('--headless')chrome_options.add_argume
【web 自动化】-6- 数据驱动DDT 皮革院长干测开ｗｅｂ自动化前端自动化运维
一、参数化数据驱动测试1.核心概念：“数据驱动测试”解决什么问题？场景：测试“后台登录”时，用例流程固定（输入账号→密码→登录→断言），但需要测不同数据：正确账号密码（正例）错误密码、空账号（反例）传统做法：写多个用例，重复流程代码，只改数据→冗余、难维护。数据驱动测试：用一套流程代码+多组测试数据，让用例自动遍历数据执行→高效、覆盖全。2.pytest实现参数化的核心：@pytest.mark.
【Java代码审计 | 第五篇】XSS漏洞成因+实战案例秋说 Java代码审计 java xss
未经许可，不得转载。文章目录XSS漏洞成因1、直接输出用户输入2、在JSP中使用EL表达式输出用户输入3、在Thymeleaf模板中输出用户输入4、在JavaScript中嵌入用户输入实战案例案例1案例2案例3XSSXSS（跨站脚本攻击，Cross-SiteScripting）是一种常见的Web安全漏洞，攻击者通过在网页中注入恶意脚本，使得这些脚本在用户的浏览器中执行。XSS攻击通常分为以下三种类
Java炼金术：从代码到加密货币——用Java铸造数字黄金的黑科技墨夶 Java学习资料4 java 科技开发语言
一、智能合约：比“契约精神”更严谨的代码1.1用Java写ERC-20代币（以太坊上的数字黄金）//ERC-20代币合约实现（需配合Web3j框架）publicclassMyERC20Token{privatefinalStringname="JavaCoin";privatefinalStringsymbol
Selenium 知识点详解：从基础操作到代码实战壮志凌云不假 selenium python 测试工具
在自动化测试领域，Selenium是一款备受瞩目的工具。一、Selenium简介Selenium是一个用于Web应用程序测试的工具，它支持多种浏览器和编程语言，能模拟用户在浏览器上的各种操作，如点击、输入文本等，从而实现对Web应用的自动化测试，帮助开发者快速发现潜在问题，提高开发效率。二、环境配置要使用Selenium，需先进行环境配置。以Python为例，首先需安装Selenium库，可通过p
Selenium自动化测试实战指南：原理、工具与应用 Compass宁
本文还有配套的精品资源，点击获取简介：Selenium是一个用于Web应用程序自动化测试的开源工具，它通过提供API支持多种编程语言编写脚本，实现浏览器的自动化操作。本实例将详细介绍如何使用Selenium进行自动化测试，包括浏览器驱动的使用方法。学习Selenium可以提高软件测试效率，减少错误，并通过各种实例加深对自动化测试工具的理解。实例包括了如何安装、配置Selenium库和浏览器驱动，以
自动化测试秘籍：Selenium Python API实战指南 May Wei Selenium Python API 自动化测试元素交互弹窗处理
背景简介Selenium是一个用于Web应用程序测试的工具，它允许开发者模拟用户与浏览器的交互。在现代软件开发中，自动化测试是确保应用质量和效率的关键环节。本文将基于Selenium的PythonAPI，探讨如何高效地进行网页元素交互和自动化测试。标题1：操作下拉菜单和列表SeleniumWebDriver提供了一个名为Select的特殊类，用于与网页上的列表和下拉菜单进行交互。Select类提供
SpringDoc 基本使用指南墨鸦_Cormorant #Spring全家桶 spring springdoc
SpringDoc是基于SpringBoot的现代化API文档生成工具，通过自动化扫描代码和注解，生成符合OpenAPI3.0+规范的交互式文档，并集成SwaggerUI提供可视化测试界面。以下是其核心详解：核心特性与优势开箱即用仅需添加依赖，无需复杂配置即可自动生成文档，支持SpringWebMvc、WebFlux、SpringSecurity及JakartaEE。注解驱动使用JSR-303规范
Selenium 处理表单、弹窗与文件上传：从基础到实战二向箔reverse selenium 爬虫自动化
在Web自动化领域，表单交互、弹窗处理和文件上传是最常见也最容易踩坑的场景。想象一下：你编写的脚本明明定位到了输入框，却无法输入文字；点击按钮后弹出的对话框让脚本瞬间“卡壳”；好不容易找到文件上传按钮，却发现Selenium无法直接操作系统文件选择框……这些问题往往让新手头疼不已。本文将系统讲解Selenium在这三类场景中的解决方案，结合实战案例帮你突破瓶颈。一、表单处理：搞定输入、选择与提交网
Vue3 + WebSocket 穆罕周 websocket 网络协议网络
Vue3与WebSocket结合能够很好地满足实时通讯的需求。通过合理设计和管理WebSocket连接的生命周期，以及实现必要的重连逻辑和心跳检测机制，可以构建出响应迅速且稳定的实时应用。WebSocketWebSocket允许服务端主动向客户端发送数据，无需客户端发起请求，从而实现了低延迟、高效率的数据交换。它通过HTTP升级协议握手来建立持久性的连接，并使用帧（frame）的形式传输数据。Vu
VUE如何设置语音穆罕周 vue.js 前端 javascript
在Vue项目中设置语音功能可以通过1、使用WebSpeechAPI和2、集成第三方语音合成库来实现。WebSpeechAPI是一种浏览器内置的API，它提供了语音识别和语音合成功能，而第三方语音合成库则提供了更加丰富和灵活的功能。一、使用WebSpeechAPIWebSpeechAPI是一种原生浏览器API，它包括了语音识别和语音合成两部分。以下是如何在Vue项目中使用WebSpeechAPI设置
webkitSpeechRecognitionHTML5语音识别文字（直接运行） AIGC创想家 html5 语音识别前端
前端想要实现语音转文字，其实不需要任何云服务，浏览器自带的api就能搞定。下面是已经封装好的代码，复制之后可以在控制台只接运行。classSpeechRecognitionManager{??tempTranscript=''??isRecording=false;??timeoutid=0;??exitKeywors=['stop','exit','quit','退出','停止识别','说完了'
【Web安全】逻辑漏洞之支付漏洞：原理、场景与防御介一笔记 #Web安全基础 web安全安全支付漏洞逻辑漏洞安全性测试安全威胁分析
文章目录前言一、漏洞本质二、攻击原理正常支付流程漏洞触发流程三、抓包的时机选择：生成订单时四、风险场景1.隐藏商品购买（开发人员预留的测试商品）2.付费功能免费使用（添加付费参数：JS中查询、先买个会员抓包查看）3.修改订单类型（0改成-1、1、2、3）4.修改通用参数（自动计算最终折扣）五、检测方式1.黑盒测试：模拟攻击流程2.白盒审计：代码层校验逻辑排查六、防御方案1.严格校验关键参数2.订单
基于Spring Boot的超市管理系统详细设计方案漫逗科技 spring boot 后端 java 毕业设计课程设计毕设
基于SpringBoot的超市管理系统详细设计方案1.系统总体设计1.1系统架构图┌─────────────────────────────────────────────────┐│客户端层││┌───────────┐┌───────────┐┌───────────┐│││Web端││移动端App││POS终端│││└───────────┘└───────────┘└──────────
Python Preview 项目教程
PythonPreview项目教程1.项目的目录结构及介绍python-preview/├──images/├──.eslintrc.json├──.gitignore├──.vscodeignore├──CHANGELOG.md├──README.md├──package.json├──tsconfig.json└──webpack.config.jsimages/:存放项目相关的图片文件。.e
【Azure 应用服务】Azure Web App 服务默认支持一些 Weak TLS Ciphers Suite，是否有办法自定义修改呢？云中路灯
问题描述当AzureWebApp进行安全扫描后，发现依旧支持很多弱TLS加密套件(WeakTLSCiphersSuite)，那么是否有办法来关闭这些弱的加密套件呢？在WindowsIIS环境中，可以通过修改注册表修改ForMicrosoftIIS,youshouldmakesomechangestothesystemregistry.Incorrectlyeditingtheregistrymay
Hadoop与图像识别与处理 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Hadoop与图像识别与处理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在大数据时代，数据的爆炸性增长对数据处理技术提出了新的挑战。图像数据作为一种重要的数据形式，其处理和分析在许多领域中具有重要意义，如医疗影像分析、自动驾驶、安防监控等。然而，传统的图像处理方法在面对海量图像数据时显得力不从心。Hadoop作为一种分
关于Ajax的学习笔记秋也凉 ajax 学习笔记
Ajax概念：是一门使用了js语言，可以使用于Javaweb，实现前端代码和后端代码连结的的一种异步同步（不需要等待服务器相应，就能够发送第二次请求）的一种技术，它主要用于网页内容的局部刷新，列如验证码、导航栏的刷新等。实现步骤1.导入jQuery（一种框架，Ajax是JQuery的一种方法）文件——例如：写在jsp页面的标签里面。2.在jsp页面写一个函数，然后在函数里面调用ajax方法，aja
websocket和https的区别一路向北he websocket https 网络协议
1.WebSocket是双向通信特点：全双工（Full-Duplex）：客户端和服务器可以同时主动发送消息，无需等待请求-响应周期。长连接：建立连接后保持开放，适合实时交互（如聊天、游戏）。类比：类似电话通话，双方随时可以说话。2.HTTPS是“半双工”通信（基于请求-响应）特点：客户端发起请求，服务器返回响应：每次通信需要明确的请求触发（如浏览器加载网页）。短连接（默认）：HTTP/1.1后支持
微信小程序集成 TDesign PP0897 微信小程序 tdesign 小程序
步骤1:在小程序控制台执行,一直按回车直至package.json创建好yarninit步骤2:yarnaddtdesign-miniprogram--production步骤3:将app.json中的"style":"v2"移除。步骤4:将app.json中的"renderer"修改为"webview"。
Python爬虫实战：深入无限滚动页面抓取原理与Playwright实现 Python爬虫项目 python 爬虫开发语言区块链 json
一、前言：无限滚动页面的挑战在现代Web开发中，「无限滚动（InfiniteScrolling）」早已取代了传统的分页模式。以微博热搜流、知乎首页、抖音推荐页为例，用户向下滚动时会自动加载更多内容，这种体验虽提升了交互性，却让传统爬虫面临巨大挑战：页面初始只加载一部分内容剩余内容由JavaScript在滚动事件中动态加载requests类爬虫无法感知页面行为为什么传统爬虫抓不到数据？因为页面数据不
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不