wangzhangni

Spark——安装及使用

一、spark入门与安装

1、spark概述

1）了解

Spark是一种快速、通用、可扩展的大数据分析引擎，2009年诞生于加州大学伯克利分校AMPLab，2010年开源，2013年6月成为Apache孵化项目，2014年2月成为Apache顶级项目。目前，Spark生态系统已经发展成为一个包含多个子项目的集合，其中包含SparkSQL、Spark Streaming、GraphX、MLlib等子项目，Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark部署在大量廉价硬件之上，形成集群。

2）原理

中间结果输出： 基于MapReduce的计算引擎通常会将中间结果输出到磁盘上，进行存储和容错。出于任务管道承接的，考虑，当一些查询翻译到MapReduce任务时，往往会产生多个Stage，而这些串联的Stage又依赖于底层文件系统（如HDFS）来存储每一个Stage的输出结果

Spark是MapReduce的替代方案，而且兼容HDFS、Hive，可融入Hadoop的生态系统，以弥补MapReduce的不足。

3）特点

① 快

与Hadoop的MapReduce相比，Spark基于内存的运算要快100倍以上，基于硬盘的运算也要快10倍以上。Spark实现了高效的DAG执行引擎，可以通过基于内存来高效处理数据流。

② 易用

Spark支持Java、Python和Scala的API，还支持超过80种高级算法，使用户可以快速构建不同的应用。而且Spark支持交互式的Python和Scala的shell，可以非常方便地在这些shell中使用Spark集群来验证解决问题的方法

③ 通用

Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询（Spark SQL）、实时流处理（Spark Streaming）、机器学习（Spark MLlib）和图计算（GraphX）。这些不同类型的处理都可以在同一个应用中无缝使用。Spark统一的解决方案非常具有吸引力，毕竟任何公司都想用统一的平台去处理遇到的问题，减少开发和维护的人力成本和部署平台的物力成本。

⑤ 兼容性

Spark可以非常方便地与其他的开源产品进行融合。比如，Spark可以使用Hadoop的YARN和Apache Mesos作为它的资源管理和调度器，器，并且可以处理所有Hadoop支持的数据，包括HDFS、HBase和Cassandra等。这对于已经部署Hadoop集群的用户特别重要，因为不需要做任何数据迁移就可以使用Spark的强大处理能力。Spark也可以不依赖于第三方的资源管理和调度器，它实现了Standalone作为其内置的资源管理和调度框架，这样进一步降低了Spark的使用门槛，使得所有人都可以非常容易地部署和使用Spark。此外，Spark还提供了在EC2上部署Standalone的Spark集群的工具。

2、spark集群安装

1）安装

① 机器避暑

准备两台以上Linux服务器，安装好JDK

② 下载Spark安装包

上传spark-安装包到Linux上
解压安装包到指定位置

[root@node01 ~]# cd /home/hadoop/apps/
[root@node01 apps]# rz
[root@node01 apps]# tar -zxvf spark-1.5.1-bin-hadoop2.4/

③ 配置spark

//进入conf目录并重命名并修改spark-env.sh.template文件
[root@node01 apps]# cd spark-1.5.1-bin-hadoop2.4/conf/
[root@node01 apps]# mv spark-env.sh.template spark-env.sh
[root@node01 apps]# vi spark-env.sh

//在该配置文件中添加如下配置：
export JAVA_HOME=/home/hadoop/apps/jdk1.8.0_181
export SPARK_MASTER_IP=node01
export SPARK_MASTER_PORT=7077

//重命名并修改slaves.template文件
[root@node01 apps]# mv slaves.template slaves
[root@node01 apps]# vi slaves

//在该文件中添加子节点所在的位置（Worker节点）：
node01
node02
node03

//将配置好的Spark拷贝到其他节点上
[root@node01 apps]# scp -r spark-1.5.1-bin-hadoop2.4/ node02:/home/hadoop/apps/
[root@node01 apps]# scp -r spark-1.5.1-bin-hadoop2.4/ node03:/home/hadoop/apps/

//Spark集群配置完毕，目前是1个Master，3个Work，在hadoop1上启动Spark集群
[root@node01 apps]# /home/hadoop/apps/spark-1.5.1-bin-hadoop2.4/sbin/start-all.sh
[root@node01 apps]# jps
//主节点上有Master进程，其他子节点上有Work进行，登录Spark管理界面查看集群状态（主节点）：http://hadoop1:8080/

到此为止，Spark集群安装完毕，但是有一个很大的问题，那就是Master节点存在单点故障，要解决此问题，就要借助zookeeper，并且启动至少两个Master节点来实现高可靠，配置方式比较简单
Spark集群规划：hadoop1，hadoop2是Master；hadoop3，hadoop4，hadoop5是Worker
安装配置zk集群，并启动zk集群

//停止spark所有服务，修改配置文件spark-env.sh
[root@node01 apps]# /home/hadoop/apps/spark-1.5.1-bin-hadoop2.4/sbin/stop-all.sh
[root@node01 apps]# vi spark-env.sh

//在该配置文件中删掉SPARK_MASTER_IP并添加如下配置
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=zk1,zk2,zk3 -Dspark.deploy.zookeeper.dir=/spark"

//在hadoop1上执行sbin/start-all.sh脚本，然后在hadoop2上执行sbin/start-master.sh启动第二个Master
[root@node01 apps]# /home/hadoop/apps/spark-1.5.1-bin-hadoop2.4/sbin/start-all.sh
[root@node02 apps]# /home/hadoop/apps/spark-1.5.1-bin-hadoop2.4/sbin/start-Master.sh

3、执行spark程序

1）执行第一个spark程序

/usr/local/spark-1.5.1-bin-hadoop2.4/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop1:7077 \
--executor-memory 1G \
--total-executor-cores 2 \
/usr/local/spark-1.5.1-bin-hadoop2.4/lib/spark-examples-1.5.1-hadoop2.4.0.jar \
100
//该算法是利用蒙特·卡罗算法求PI

2）启动Spark Shell

spark-shell是Spark自带的交互式Shell程序，方便用户进行交互式编程，用户可以在该命令行下用scala编写spark程序

//启动spark shell
/usr/local/spark-1.5.1-bin-hadoop2.4/bin/spark-shell \
--master spark://hadoop1:7077 \
--executor-memory 2g \
--total-executor-cores 2

//参数说明：
--master spark://hadoop1:7077 		//指定Master的地址
--executor-memory 2g 				//指定每个worker可用内存为2G
--total-executor-cores 2 			//指定整个集群使用的cup核数为2个

注意：

如果启动spark shell时没有指定master地址，但是也可以正常启动spark shell和执行spark shell中的程序，其实是启动了spark的local模式，该模式仅在本机启动一个进程，没有与集群建立联系。
Spark Shell中已经默认将SparkContext类初始化为对象sc。用户代码如果需要用到，则直接应用sc即可

在spark shell中编写WordCount程序
1.首先启动hdfs
2.向hdfs上传一个文件到hdfs://hadoop1:9000/words.txt
3.在spark shell中用scala语言编写spark程序

sc.textFile("hdfs://hadoop1:9000/words.txt").flatMap(_.split(" "))
.map((_,1)).reduceByKey(_+_).saveAsTextFile("hdfs://hadoop1:9000/out")

4.使用hdfs命令查看结果

hdfs dfs -ls hdfs://hadoop1:9000/out/p*

说明：

sc											SparkContext对象，该对象时提交spark程序的入口
textFile(hdfs://hadoop1:9000/words.txt)		hdfs中读取数据
flatMap(_.split(" "))						先map在压平
map((_,1))									将单词和1构成元组
reduceByKey(_+_)							按照key进行reduce，并将value累加
saveAsTextFile("hdfs://hadoop1:9000/out")	将结果写入到hdfs中

4、在IDEA中编写WordCount程序

spark shell仅在测试和验证我们的程序时使用的较多，在生产环境中，通常会在IDE中编制程序，然后打成jar包，然后提交到集群，最常用的是创建一个Maven项目，利用Maven来管理jar包的依赖。
1.创建一个项目
2.选择Maven项目，然后点击next
3.填写maven的GAV，然后点击next
4.填写项目名称，然后点击finish
5.创建好maven项目后，点击Enable Auto-Import
6.配置Maven的pom.xml
7.新建一个scala class，类型为Object
8.编写spark程序
9.使用Maven打包：
首先修改pom.xml中的main class
点击idea右侧的Maven Project选项
点击Lifecycle,选择clean和package，然后点击Run Maven Build
10.选择编译成功的jar包，并将该jar上传到Spark集群中的某个节点上
11.首先启动hdfs和Spark集群
启动hdfs

/usr/local/hadoop-2.6.5/sbin/start-dfs.sh

启动spark

/usr/local/spark-2.1.0-bin-hadoop2.6/sbin/start-all.sh

12.使用spark-submit命令提交Spark应用（注意参数的顺序）

/usr/local/spark-2.1.0-bin-hadoop2.6/bin/spark-submit \
--class cn.itcast.spark.WordCount \
--master spark://hadoop1:7077 \
--executor-memory 2G \
--total-executor-cores 4 \
/root/spark-mvn-1.0-SNAPSHOT.jar \
hdfs://hadoop1:9000/words.txt \
hdfs://hadoop1:9000/out

查看程序执行结果

hdfs dfs -cat hdfs://hadoop1:9000/out/part-00000

//测试IDEA编写的程序
./spark-submit
–master spark://hdp01:7077
–executor-memory 512m
–total-executor-cores 4
–calss cn.lixiaolong.ScalaWC
/root/SparkDemo-1.0-SNAPSHOT.jar
hdfs://hdp01:9000/wc/a.txt \

hdfs:?/hdp01:9000/wc/scalaWCOut

./spark-submit --master spark://hsp01:7077 --executor-memory 512m --total-executor-cores 4 --class cn.lixiaolong.JavaLambdaWC /root/SparkDemo-1.0-SNAPSHOT.jar hdfs://hdp01:9000/wc/a.txt hdfs://hdp01:9000/wc/lambdaout

二、在idea中添加指定的scala版本

在spark1.5.1版本中需要的是scala的2.10.4版本，之前在windows中安装的是scala的2.12.7，此时我们需要在idea中安装需要的sdk版本
首先在scala的官网下载scala的2.10.4版本
Scala官网：https://www.scala-lang.org/download/

下载之后解压，然后打开idea

1、新建一个项目

2、添加scala的2.10.4版本

3、下载相关插件

添加如下内容

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>cn.spark</groupId>
    <artifactId>spark-java-study</artifactId>
    <version>1.0-SNAPSHOT</version>
    <packaging>jar</packaging>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>3.8.1</version>
            <scope>test</scope>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.10</artifactId>
            <version>1.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.10</artifactId>
            <version>1.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_2.10</artifactId>
            <version>1.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_2.10</artifactId>
            <version>1.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.4.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming-kafka_2.10</artifactId>
            <version>1.5.1</version>
        </dependency>
    </dependencies>

    <build>
        <sourceDirectory>src/main/java</sourceDirectory>
        <testSourceDirectory>src/test</testSourceDirectory>

        <plugins>
            <plugin>
                <artifactId>maven-assembly-plugin</artifactId>
                <configuration>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependencies</descriptorRef>
                    </descriptorRefs>
                    <archive>
                        <manifest>
                            <mainClass></mainClass>
                        </manifest>
                    </archive>
                </configuration>
                <executions>
                    <execution>
                        <id>make-assembly</id>
                        <phase>package</phase>
                        <goals>
                            <goal>single</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>

            <plugin>
                <groupId>org.codehaus.mojo</groupId>
                <artifactId>exec-maven-plugin</artifactId>
                <version>1.2.1</version>
                <executions>
                    <execution>
                        <goals>
                            <goal>exec</goal>
                        </goals>
                    </execution>
                </executions>
                <configuration>
                    <executable>java</executable>
                    <includeProjectDependencies>true</includeProjectDependencies>
                    <includePluginDependencies>false</includePluginDependencies>
                    <classpathScope>compile</classpathScope>
                    <mainClass>cn.spark.study.core.WordCountCluster_5</mainClass>
                </configuration>
            </plugin>

            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <configuration>
                    <source>1.6</source>
                    <target>1.6</target>
                </configuration>
            </plugin>

        </plugins>

    </build>


</project>

如图：

下载

4、

图中src为灰色

QT核心模块QtCore功能详细说明，并给出测试代码（一）旭唐 qt 开发语言 QT Core
目录一.核心数据类型(CoreDatatypes)1、QString2、QByteArray3、QVariant4、QList,QVector,QMap,QHash,QSetQList:有序列表，支持重复元素。QVector高效的动态数组QMap:基于红黑树的有序映射容器QHash:基于哈希表的无序映射容器QSet:集合类，存储不重复的元素应用场景及比较5、QDate,QTime,QDateTim
【C++】string类讲解：含常用接口使用及原理模拟实现 White の algo C++初阶 c++开发语言
目录string介绍为什么要学习string类？学习方法：auto和范围forauto概念及使用注意：范围forstring类常见接口说明构造函数析构函数size()和capacity()reserve()和resize()empty()和clear()operator[]和at()begin()、end()和rbegin()、rend()push_back()append()insert()op
机器学习之条件概率贾斯汀玛尔斯 2024最新深度学习算法机器学习人工智能
1.引言概率模型在机器学习中广泛应用于数据分析、模式识别和推理任务。本文将调研几种重要的概率模型，包括EM算法、MCMC、朴素贝叶斯、贝叶斯网络、概率图模型（CRF、HMM）以及最大熵模型，介绍其基本原理、算法流程、应用场景及优势。2.EM算法（Expectation-Maximization）2.1概述EM算法是一种用于含有隐变量或缺失数据的最大似然估计方法。其核心思想是交替执行期望（E）步骤和
【C++初阶】模板初阶 White の algo C++初阶 c++算法
前言在我们之前的学习中我们要实现一个交换函数，会这么写//voidSwap(int*x,int*y)voidSwap(int&x,int&y){inttmp=x;x=y;y=tmp;}这个函数可以实现int类型的变量进行交换，但要实现其他类型，如：double、float……等，便要使用函数重载，每当出现新的类型时就需要写一个新的对应函数，太麻烦了！哪有什么方法可以只用一个函数就可以实现都种不同类
奔驰引入人形机器人，释放AI机器人产业信号强化学习曾小健人工智能
奔驰引入人形机器人，释放AI机器人产业信号原创数字少年FrankFrank的神经网络2025年03月24日00:14日本Apptronik×Mercedes-Benz联手2024年3月15日，美国人形机器人公司Apptronik宣布与德国汽车巨头梅赛德斯-奔驰（Mercedes-Benz）达成合作协议，其研发的人形机器人Apollo将正式进入奔驰的制造车间，参与零部件搬运、组装配套及质量检测等环节
EdDSA (Edwards-curve Digital Signature Algorithm)算法详解及python实现闲人编程密码学与信息安全算法 python 开发语言密码学加密解密 EDDSA
目录第一部分：EdDSA算法概述1.1什么是EdDSA？1.2EdDSA的数学原理1.3应用场景第二部分：EdDSA签名生成与验证流程2.1签名生成流程2.2签名验证流程第三部分：Python实现：EdDSA签名生成3.1安装依赖3.2EdDSA签名生成的Python实现3.3代码解释第四部分：Python实现：EdDSA签名验证4.1EdDSA签名验证的Python实现4.2代码解释第五部分：案
Qt-Q_ENUM宏和QMetaEnum类 mrbone11 Qt qt 开发语言 Q_ENUM QMetaEnum 枚举元对象系统
Q_ENUM是一个宏定义，它的作用是将一个枚举类型注册到元对象系统，从而能够通过QMetaEnum类获得一些关于enum类型的一些信息，例如获取enum类型的名称字符串，enum值和字符串互相转换，enum类型保存在QVariant中，enum值的个数，qDebug()打印enum值名称等等。用法：在一个继承于QObject的子类中声明enum，然后在定义后面使用Q_ENUM宏注册enum类型。如
CMake-环境变量介绍 mrbone11 CMake c++开发语言 cmake
文章目录作用域获取环境变量初始化查看特殊的环境变量环境变量类似普通变量，但也有些不同，如下：作用域在一个CMake进程中环境变量具有全局作用域获取环境变量使用ENV操作符获取环境变量，例如$ENV{}，通过if(DEFINEDENV{})或if(NOTDEFINEDENV{})判断是否有定义某个环境变量，注意判断语句里没有$符号，环境变量名字中的特殊符号要转义。例如：set(ProgramFile
JavaScript Window Location 宇哥资料 JavaScript javascript 前端开发语言
window.location对象用于获得当前页面的地址(URL)，并把浏览器重定向到新的页面。WindowLocationwindow.location对象在编写时可不使用window这个前缀。一些例子：一些实例:location.hostname返回web主机的域名location.pathname返回当前页面的路径和文件名location.port返回web主机的端口（80或443）loca
npm,pnpm设置淘宝镜像源以及还原为官方镜像源 L_！！！ NodeJs npm 前端 node.js
配置npm国内镜像(下载安装模块更快)#设置为淘宝镜像源npmconfigsetregistryhttps://registry.npmmirror.com#pnpm设置镜像源npmconfigsetregistryhttps://registry.npmjs.org/pnpm设置镜像源#查询当前使用的镜像源pnpmgetregistry#设置为淘宝镜像源pnpmconfigsetregistry
【产品小白】原型设计的进阶百事不可口y 产品经理的一步一步大数据产品经理人工智能产品运营学习
在原型设计中，普通和进阶之间的差距往往体现在“功能堆砌”与“认知减负”的转变上。从功能堆砌到认知减负的进阶，是产品设计从简单满足需求到真正提升用户体验的重要演变过程。一、功能堆砌与认知减负：概念对比功能堆砌普通产品经理在原型设计中，往往容易陷入“功能堆砌”的误区——不断添加新功能，试图覆盖所有可能的用户需求，但忽视了用户在实际使用中的体验和认知负担。功能堆砌虽然能短期内吸引眼球，但长远来看，会使界
《CKA/CKAD应试指南/从docker到kubernetes 完全攻略》学习笔记第3章部署kubernets集群 Aphelios· docker kubernetes 学习
目录3.1了解kubernetes3.2安装kubernetes3.2.1实验拓扑图及环境及准备设置3.2.3安装master3.2.4配置work加入集群3.2.5安装calico网络3.3安装后的设置3.3.1删除节点及重新加入3.3.2常见一些命令3.4设置metric-server监控pod及节点的负载3.5命名空间namespace3.6管理命名空间3.7安装一套v1.20.1版本的集群
【傅里叶级数原理讲解--信号的合成与分解--含LabVIEW源码】做一个码农都是奢望 course labview FFT 传感器与测试技术
测试技术-信号的合成与分解传感器与测试技术根据傅里叶变化进行距离矩形波信号Codedesign#程序下载传感器与测试技术傅里叶级数的学习一直是难点，若不对信号进行分析，很难掌握，或者只能理解概念而无法在实际信号中得到综合应用。根据傅里叶变化进行距离N年前，采用LabVIEW设计了信号的合成。主要使用了：信号采样概念，fs采样率，f信号频率，每周期的采样点N=fs/f；队列生产和消费结构来实现信号合
nodejs ,npm 发布包的一些问题 Batman_curry 开发 npm 前端 node.js
你提到的问题非常实际，也是每个开发者在发布Node.js包时需要考虑的关键点。以下是逐步解答你的所有问题，并解释依赖管理、发布过程、依赖大小、冲突解决以及如何修改和托管到GitHub的具体细节。1.关于node-gyp和依赖问题：node-gyp是否会打包进我的库？当你运行npminstall-gnode-gyp时，-g表示全局安装，它不会安装在你的项目目录中，而是安装到全局环境中（如C:\Use
关于 vue2 vue3 响应式数据，及如何清空、重置对象 xixixin_ 前端 javascript vue.js
在一个项目中，后台用的vue3，前端用的是uniappvue2，项目几乎是并行开发，然后在一个vue2数据清空的方法里直接写了一个this.form={}的代码，结果页面出现残留数据让我进一步了解了vue2响应式系统，以及vue3的proxy特性vue2响应式vue2的响应式系统是基于getter和setter工作的。在数据对象初始化的时候，vue会通过object.defineProperty将
C语言中整数在内存中的存储格式 EadDeveloper c语言开发语言编程
在C语言中，整数是一种基本的数据类型，用于存储整数值。在计算机内存中，整数被表示为二进制形式，通过一定的存储格式来表示和保存。本文将详细介绍C语言中整数在内存中的存储格式，并提供相应的源代码示例。在C语言中，整数的存储格式取决于所使用的数据类型。C语言提供了多种整数数据类型，其中包括有符号整数和无符号整数。有符号整数可以表示正数、负数和零，而无符号整数只能表示非负数（包括零）。下面将分别讨论有符号
AES加密解密CBC模式与ECB模式_aes cbc加解密全栈_XzJ python 开发语言
一、概要AES（AdvancedEncryptionStandard）是一种对称加密算法，广泛应用于信息安全领域。AES支持多种密钥长度，包括128比特、192比特和256比特。在AES加密和解密中，同一个密钥用于两个过程。下面是一个简单的Python实例，演示如何使用AES加密和解密文本。这里使用的是Python标准库中的cryptography模块，确保你已经安装该模块：pipinstallc
Deepseek文生图、文生音乐、文生视频操作步骤（详细版） SoulQuestor Deepseek 音视频人工智能 deepseek
目录一、文生图方法一1.启动浏览器双击桌面上的浏览器图标，启动浏览器程序。2.访问DeepSeek官网3.进入对话界面4.输入图片生成代码方法二1.获取绘画提示词2.复制提示词3.使用AI绘画软件生成图4.优化和保存图片二、文生音乐1.启动浏览器并访问DeepSeek官网2.进入DeepSeek对话界面3.输入音乐主题并获取描述4.获取详细描述5.访问音疯平台6.进入音乐创作界面7.输入音乐描述并
Kubernetes(K8S)学习笔记（2）：Kubernetes架构徐卷分布式与并行计算 kubernetes 学习笔记云计算
注：该笔记整理自Kubernetes官方文档中的内容，笔记中使用的观点与资源均来源于官方文档以及我个人的理解，如果涵盖其它来源的观点，会额外标明引用。1、相关概念Kubernetes集群由一个控制平面与一组用于运行容器化应用的工作机器组成，我们把这些工作机器称之为节点（Node）。工作节点托管着组成工作负载的Pod，控制平面负责管理工作节点以及Pod，以下为Kubernetes集群组件的逻辑关系图
在 Python 中执行 BASH 命令——在同一进程中潮易 python bash chrome
在Python中执行BASH命令——在同一进程中在Python中执行BASH命令，可以使用`os.system()`或`subprocess`模块。以下是两种方法的详细步骤：方法一：使用`os.system()````pythonimportos#执行一个bash命令，例如显示当前目录下的所有文件command="ls"output=os.system(command)print("Command
Python 爬虫实战：全球公司财报数据抓取与财务健康分析西攻城狮北 python 爬虫开发语言
一、引言在当今数字化时代，数据已成为企业决策、投资分析和市场研究的关键要素。公司财报数据作为企业经营状况的重要反映，对于投资者、分析师以及企业管理者来说具有极高的价值。通过获取和分析全球公司的财报数据，我们可以深入了解企业的财务健康状况，为投资决策提供有力支持。本文将详细介绍如何使用Python爬虫技术抓取全球公司财报数据，并进行财务健康分析。二、爬虫环境搭建在开始爬取数据之前，我们需要先搭建好P
基于Matlab的大气湍流光束传输特性的研究 pk_xz123456 算法深度学习 matlab 开发语言
以下是一个基于Matlab实现大气湍流光束传输特性研究的详细代码及解释。%定义参数N=512;%网格点数L0=10;%外尺度(m)l0=0.01;%内尺度(m)Cn2=1e-14;%大气折射率结构常数(m^(-2/3))k=2*pi/0.6328e-6;%波数(m^(-1))z=1000;%传输距离(m)w0=0.1;%束腰半径(m)%生成随机相位屏[phase_screen]=generate_
leetcode（1） 3.16-3.22 今天也要好好学习呀！ LeetCode 算法
3.16–3.22刷题总结-LeetCode篇两数之和据说是leetcode入门必刷题，小菜鸡在遇到这种题第一反应：暴力！！！嗯，那肯定是不行的，所以，在众多资料中，成功使用HashMap完成了这个题呢。暴力法得时间复杂度为O（n2），在要求降低时间复杂度的情况下，则必须用空间来换。HashMap：建立数字与其坐标位置之间的映射，遍历一个数，另一个预先存储。思路：target-遍历到的数字=另一个
在Springboot中集成unihttp后应用无法启动的解决办法夜郎king java 集成Unihttp报错 Java 集成Unihttp Spring集成unihttp
目录前言一、最开始的应用集成1、使用unihttp定义第三方访问接口2、在SpringBoot应用中集成unihttp3、启动时发生的问题二、问题解决1、一种解决办法2、未来的优化三、总结前言在当今的软件开发领域，SpringBoot框架以其简洁、高效、灵活的特点，成为了众多开发者构建Java应用程序的首选。它能够帮助开发者快速搭建项目，简化繁琐的配置过程，让开发变得更加高效和便捷。而UniHtt
Java基础——常用运算符、scanner类介绍咋说话呢？ java
目录一、.scanner类介绍1.使用方法2.next()方法与nextLine()方法二、常用运算符1.赋值运算符2.算术运算符3.关系运算符4.逻辑运算符5.位运算符6.条件运算符7.运算符的优先级一、.scanner类介绍Scanner类是一个用于Scanner指的是java.util包下的Scanner类，可以接收控制台输入的数据。位置：Java.util.Scanner;1.使用方法第一
正则表达式基本语法和Java中的简单使用 XF鸭 SX记录正则表达式
先来个例子publicstaticfinalPatternCHINESE_PATTERN=Pattern.compile("[\\u4e00-\\u9fa5]");/检测字符串是否包含汉字Stringtext="Hello世界";booleanhasChinese=CHINESE_PATTERN.matcher(text).find();//返回true//提取所有汉字Matchermatcher
java调用自己写的类型_Java基础——自定义类的使用跑马溜溜 java调用自己写的类型
自定义类我们可以把类分为两种：1.一种是java中已经定义好的类，如之前用过的Scanner类、Random类，这些我们直接拿过来用就可以了。2.另一种是需要我们自己去定义的类，我们可以在类中定义多个方法和属性来供我们实际的使用。什么是类呢？在java中，我们可以将现实生活中的事物通过描述来写成代码，我们可以自定义类来描述生活中的事物。比如我们可以将人进行描述，人的姓名，年龄，性别都是人的特有属性
mybatis-plus使用聚合函数查询平均分 moxiaoran5753 mybatis
mybatis-plus使用聚合函数Avg查询平均分时，返回值是BigDecimal，这一点需要注意，不能直接使用Double或float来接收返回值，下面是使用示例：publicDoublegetAvgStore(Listids){QueryWrapperqueryWrapper=newQueryWrapper>resultList=baseMapper.selectMaps(queryWrap
鸿蒙开发：正则中的match和matchAll
前言本文基于Api13关于正则表达式，其实之前也撰写过相关文章，但没有对match和matchAll做过详细的分析，虽然都是用于常见的字符串匹配，但是在使用方式上还是具有一定的区别；大家记住一点，正则表达式适用于所有的编程语言，可能有些语法和使用方式有些不同，但基本的原理是一样的。我们先看下源码：match：将字符串与正则表达式匹配，并返回一个包含该搜索结果的数组。/***Matchesastri
ArkTS函数与模块的定义与调用 harmonyos
ArkTS是一种面向全场景的声明式编程语言，它在函数与模块的定义和调用方面有着独特的特点和优势。一、ArkTS函数的定义在ArkTS中，函数是一段可以重复使用的代码块，用于执行特定的任务。函数可以接受输入参数，并返回一个值。例如：在这个例子中，add是函数名，a和b是输入参数，number是参数和返回值的类型。通过定义函数，可以将复杂的任务分解为较小的、可管理的部分，提高代码的可读性和可维护性。二
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache