Miracle8070

大数据开发环境搭建番外及总结：Redis和Anaconda环境的安装搭建

1. 写在前面

最近学习推荐系统，想做一个类似于企业上的那种推荐系统(采用的阿里天池赛的一个电商数据集，然后基于大数据的Lambda架构，实现离线和在线相结合的实时推荐系统)，这样可以熟悉一下真实环境中的推荐系统流程，但是这里面需要大数据的开发环境，所以这里的这个系列是记录自己搭建大数据开发环境的整个过程，这里面会涉及到Hadoop集群，Spark， zookeeper, HBase, Hive, Kafka等的相关安装和配置，当然后面也会整理目前学习到的关于前面这些东西的相关理论知识和最终的那个推荐系统，经过这一段时间的摸索学习，希望能对大数据开发和工业上的推荐系统流程有个宏观的初识，这一块涉及到技术上的细节偏多，所以想记录一下，方便以后查看和回练，开始

上一篇安装完了两个有关日志采集的两个工具flume和kafka，基本上已经把这一整套环境搭建完毕，今天这篇文章算是番外了，进行Redis和Anaconda环境的安装，如果想实现上面的推荐系统，仅仅有大数据环境还不行，还需要Python的环境，所以需要安装一个anaconda统一管理Python的一些运行环境，然后还想配置一个远程jupyter来使用服务器的的Python环境，还有就是希望这个远程的jupyter再能使用服务器的大数据环境，也就是通过pyspark来完成分布式的计算，之前已经用pycharm实现了这个过程，这里再基于jupyter搞一下。由于上面的实时推荐部分还需要用到Redis，这是一个高性能的key-value数据库，非常适合海量数据库的读写，常用类配合关系型数据库做高速缓存的工作，所以这个这次也要安装一下子。

开启三台，开启Hadoop集群，然后开始。

2. Redis的环境安装与搭建

安装Redis，和我们之前安装大数据的其他框架基本一致，一开始还是三步走：

tar -zxvf redis-3.0.4.tar.gz 

sudo mkdir /opt/bigdata/redis
sudo mv redis-3.0.4 /opt/bigdata/redis/redis3.0

这个东西注意不用配置环境变量，我们进入到redis3.0目录下，然后执行make命令：

cd /opt/bigdata/redis/redis3.0
make

由于我机器里面已经装了gcc编译器，所以运行命令，直接一路成功了，如果没有gcc的话，会报错，这时候需要装一下：

#能联网
yum install gcc
yum install gcc-c++

# 然后清空之前的安装结果
make distclearn

# 再重新安装
make

他们说默认的安装路径: /usr/local/bin目录，但是我的find了一下，我的不是，在redis3.0/src下面，所以后面执行命令的之后，我得切换到这个目录。然后输入命令：

cd /opt/bigdata/redis/redis3.0/src

# 启动Redis的服务器端
redis-server

# 最好设置成后台启动服务端， 这时候需要先改一下Redis的配置文件 redis.conf
sudo gedit redis.conf
# 把里面的daemonize的选项改成yes，保存退出
# 启动Redis的服务器端
cd ..    # 切换到redis3.0下面
src/redis-server redis.conf       # 后面指定配置文件即可, 如果不是redis3.0目录，需要写全路径

# 这时候可以ps看一下是否启动了
ps -ef | grep redis

可以看到我这里Redis服务器端启动：

下面开启客户端：

src/redis-cli -h master -p 6379   # 后面是主机名和端口号， 不加的话会使用默认的

测试一下：

关闭的时候，是在客户端里面shutdown或者在命令行： src/redis-cli shutdown, 这样就通过客户端关闭了服务器端。

这个东西具体还没有学，不大会玩，后期如果用到的时候再详细记录一下，这里就安装成功了，接下来再介绍一款工具叫做Redis Desktop Manager(RDM)，这个软件可以到这里下载，这是一个简单快速，跨平台的Redis桌面管理工具，这个在Windows上安装，然后管理master上的Redis数据库，我下载了一下，然后连接到了我的master的Redis，但是不太会用，先放个图，后面做推荐的时候会用到这个东西：

好了，关于Redis就整理到这里了。下面是Anaconda环境的安装搭建及配置远程jupyter，然后用jupyter连接pyspark。

这里多说一点，就是如果想给Redis加密码的话也可以，这样如果想访问Redis，就需要输入密码，但这个不针对用户，也就是只要输入这个密码就能用，而不管是谁。这个密码添加的方式是redis.conf文件里面，在里面搜索requirepass foobared，在这后面加入密码即可：

这时候，如果是用Windows上的这个软件连接的话，得事先配置好密码，看一下：

这里我只是为了玩玩，这时候如果是从命令行里面连接的话，进去之后得需要先输入 auth 密码，然后才能正常使用，否则报错NOAUTH Authentication required.

3. Anaconda环境搭建

3.1 Anaconda安装

这个相对来说就简单很多了，可以去Anaconda官网下载相应的Linux安装包，我们这里也是提前下载好了，这个直接是可执行的文件，我们找到这个安装包的位置，输入命令，这个得切换成root，否则在根目录下安装的话icss用户权限不够：

bash Anaconda3-2020.07-Linux-x86_64.sh

由于这一整套是基于大数据的，所以我这里的安装路径依然选择了/opt/bigdata/，这样，有关于整套大数据的东西就都放在一块了

这时候等待安装完毕即可。

接下来配置环境变量，三步走：

gedit /etc/profile

# 加入anaconda的安装目录下面的命令
export PATH=$PATH:/opt/bigdata/anaconda3/bin

source /etc/profile

这样，我们就能进入anaconda了。输入Python，结果发现，自带的Python2.7.5，这不行啊，于是乎，一言不合就整，把默认的改成anaconda中的Python版本，这个也很简单，就是把/usr/bin/python的软连接改成anaconda/bin下的Python即可。输入下面命令：

ln -s /opt/bigdata/anaconda3/bin/python /usr/bin/python

# 如果报错说已经有了，删除掉之前的

这时候，就是Python3.8了，下面我们进入anaconda，输入命令, source activate , 然后新建立一个虚拟环境叫做bigdata_env，然后装上jupyter notebook即可。Python版本用的3.7

source activate
conda env list
conda create -n bigdata_env python=3.7
conda activate bigdata_env

这样就齐活了。

后面就是具体的anaconda的使用了，这里不说。

3.2 远程jupyter notbook的连接

下面安装jupyter notebook，pip install jupyter notebook，装上之后，就可以使用jupyter notebook命令来进行启动，但是如果是用xshell远程连接服务器的话，使用这个命令会不好使，因为网页是在本地打开的，所以我们需要配置远程jupyter的使用。

这时候，首先生成jupyter的配置文件：

jupyter notebook --generate-config（在虚拟环境里运行）

# 生成密文
python
# 进入编程环境
from notebook.auth imoprt passwd
passwd()

# 然后输入铭文 即密码即可

生成密文如下：

把这串密文复制，然后修改jupyter notebook的配置文件： gedit /root/.jupyter/jupyter_notebook_config.py, 修改下面这几项：

 c.NotebookApp.ip='*'		#表示同一网络的主机都可访问
 c.NotebookApp.password = 'argon2:$argon2id$v=19$m=10240,t=10,p=8$6m/iOXxUHX2qNlP0c928vg$rR7yP5czsw5U/n6Qy0q2dg'  # 上面的密文
 c.NotebookApp.password_required = True
 c.NotebookApp.open_browser = False   # 本地不用打开，远程访问即可
 c.NotebookApp.port =8890 #随便指定一个端口(这个需要看是不是冲突)

这时候再输入：

这时候，从本地Windows上输入网址：http://192.168.56.101:8890，输入密码就可以远程登录了。

Linux里面如果想改变jupyter打开的根目录，不像Windows那么麻烦，在哪个目录下面运行jupyter，打开的默认就会是哪个目录，这么说应该懂了，在有代码的地方运行jupyter就可以了。当然也可以多用户连接，这个具体参考这篇文章

3.3 远程jupyter用远程的pyspark环境

这个事情之前我也记录过一次，只不过是用pycharm搞的，具体干的事情可以参考这篇文章，这里我们用jupyter再玩一遍，因为这个后面推荐系统会用到，关于本地服务器运行pyspark程序的这个，这里不再详细介绍了，看上面的连接。

我这里了依然尝试运行了一下命令行的wordcount程序，在master上直接输入pyspark，我这里竟然能直接进入pyspark，和上面博客里面不一样的是我这里的spark版本，python版本和Hadoop版本都变了。

输入

sc = SparkContext('local[2]', 'wordcount')
rdd = sc.textFile('file:///home/icss/workspace/bigdata/wordcount/1.txt').flatMap(lambda x: x.split()).map(lambda x: (x, 1)).reduceByKey(lambda a, b: a+b)

rdd.collect()

迎来了第一个报错：TypeError: an integer is required (got type bytes)，这个错误的原因是因为spark和Python的版本对应不上， spark是2.2的，而Python是3.8多，spark不支持这么高的版本，于是需要把Python降到3.7或者以下，于是我这里修改了默认的Python版本，用了我上面建立的虚拟环境bigdata_env里面的Python环境，结果这个错误搞定。关于Linux上修改默认的Python版本，就是修改/usr/bin/python的链接位置，之前链接的是anaconda3/bin/python，这里面的Python是3.8的，这时候，需要把这个软连接改成/anaconda3/envs/bigdata_env/bin/python，这个是3.7的。

# 删除原来的链接 /usr/bin目录
rm python

# 把anaconda3/envs/bigdata_env/bin/加入到环境变量，否则找不到这个python的
# 配置环境变量

# 新建立软连接
ln -s /opt/bigdata/anaconda3/envs/bigdata_env/bin/python python 

# 搞定

这时候迎来了第二个报错：ValueError: Cannot run multiple SparkContexts at once; existing SparkContext，这是因为之前已经开了一个sparkContext了，需要先停掉前面那个，输入sc.stop，然后再运行即可。

如果想在anaconda里面的bigdata_env里面运行pyspark的话，就需要把pyspark配置到环境变量里面，修改环境变量，加上这句：

export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/pyspark:$SPARK_HOME/python/lib/pyspark.zip:$SPARK_HOME/python/lib/py4j-0.10.4-src.zip:$PYTHONPATH

生效即可。这样，在本地的服务器anaconda可以使用pyspark了。

下面在/home/icss/workspace/bigdata/wordcount目录下，开启，然后Windows下输入网址进行访问：

source activate  # 进入anaconda环境
conda activate bigdata_env   # 激活bigdata_env环境
cd ~/workspace/bigdata/wordcount  # 进入目录

# 切换root身份，因为之前设置jupyter notebook配置的时候，是用root设置的，如果用普通用户打开的话，配置不管用了
su
jupyter notebook --allow-root # 打开远程notebook

新建立一个Python3文件，然后尝试导入pyspark。会报错ModuleNotFoundError: No module named 'pyspark'，上面在命令行的时候明明导入了呀。所以在前面需要指定一下spark的路径， spark里面的python路径， py4j这个。

import os
import sys   # sys.path是python的搜索模块的路径集，是一个list

os.environ['SPARK_HOME'] = '/opt/bigdata/spark/spark2.2'
sys.path.append('/opt/bigdata/spark/spark2.2/python')
sys.path.append('/opt/bigdata/spark/spark2.2/python/lib/py4j-0.10.4-src.zip')

这样就搞定了。这时候大功告成，这个要比pycharm那个简单一些的。

4. 总结一下

到这里，基本上大数据开发环境搭建就结束了，下面来简单的梳理总结一下。

搭建这一整套环境花费了我整整4天时间，除去中间开组会用了一上午，做了两次核酸的时间，其他时间基本上全在搭这套环境，这次完全从0开始，安装虚拟机，操作系统，做准备工作，然后开始搭建Hadoop集群，玩了一下单机版和集群版，接下来是Spark集群，尝试了三种运行spark的模式。然后是Zookeeper和HBase的环境搭建，搞定了一个协调应用程序工作的和一个面向列的数据库，然后是MySQL， Hive和Sqoop，安了数据库和数据仓库，然后是两个日志采集相关的Flume和kafka，最后是这篇番外，安装了Redis和anaconda，这两个是完成后面的推荐系统附加的两个环境，也正好放到一块了。有了这些基础准备，后面才可以基于一个真实的数据集玩一个电商广告的推荐，这个我是看的B站上的一个视频(但没有他的课件和环境，于是只能自己先摸索一套才能玩)，通过这个实时的推荐项目就可以把前面的所有东西给串起来。

Lambda架构是一个为离线计算和实时计算提供服务的一个架构。

离线计算的框架：

Hadoop， hdfs， MapReduce
spark core， spark SQL
hive

实时的计算框架：

spark streaming
storm
flink

消息中间件：

flume
kafka

整个推荐系统的流程可以简单概括成下面这样：

通过这个就可以看到我们之前搭建的环境在整个流程中所起的作用了。

这4天的时间，感觉过的太快了实在是，除了这套环境，啥也没做，其他任务都停滞了，但也有收获，就是通过这一整套环境的搭建，第一个是熟悉了Linux系统，之前对Linux系统是比较反感的，但是这几天下来给我的感受是Linux确实是好用且简洁，这可能是对于通过练习对命令的熟练和对目录系统的理解了。第二个是知道了这些组件之间的配合原理(宏观层面)，通过修改各种环境变量啥的，大致上对于各个组件的运行和配合有了一个理解，程度是大致上知道如果某个地方运行出错是哪里的原因，应该调什么设置了。第三个就是心里承受能力加强，这可多亏了这四天遇到的坑，各种坑，有时候也挺崩溃，但是解决了问题之后的快感是真的爽，现在导致遇到错误反而有一种小激动，这样能够多学一些东西了，虽然可能换了版本，换了系统等这些错误的解决没有用，但我觉得应该不是没有用，我回想了一下我遇到的这些坑，包括网卡，ip配置的问题(Mac与配置里面的要匹配)， SSH免密连接问题， Hive使用前元数据的初始化， mysql安装遇到的相干问题(这个会揭示Centos系统的一些默认特点，mysql的保存等），Hive启动卡住的问题(如何查看日志)等，版本不兼容等。这些坑我觉得即使在真实环境下也都用得到，至少很多东西背后的逻辑都是不变的，毕竟设计这些东西，写代码的都是人，思想虽然不一致，但肯定有相同的地方哈哈。

这4天接触了各种环境变量配置，各种连接，各个组件的配置，编写shell脚本，各种Linux命令，软件安装，建立软连接等，发现其实安装这些组件背后都有着差不多的逻辑，首先就是三步走(为了安装)，然后修改环境变量(方便找), 然后就是修改自身配置(为了和别的组件通信，这里面会配置自己的一些东西，方便别的组件找到，然后就是配置一些找到别人的东西)。目前反正我遇到这些组件都是这样的逻辑。无非就是每一步里面的操作不同罢了。然后就是一些常用的Linux命令要熟记于心：

目录文件操作：cd, cp, mv, mkdir, mkdir -p, rm -r, rm, rm -rs，建目录，复制，粘贴，重命名等
文件操作：touch(建立文件)， vi, gedit(编辑文件), cat(查看文件)
查找文件位置：find, locate
解压和压缩： tar -zxvf, tar -zcvf , unzip
查看进程： ps -ef | grep 相应的进程, top
服务相关: service 服务 start , stop
权限相关: chmod, chown
还有一些附加： ssh, scp, df -h, pwd, ls, ll, su, yum, ln, ping, ip addr, ifconfig, shutdown, reboot, wget

这些挺常用的，这4天的时间借机会摸了一下， shell脚本同时搞3台机器也体验了一下，逐渐的感觉到了Linux的魅力所在，更加有意思的事情是这4天的业余时间看完了红楼梦的解说，也感受到了红楼梦的魅力，并喜欢上了Linux和红楼梦，这两个都是来源于好奇心，但真的接触之后发现确实好，Linux好，红楼梦也好，都好都好，哈哈。

这4天在学习和生活上都体验了一波完全不一样的事情，接下来的一段时间，会做一个实时推荐系统的项目，会尝试整理关于上面各个组件的理论知识和细节，会回到推荐系统算法层面，会回到之前的轨道上，这四天算是小插曲了，撤

【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
【Bugs】Python：“ModuleNotFoundError: No module named ‘XXX‘” 系'辞工具箱 python bug anaconda
问题描述Python使用库的前提是必须已安装了相应的库，往往利用“命令行指令”实现安装，一般安装解法类似。但，还是具有延伸问题，本博客对此作记录。【1】Nomodulenamed‘seaborn’(1.1):情况1：为Anaconda安装【图1-2】.定位Anaconda路径【图3】.Anaconda路径加入Path>&
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
思考成长丁昆朋
这篇文章是加紧赶出来“应付”日更，一方面不想要再晚睡了；另一方面不想失去日更达人的称号，只能坐下来匆忙写下一点文字。既然标题是成长，先来总结一下这段时间的收获：1、整理箱子站着可以看电脑，坐着反而是一种享受，减少了坐着腰酸背痛的现象；2、使用讯飞输入法大大增加自己的输出量；3、Anaconda+“pythontutor.com"+Google算是简单入门python；4、英语的阅读文章能力、听力提
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
Redis Key的过期策略 ArchManual 分布式架构分布式 Java 后端微服务架构 redis
Redis的过期策略主要是指管理和删除那些设定了过期时间的键，以确保内存的有效使用和数据的及时清理。具体来说，Redis有三种主要的过期策略：定期删除（ScheduledDeletion）、惰性删除（LazyDeletion）和内存淘汰策略（EvictionPolicies）。1.定期删除Redis的定期删除策略（ScheduledDeletion）的步骤如下：设置定期任务：Redis会在后台线程
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
碎片化学习笔记分享剑客写作
现在生活节奏很快，学习力成为了我们拥有的最大财富。碎片化学习是最好的。首先，不要太过自信，学会虚心学习，是我们面对现实的好方法，才能够常保新鲜。平时我们要拥有什么工具呢？1.思维导图2.写在印象笔记里3.听书，消燥耳机4.教学输出5.录音笔里面最好的方式就是教学输出法，记忆里最好。当输出时我们集中精力记忆里最好。有人认为缩短睡眠时间来学习，其实最好的方式是保持最好的睡眠，记忆力会更好。剥夺睡眠，会
Rides实现分布式锁，保障数据一致性,Redisson分布式事务处理朱杰jjj 缓存分布式
分布式环境下分布式锁有三种方式：基于数据库分布式锁基于Redis分布式锁基于zk分布式锁本帖只介绍Redis分布式锁为什么需要用到分布式锁？在单机环境下一个服务中多个线程对同一个事物或数据资源进行操作时，可以通过添加加锁方式（synchronized和lock）来解决数据一致性的问题。但是如果出现多个服务的情况下，这时候我们在通过synchronized和lock的方式来加锁会出现问题，因为多个服
Cloud Native Weekly | 华为云抢先发布Redis5.0，红帽宣布收购混合云提供商 weixin_34302561 数据库 devops 大数据
1——华为云抢先发布Redis5.02——DigitalOceanK8s服务正式上线3——红帽宣布收购混合云提供商NooBaa4——微软发布多项AzureKubernetes服务更新1华为云抢先发布Redis5.012月17日，华为云在DCS2.0的基础上，快人一步，抢先推出了新的Redis5.0产品，这是一个崭新的突破。目前国内在缓存领域的发展普遍停留在Redis4.0阶段，华为云率先发布了Re
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
《随园诗话》学习笔记三百零六飞鸿雪舞
卷五凡诗之传者，都在灵性五、五斗米与诗【原文】丁丑，余觅一抄书人，或荐黄生，名之纪，号星岩者，人甚朴野。偶过其案头，得句云；“破庵僧卖临街瓦，独井人争向晚泉。”余大奇之，即饷米五斗。自此欣然大用力于诗。五言句云：“云开日脚直，雨落水纹圆。竹锐穿泥壁，蝇酣落酒尊。钓久知鱼性，樵多识树名。笔残芦并用，墨尽指同磨。＂七言云：＂小窗近水寒偏觉，古木遮天曙不知。旧生萍处泥犹绿，新落花时水亦香。旧甓恐闲都贮水
D15 论语学习笔记许小兔Angelina
悟：上级对下级的宽容：凡事成定局，就不你说了；已接近完结的事，也没必要匡正和挽回了；既然是过去的事，也没必要追究得失和责任了。对待孩子教育也是，不用“问责制”，这样容易让孩子因为害怕担责而说谎。应当循循善诱，避免再犯错才是最重要的。3.16：【原文】子曰：“射不主皮，为力不同科，古之道也。”【译文】孔子说：“射箭比赛不以射透为主，而主要看是否射得准确，因为人的力量不同，自古如此。”3.17：【原文
Conda的清理（一下少了14G） Pin_BOY 配置 TSC 服务器 linus anaconda
一般使用conda命令清理condaclean-p//删除没有用的包（推荐）condaclean-t//tar打包condaclean-y-all//删除全部的安装包及cache如果想看看到底占多大存储空间可以往下看进入Anconda目录，通过命令du-sh*查看当下目录的所占内存为什么pkgs这么大！查阅资料后发现Anaconda文件夹下有个pkgs文件夹。据我观测（没找到正式说明），里面是各种
优化Conda环境：深入掌握conda clean命令的清理艺术 2401_85842555 conda
优化Conda环境：深入掌握condaclean命令的清理艺术Conda作为Anaconda发行版中的包管理器，不仅用于安装和管理包，还提供了强大的环境管理功能。随着时间的推移，Conda环境中可能会积累大量的缓存文件，这些文件不仅占用磁盘空间，还可能影响Conda的性能。本文将详细介绍如何在Conda中使用condaclean命令来清理缓存，帮助你优化Conda环境，释放宝贵的磁盘空间。Cond
关于Redis集群同步/持久化/淘汰机制的详解尾巴尖上的阳光大数据 redis 数据库
Redis是非常常用的KV数据库,使用内存以及HashMap进行存储的特点带来了高效的查询.本文将围绕Redis的常见开发使用场景,阐述在Redis集群中各个节点是如何进行数据同步,每个节点如何进行持久化以及在长期使用中如何对数据进行更新和淘汰.如果对Redis有更多的兴趣,可以查看我的技术博客:https://dingyuqi.com下面是Redis在开发过程中常用的几种使用场景.集群Redis
主流行架构 rainbowcheng 架构架构
nexus，gitlab,svn,jenkins,sonar,docker，apollo，catteambition，axure，蓝湖，禅道,WCP；redis，kafka，es，zookeeper，dubbo，shardingjdbc，mysql，InfluxDB，Telegraf，Grafana，Nginx，xxl-job，Neo4j,NebulaGraph是一个高性能的,NOSQL图形数据库
网络工程师学习笔记（一）专业白嫖怪网络工程师学习笔记学习笔记网络
为了备战下半年的软考——网络工程师，利用每天的下班的闲暇时间看书听课，然后自己手敲整理的系列资料。希望能够对你们有所帮助第一章__计算机网络概述计算机网络的定义：将分散的具有独立运算功能的计算机系统，通过通信线路和通信设备进行连接起来的实现资源的共享。ARPAnet网络的特征：资源共享、分散控制、分组交换1946年第一台通用计算机—埃尼亚克能够相互连通进行数据交换。1960年提出巨型网络，出现了对
网上商城项目总结续猫只i java web 电子商城结构
前台1.用户登录注册邮箱验证校验用户名是否存在验证码自动登录2.导航条自定义标签库采用异步读取数据（使用gson将集合转换json数据）Redis服务器3.首页热门商品查询展示4.分类列表分页查询5.商品详情用cookie实现浏览记录6.购物车实现商品添加到购物车商品的查询，添加，修改，删除清空购物车7.提交订单添加订单（订单详情）确认订单（易宝支付）8.我的订单9.Fliter定义权限拦截（提交
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR