ayesd

《大规模WEB服务开发技术》读书笔记(I)

1、认识服务的规模

注册用户，独立用户

请求数

繁忙时流量

服务器台数

貌似应该有很多其他的指标，以前都听说过，但是从来没有认真分析过，已经上线的系统也没有对此进行过统计和分析！

2、大规模服务中的问题有以下几点：

可扩展性、负载均衡的必要性

一般来说，当一台服务器无法承担负载时，都会采用横向扩展（scale out）或者纵向扩展（scale up）。横向扩展就是通过服务器的数量来分担负载，纵向扩展是通过提高硬件的性能来处理负载。而我们知道，硬件的性能和价格不是成比例的，所以通常采用横向扩展技术！采用横向扩展也会带来问题，如请求如何分配——负载均衡，数据如何同步，网络通信延迟等。

保证冗余性

服务器多了后，故障率也会上升。要么构建稳定的系统，要么构建发生故障时能自动切换以继续运行的系统！

低成本运维的重要性

采用自动化工具。

开发人数和开发方法的变化

如何标准化开发？

考虑下应用程序实现方案？

统一编程语言？

统一库函数和框架？

统一代码规范？

使用版本管理工具管理源代码？

需要有人负责全局的推行。

团队如何管理

应对大规模数据量

数据的流向：磁盘->内存->缓存->CPU。各层的速度差异巨大。

减小数据大小？

分散到多台服务器上？

把数据读取次数降到最低？

3、系统增长战略——最小化开端、预见变化的管理和设计

服务规模小的时候，使用简单的方法效果会更好。应该考虑某种程度上的容量规划，以及在设计服务时尽量减少不必要的数据等。

4、技术团队体制

服务开发部：负责开发各种服务的团队，负责日常的应用程序改进。内部按照服务分成团队，每队3~4人。服务开发部也会跟踪自己开发的服务的性能，将主要页面的大致响应时间定量化，然后每天改进。

基础设施部：负责运维服务器和基础设施的团队，负责准备服务器、运维数据中心和负载均衡等。

5、沟通方式

工作指示基本通过口头传达

如果口头效率低下或者希望留下记录，则通过工具的组合来进行交流

博客+wiki（工作内、实施维护操作方法）

IRC

服务器管理工具

6、改变系统的流程

各团队用10分钟开个短会：共享前一天进度和当天计划。

会议中决定任务负责人，会议结束，立即开始任务。

实现过程尽量书写测试用例。

测试之后开始实现，实现完成提交版本管理。

实现完成后，请求团队内其他开发工程师进行代码审查。

审查通过后，合并到产品代码。

7、数据规模

表的大小以GB为单位，执行select col from table，如果不加索引，因为数据量差不多有千万级别，因此，该SQL会卡死！所以哪怕是调试，也需要避免这种sql语句，可能会引起过高的负载。

8、处理难点

无法在内存中处理！需要读磁盘！内存要比磁盘的I/O快10W~100W倍。

磁盘的搜索和物理结构有关，搜索时有机械物理操作，需要数毫秒，但是内存搜索与物理结构无关，只需要数微秒。

因为磁盘搜索的慢，所以操作系统做了一些加速处理：

将连续的数据放在同一处，然后读取的时候并不是逐个字节读取，而是一次读取4KB左右。（可以参考着看Linux相关基础，鸟哥私房菜里面也提到过。）这样就可以将旋转次数降到最低。

传输速度和总线速度的差异（上面说的是搜索！）。内存的传输速度大概比磁盘的快100倍。。。。。（可以使用hdparm工具查看传输速度【Timing cached reads=内存传输速度】【Timing buffered disk reads=磁盘传输速度】）。

9、可扩展性的要点——CPU负载和I/O负载

在web应用中，接受HTTP请求、查询数据库，再把数据库返回的数据加工变成HTML后发送给客户端，基本上只消耗CPU。相反，数据库服务器需要较多I/O资源。

由此，对于web应用程序服务器来说，负载均衡非常简单，只需要相同的主机做相同的工作就可以实现了，因为不需要分散数据。但是I/O负载的负载均衡就没有那么简单了，因为数据分散之后就会有数据一致性的问题。

10、处理大规模数据的三个重点——写程序的技巧

能在内存中完成多少

在最大限度减少磁盘寻道次数的基础上灵活运用内存

充分利用局部性的分布式

使用能应对数据量增加的算法

例如线性搜索->二叉树搜索

O(n)->O(log n)

有时可以利用数据压缩和搜索等技术

11、处理大规模数据之前的三大前提知识——程序开发的底层基础

操作系统的缓存

以分布式为前提应用RDBMS时必须要做的事

大规模环境中算法和数据结构怎样使用

12、在理解操作系统缓存的基础上编写应用程序——页面缓存

linux上有页面缓存(page cache)、文件缓存(file cache)、缓冲区缓存(buffer cache)机制。

虚拟内存机制：将逻辑的线性地址变换成物理的物理地址。这样就可以使进程无需考虑自己使用的内存位于什么地方，可以认为比如从0x000地址开始，这样处理就更方便。在分配内存时，以适当的大小(4KB)分配好，并传递给进程，而不是一个字节一个字节的访问。这样的内存块就称为“页面”。

页面缓存原理：操作系统能够让已分配的页面一直维持在这一状态。

进程不能访问磁盘，只能访问虚拟内存。

操作系统从磁盘中读取4KB的块，并写入到内存中，然后将该地址变换为虚拟地址后再告诉进程，最后进程再访问内存。而进程读完数据后，虽然不再需要这块内存，但是并不会释放，而是保留下来，这样其他进程访问同一块磁盘时，就可以直接使用留下来的页面，无需再访问磁盘。这就是页面缓存。

页面缓存的效果就是，一直运行的操作系统更快些。

VFS

LINUX以页面为单位缓存磁盘

LRU

内存空闲时就缓存——通过sar确认：sar -r 1(每秒输出一次当前的内存状态)，kbcached即用于缓存的容量，%memused被使用的内存，包括缓存。

增加内存降低I/O负载

13、降低I/O负载的策略

以缓存为前提的降低I/O负载的策略

如果物理内存比数据规模还大，考虑全部缓存。

与经济成本的平衡性。

扩展到多台服务器——无法全部缓存的情况

CPU负载分散只需要简单的增加

I/O分散要考虑局部性

14、利用局部性的分布式

局部性的分布式就是根据访问模式进行分散。

Partitioning——考虑局部性的分布式

Partitioning就是将一个数据库分割到多台服务器上。分割方法很多：

最简单的就是“以表为单位进行分割”，这种方式需要修改程序。

从数据的中间分割，例如按照ID的起始字母进行Partitioning。问题：当改变分割粒度时，需要将数据合并一次比较麻烦。

根据访问模式分割成“岛”——考虑局部性的分布式

比如一般用户分配到岛1，爬虫等分配到岛2

以页面缓存为基础的运维基本准则

操作系统刚启动时不要将服务器投入生产环境

性能测试要在缓存优化后进行

15、分布式MySQL应用的三大要点

灵活应用操作系统缓存

正确应用索引

以横向扩展为前提设计系统

16、灵活应用操作系统缓存

考虑所有数据的大小，尽量将数据量维持在物理内存量之下。

内存不足时增加内存

考虑表结构设计对数据大小的影响

当记录数上亿之后，即使增加8字节的列，数据量也会增加3GB

规范化虽然可以减少数据量，但是会使查询变得复杂，因此应该在速度和数据量的平衡性前提下，考虑规范化。

17、索引

B树

二叉树和B树：B树可以合理的设置节点大小，比如设置为4KB，则和上面的缓存大小相一致！

B+树

MySQL的索引采用的就是B+树：使得搜索外部设备时能够将寻道次数最小化；搜索复杂度O(n)->O(log n)

MySQL索引的不足

使用所以的有->where、order by、group by条件中指定的列

何时有效->明确的添加的索引；主键、UNIQUE约束。可以通过show index确认

MySQL索引的陷阱->想同时使用多个列上的索引，就必须使用复合索引

确认索引是否有效的方法——explain命令

type和rows:type为ALL，rows很大则索引无效，type为ref，rows比较小则索引有效

Extra列也十分重要，如果出现Using filesort或Using temporary的查询不能说是好查询

18、MySQL的的分布式

MySQL的replication功能，即常见的主从和读写分离

应用程序服务器通过负载均衡去查询slave，这样就可以把查询分散到多台服务器上了。

master/slave的特征——对参照系进行扩展，更新类不扩展

主从的结构确定了master是无法实现分布式的。

通常的应用程序，读占据了90%以上，因此master不会称为瓶颈。

需要对更新/写入类进行扩展——表分割、key-value存储

当master的表负载过高，则需要对表进行分割。通过分割来分散写入操作，如果可以分割表文件，就可以将其分散在同一台机器的多块硬盘或者分散到多台服务器上。

或者考虑不使用RDBMS，而使用key-value，如通常的点赞。

19、MySQL的横向扩展策略

数据能放入内存吗？

->yes：放入内存

->no：增加内存，无法增加内存，则用Partitioning

分割之后，将无法使用join

以Partitioning为前提的设计

如若数据库表之前耦合性非常大，则设计时不要将其分割到不同的服务器上。

避免join——利用where in

Partitioning的好处

降低负载

增加局部性

提高缓存的效果

缺点

运维变得复杂

故障率上升

实现冗余需要几台服务器

答：4台。1master+3slave。如果是1+2，假设slave坏掉，则在恢复数据的时候就必须停掉剩下那台slave！

20、特殊用途索引——处理大规模数据

超过RDBMS的处理能力时，利用批处理操作从RDBMS中提取出数据，建立索引服务器之类的东西，再让Web应用程序通过RPC等访问索引服务器。

特殊用途索引——使用调优后的数据结构

关键字链接的处理

使用巨大的正则表达式，虽然比数据库快，但是仍然非常慢

Trie+Common Prefix Search

21、理论联系实践

探寻必须的技术条件

RDBMS中不使用JOIN，这应该是“最差实践”，教科书是绝对不会说不使用JION的，但这是从实践中得来的经验！

相反，使用一些教科书上的理论解决一些相应的问题，却是十分正确的！

从计算机的角度去思考

后续是有关压缩、算法和搜索的话题

22、以紧凑、简洁的方式保存整数数据

压缩大规模数据可以降低磁盘I/O。

23、可变字节码和速度的感觉

可变字节码——整数的编码方式

对例子进行编码实现

24、算法的实用化

算法和算法的评测

数据规模和复杂化的差异

如果数据很小，则算法的复杂度也区分不出来，但随着数据规模变大，算法选择的差异性就越来越大！

算法的评测->复杂度

时间复杂度（执行时间、操作步骤数）、空间复杂度（内存使用量）

复杂度和常数项——评测很重要

常数项：算法实现中不依赖与输入大小，但却不得不执行的一类处理。

就算实现不复杂，CPU缓存是否容易生效、分支预测是否发生等计算机结构特点也会有影响，因此常数项可能会导致差距。

如同样是O(log n)复杂度的排序算法中，快速排序是最快的，因为它使得CPU缓存容易生效。

25、关键字链接

26、文章分类

27、全文搜索技术的应用范围

28、搜索系统的架构

29、搜索引擎的内部结构

30、创建全文搜索

31、企业软件vs.Web服务

应用范围上的差异

流量、增长度、可靠性、事务两者间差异较大。

Web服务的基础设施

低成本、高效率：不应当追求100%的可靠性

重视可扩展性、响应性方面的设计

Web服务的服务规格经常会发生变化

32、云vs.自行构建基础设施

云计算特点就是价格便宜，可扩展性优秀。缺点：内存有上限和低速I/O，模糊不清的负载均衡器，时常停机

自行构建基础设施：硬件配置可以灵活调整；能够灵活应对服务的要求；可以控制瓶颈。

33、层和扩展性

一台服务器能处理的流量极限

各层的可扩展性

web服务器可扩展比较容易，增加服务器即可

数据库服务器和文件服务器的扩展性相比较而言没有那么容易。

read和write相比较，read的分布式也比较容易实现。

最难的要数write的分布式

34、掌握负载进行调优

可视化的管理界面，服务器管理工具。

测量负载的指标——平均负载、内存和CPU相关信息

经验来说，平均负载的值不超过CPU的核数就没有问题。

根据用途进行调优

面向用户

面向爬虫

35、保证冗余性

应用程序服务器一般采用负载均衡实现失败转移和失败恢复，让故障服务器自动下线，故障恢复之后再上线。

数据库服务器可以采用muti-master的方式。

存储服务器采用分布式文件系统。

36、系统稳定化

留出一定余量！

系统的不稳定性

功能增加+内存泄漏：功能达不到理想的性能，导致整体负载上升，服务停止，使用的编程语言，也很难消除内存泄漏。

地雷：比如一篇文章有一万多个评论，如果没有考虑到这种情况，极有可能将评论数全部读取出来进行展示，会导致服务器性能下降甚至停机。

用户的访问模式：如链接被贴到著名网站，被大量用户访问导致系统停机。通常可以采用缓存服务器。

数据量增加

外部关联程序的增加

内存、硬盘故障

网卡故障

37、系统稳定对策

维持适当余量，可以将70%作为分界线

消灭不稳定因素：降低SQL负载、减少内存泄漏、发生异常时的自律控制等

发生异常时的自律控制如自动DoS判断；自动重启服务器；自动终止耗时查询。

38、提高硬件资源使用率

引入虚拟化技术

通过服务器管理工具在运营上发挥虚拟化的优势

虚拟化的额外开销

CPU大约2%~3%

内存性能10%

网络性能50%

I/O性能降低5%左右

39、网络的分界点

超过1Gbps（从路由来看应该是30万pps）->PC路由器的极限

对策：采用多个PC路由；购买成品路由器

超越500台主机->一个子网的极限

子网、ARP表的极限

网络架构的层次化

1、最小的为访问层

2、上面的是分发层

3、最上方为核心层或OSPF层

全球化->一个数据中心的极限

对策：采用CDN

40、应对大规模服务须知

作业队列系统——TheSchwartz等

存储的选择——RDBMS、key-value等

缓存系统——Squid等

计算集群——Hadoop等

你可能感兴趣的:(《大规模WEB服务开发技术》读书笔记(I))

JDBC客户端连接Starrocks 2.5 MARSERERER 数据库
4.0.0org.exampleTestStarrocksJdbc1.0-SNAPSHOT88UTF-8mysqlmysql-connector-java5.1.47-->8.0.28maven-assembly-pluginjar-with-dependenciestruecom.example.Testmake-assemblypackagesinglepackagecom.example;i
flask sqlalchemy 动态创建表 llc的足迹数据库 flask sqlalchemy
创建模型defget_model(suffix):classBaseModel(Base):__tablename__=f'table_{suffix}'__table_args__={'extend_existing':True}target_name=db.Column(db.String(64),nullable=False,unique=True,comment="名称")target_i
《5%的改变》读书笔记好心情看好风景
《5%的改变》是收录心理学家李松蔚老师2019年-2022年期间，通过微信公众平台征集和发布的一系列问答。读者以匿名身份留言提出他们生活中的困惑，老师给出建议，请收到建议的人一周后回信，反馈他们的生活中是否产生了变化。一共挑选了44个案例，分为自我、原生家庭、工作与理想、亲密关系、人际关系五大主题，每个主题的后面都梳理了干预的思路方法，作为“改变的工具箱”。李松蔚老师对每一位提问者都给予了认同，哪
LLAMA Factory: 简洁高效的大语言模型训练平台俞纬鉴Joshua
LLAMAFactory:简洁高效的大语言模型训练平台LLaMA-Factory易于使用的LLM微调框架（LLaMA,BLOOM,Mistral,百川，Qwen,ChatGLM）。项目地址:https://gitcode.com/gh_mirrors/ll/LLaMA-Factory项目介绍LLaMAFactory定位为一款简洁、高效的大规模语言模型训练和微调平台。其设计初衷在于让用户无需编码即可
《刻意练习》读书笔记核二10组不忘初心
二、伦敦司机的大脑如果你喜欢健身，那么你可以通过称体重、测量体脂率或者直接照镜子来观察自己的变化。但如果你想要提高自己某项脑力技能，比如学习一门外语，你能观察到大脑的变化吗？这不太容易。你只能通过一些外在的表现，比如能记住多少单词、能听懂多少听力来判断进度。现在越来越多的研究表明，大脑的结构和运行方式，都会因不同的心理训练而变化。下面我们以一个非常有名的、关于伦敦司机的研究来开始本章节：开车在伦敦
string中的length()函数哎呦，帅小伙哦 C++C++
再做一个编程题时遇到的一个问题，之前没有注意过。比如语句，booltemp=i<s.length()。明知i是小于s.length(）的，但是temp的值确实false的。这是因为length()函数的返回值是无符号的，C++在执行i<s.length()语句时会把有符号的数转成无符号的数，如果i是负数那么temp的值就会是false了。
《学会写作》读书笔记4⃣️2⃣️～重新定义处理能力郭小艳Wendy
1.识别筛选(1)学会筛选优质信息：筛选优质信息，优先回顾未看完的优质文章，不要从头到尾都看一遍(2)学会识别信息性质：为了更好地吸收(3)学会按需求来筛选：甄别素材，找到适合的、能被自己运用的2.归纳整理：根据实际情况分类，有助于高效处理相关的信息3.提炼总结(1)归纳法：从个性到共性，从特殊到一般的思考方式(2)演绎法：从共性到个性，从一般到特殊的思考方式。
C语言——插入排序万河归海428 c语言数据结构开发语言 visualstudio 排序算法算法
先将序列的第1个记录看成是一个有序的子序列，然后从第2个记录逐个进行插入，直至整个序列有序为止。#include#includevoidinsertion_sort(int*arr,intn){for(inti=1;i=0&&key
C语言——利用二分法求数组中特定元素的索引，并在函数中引入了冒泡排序，可以求无序数组中的特定元素的索引万河归海428 算法 c语言 visualstudio 数据结构冒泡二分法数组
#include#includeinterfenfa(int*p,intlen,inttarget){intleft=0;intright=len-1;inti;intj;inttmp;for(i=0;ip[j+1]){tmp=p[j];p[j]=p[j+1];p[j+1]=tmp;}}}while(lefttarget){right=mid-1;}}returnleft;}intmain(){i
代码随想录算法训练营day30 半勺鸡腿堡算法哈希算法
1.用最少数量的箭引爆气球1.1题目.-力扣（LeetCode）1.2题解classSolution{public:intfindMinArrowShots(vector>&points){sort(points.begin(),points.end(),[](vector&a,vector&b){returna[0]points[i-1][1]){//那必须得要一只箭result++;}//挨着
C语言——希尔排序万河归海428 排序算法算法数据结构 visualstudio c语言
希尔排序是对于插入排序的一种优化代码：#include#includevoidshell_sort(int*p,intlen){inti;intj;intstep;inttmp;for(step=len/2;step>0;step=step/2){for(i=step;i=0&&tmp
寻找身高相近的小朋友爱棋笑谦 2024年9月华为OD刷题集算法 java 华为od 面试
题目描述:小明今年升学到小学一年级，来到新班级后发现其他小朋友们身高参差不齐，然后就想基于各小朋友和自己的身高差对他们进行排序，请帮他实现排序。输入描述:第一行为正整数H和N，0frinedHeights=newArrayList();for(inti=0;i{intdifferent1=Math.abs(h1-mingHeight);intdifferert2=Math.abs(h2-mingH
北海的ScalersTalk第六轮新概念朗读持续力训练Day 50 20210219 北海逍遙
练习材料L18-1：Electriccurrentsinmodernart/ɪˈlɛktrɪk//ˈkʌrənts//ɪn//ˈmɒdən//ɑːt/Modernsculpturerarelysurprisesusanymore.Theideathat/ˈmɒdən//ˈskʌlpʧə//ˈreəli//səˈpraɪzɪz//ʌs//ˈɛni//mɔː.//ði//aɪˈdɪə//ðæt/mod
C++实现杨辉三角代码无疆 C++c++算法数据结构
#includeusingnamespacestd;constintmaxn=50;inta[maxn][maxn];intmain(){intn;cin>>n;for(inti=1;i<=n;i++){a[i][1]=1;a[i][i]=1;for(intj=2;j
D019+2组方舟+《吉田医生哈佛求学记》读书笔记方舟lsy
今天我阅读了《吉田医生哈佛求学记》第121页—第160页攻破棘手的数学从集中练习“一本书”下手“首先集中一本彻底练习。要学习某种新知识，要开始学习时，投入其中的第一步，如果是书本，就尽可能选择最基本的；如果是思考方法，就选择简介的‘精华部分’，并将其理解透彻”想到自己刚进入付费课程的世界时，心里觉得这些课程哪里都好，都特别想要去上，于是杂七杂八报了很多课，从没有想过自己要些什么，定位在哪里，导致自
Android之性能优化追梦的鱼儿 android 性能优化
目录1.内存优化1.1避免内存泄漏1.2使用合适的数据结构2.布局优化2.1减少布局层级2.2避免过度绘制3.网络优化3.1使用缓存3.2压缩数据4.I/O操作优化4.1异步处理4.2使用高效的I/OAPI5.动画优化5.1使用硬件加速5.2避免频繁的属性更新6.数据库优化6.1使用索引6.2批量操作7.启动时间优化7.1延迟初始化7.2使用SplashScreen8.代码优化8.1避免不必要的对
区块链:数据库技术时汝佳
图片发自App0引言对于区块链的解读，有一种观点是数据库。正好手头有本书《计算机是怎样跑起来的》（日文版重印18次，中文版也多达10次印刷），里面有一章介绍数据库，浅显易懂。1基础概念数据库是数据的基地。适合大规模数据存储的是关系型数据库（RelationalDatabase）。现在大多在用的是关系型数据库，数据被拆分到多张表（Table）中，表与表之间的关系可以被记录下来，为了在表之间建立关系，
vscode 使用git bash，路径分隔符缺少问题 huoxingwen vscode vscode
window使用bash--login-i使用bash时候，在系统自带的terminal里面进入，测试conda可以正常输出，但是在vscode里面输入conda发现有问题bash:C:\Users\marswennaconda3\Scripts:Nosuchfileordirectory实际路径应该要为C:\Users\marswen\anaconda3\Scripts少了\a，很明显\a在vs
python numpy安装步骤-NumPy 安装编程大乐趣
NumPy安装Python官网上的发行版是不包含NumPy模块的。我们可以使用以下几种方法来安装。1、使用已有的发行版本对于许多用户，尤其是在Windows上，最简单的方法是下载以下的Python发行版，它们包含了所有的关键包（包括NumPy，SciPy，matplotlib，IPython，SymPy以及Python核心自带的其它包）：Anaconda:免费Python发行版，用于进行大规模数据
Spark底层逻辑傲雪凌霜，松柏长青大数据后端 spark 大数据
ApacheSpark的底层逻辑可以从其核心概念、组件和执行流程等方面来理解。Spark提供了一个分布式数据处理框架，其底层逻辑基于批处理架构，能够在大规模集群中高效地处理数据。以下是Spark的底层逻辑的详细介绍：1.核心概念Spark的底层基于几个核心概念来实现分布式计算，包括：RDD（ResilientDistributedDataset，弹性分布式数据集）：RDD是Spark最基础的数据抽
D024+2组张大喵+《天长地久:给美君的信》读书笔记我是张大喵
《天长地久:给美君的信》阅读第3天从小我是外公外婆带大的，跟他们的感情尤为深厚，外公去世我不在跟前这是我终生的遗憾。糖尿病人晚期腿脚开始溃烂，外公算是养护的好的，但是后期脚趾也开始变成紫色，除了心疼还是心疼。外公一辈子是个特别硬朗的人，他会用手左右醒鼻子，然后哈哈仰头笑，不拘小节，他的小缺点到成了他的特色，也成全了他爽朗的性格。我大学毕业后外公也在失智的路上越走越远，他开始变得沉默寡言，但只要我回
读书笔记｜什么是贡献？云清雪
《被讨厌的勇气：自我启发之父阿德勒的哲学课》原文：这也跟接下来的讨论有关，阿德勒心理学认为“贡献”这个词非常沉重。例如，人怎样才能够获得“勇气”？阿德勒的见解是：人只有在能够感觉自己有价值的时候才可以获得勇气。是认为“自己有价值”？还是认为“自己是没有价值的存在”？如果能够认为“自己有价值”的话，那个人就能够接纳自我并建立起直面人生课题的勇气。这里的问题是“究竟怎样才能够感觉自己有价值”这一点。人
DISC打卡第二天——用正确的方式对待正确的人秀秀超乖哒
我有一个很好的朋友，他一直说这个世界上我是唯一且最懂他的人。他是典型的i特质的人，性格外向，有很多朋友，口才好，影响力大，特别具有感染力。他喜欢交朋友，爱玩，讨厌束缚，在外人看来他热情又冷漠，失去任何一个朋友都不太在意的样子。但实际上，他情感独立，不需要依赖于别人，和朋友相处很开心，朋友离开也不强求。他情感丰富而且细腻，特别自信又乐观，但是每一个决定做出又都是深思熟虑之下做的。以前与他相处的时候，
大数据分析与安全分析 Zh&&Li 网络安全运维数据分析安全数据挖掘运维数据库
大数据分析一、大数据安全威胁与需求分析1.1大数据相关概念发展大数据：是指非传统的数据处理工具的数据集大数据特征：海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等大数据的种类和来源非常多，包括结构化、半结构化和非结构化数据有关大数据的新兴网络信息技术应用不断出现，主要包括大规模数据分析处理、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和存储系统1.2大数据安全威胁分析“数
【网络安全 | 渗透工具】IIS 短文件名枚举工具—shortscan安装使用教程秋说渗透工具 web安全漏洞挖掘渗透工具
未经许可，不得转载。文章目录shortscan安装使用Shortutil工具shortscanShortScan是一种用于在MicrosoftIIS(InternetInformationServices)Web服务器上进行短文件名枚举的工具。该工具可以帮助攻击者利用IIS的文件名处理特性，通过预测性扫描枚举服务器上的文件和目录名称。背景：在早期的Windows文件系统（如FAT和NTFS）中，每
Python：统计字符串中各元素出现的次数陈小q Python 秋招笔试
统计String中每个单词出现的个数（不区分大小写）输入描述：输入一个字符串，例如：“abAv”输出描述：v:1:3b:1a:2defcountEach(strs):dic={}strs=strs.lower()lens=len(strs)i=0whilei
The thirteen day weixin_30511107
Wellbegunishanlfdone良好的开端是成功的一半.（此句是省略句，Somethingthatiswellbegunissomethingthatishalfdone.）Particemakesperfect熟能生巧Wherethereisawill,thereisaway.有志者事竟成onaroll练练获胜，势如破竹Don'tstopmenow-I'monaroll！！现在别阻止我，
Matlab 简单计算PDF和CDF 奔跑着的孩子通信概念最大似然算法
CDF（cumulativedistributionfunction）叫做累积分布函数，描述一个实数随机变量X的概率分布，是概率密度函数的积分。它的最主要作用就是观测某些数值也就是随机变量的取值在那个附近出现的概率比较大,它是一个增函数.可以有效的处理一些异常值.随机变量小于或者等于某个数值的概率P(X=b(i)&a(s)<=b(i+1)n(i)=n(i)+1;s=s+1;endendendsum
python-记录字符串种字符出现次数酸辣小太阳. python入门 python 算法
该类题目用字典明显方便，先上代码：s=input("请输入一个字符串:")num={}foriins:num[i]=s.count(i)forkey,valueinnum.items():print('{key}:{value}次'.format(key=key,value=value))运行结果：这里有几个值得关注的点：1.为字典添值前，需要先创建字典，这里num={}是动态创建，2.计数可以直
Python中字符串计数常用的方法！老男孩IT教育 python 开发语言
在Python中，字符串计数是非常基本的操作，使用率极高，可用于多种情况，更是每个Python开发工程师必须掌握的基础技能之一，那么Python中如何进行字符串计数?以下是常用方法介绍。1、使用count()方法Python中的字符串类型具有count()方法，该方法可以返回特定子字符串在字符串中出现的次数。例如，以下代码计算字符串"helloworld"中字母i的出现次数：'''s='hello
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源