寒-寒

YouTube的挑战者 JustinTV教你如何打造实时视频网站

摘要：实时的定义应该是延迟小于250ms，按照这个标准，实时的成功应用立马成了凤毛麟角。本文详细阐述Justin.TV实时系统的技术细节，解密实时视频网站的内幕。文章内容来自Highscalability对Justin.TV创始人兼副总裁Kyle Vogt的采访，由CSDN记者编译整理。

Justin.TV每月有3000万个独立访问量，在游戏视频上传领域打败了YouTube ，他们每天每分钟新增30个小时的视频，而YouTube只有23。

下面从Justin.TV的实时视频系统使用到的平台，他们的架构细节，从他们身上应该学到的东西等几个方面逐一展开。

使用到的平台

Twice —— 代理服务系统，主要用缓冲优化应用服务器负载
XFS —— 文件系统
HAProxy —— 用于TCP/HTTP负载平衡
LVS stack and Idirectord —— 高可靠性
Ruby on Rails —— 应用服务器系统
Nginx —— web服务器系统
PostgreSQL —— 数据库，用于用户和meta数据
MongoDB —— 数据库，用于内部分析
MemcachedDB —— 数据库，用于存放经常要修改的数据
Syslog-ng —— 日志服务系统
RabitMQ —— job系统
Puppet —— 创建服务
Git —— 源代码管理
Wowza —— Flash/H.264视频服务器和许多Java写的custome modules
Usher —— 播放视频流的逻辑控制服务器
S3 —— 用于存储小型镜像

Justin.TV的一些统计数据

有覆盖全美的4个数据中心
在任何时候都有2000多个同时流入的数据流
每天每分钟新增30个小时的视频
每月有3000万个独立访问量（不计同一用户多次访问）
每秒实时的网络流量在45G左右

实时视频结构详述

实时视频结构

1.使用了P2P和CDN

一般人认为，只需要不断提高带宽，把传来的数据都放入内存，不断的接收数据流就可以了，事实并非如此。实时视频要求不能打断，这就意味着你不可以超负荷的使用带宽。YouTube只需要让播放器缓冲一下，就可以用8G的带宽解决10G通道的需求，但在实时视频里，你不能缓冲，如果在信道上的流量超过了它的传输能力，哪怕只是一瞬间，那么所有的正在看的用户在那一刻都会卡。如果你在它的极限能力上再加入了一点儿负载，所有人立刻就会进入缓冲状态。

Justin.TV使用了点对点的结构来解决这个问题，当然他们也有更好的解决办法，CDN（内容分发网络）便是之一。当用户的流量负载超过Justin.TV的负载能力时，Justin.TV便很巧妙的将超标流量引入到一个CDN中去，Usher控制着这个处理逻辑，一旦接到了超标用户的负载请求，Usher便立刻将这些新用户转发到CDN中去。

2.100%可用时间和维护的矛盾

实时视频构建的系统既要保证100%的可用时间，又要保证机器可以进行维护。与一般网站不同，一般网站维护时出现的问题只有少数人会发现、关注，而实时视频网站不同，用户很快就会发现维护时带来的任何问题，并且互相传播的非常快。这就使得没有什么问题可以隐瞒用户，面对现在用户的挑剔，你必须避免维护时出问题。对一个服务器维护时，你不能主动结束用户的进程，必须等待所有在这个服务器上的用户自己结束服务才能开始，而这个过程往往非常缓慢。

3.Usher与负载均衡

Justin.TV遇到的最大的麻烦是即时拥塞，当大量的用户同时看同一个栏目的时候，便会突然产生突发网络拥塞。他们开发了一个实时的服务器和数据中心调度系统，它就是Usher。

Justin.TV的系统在突发的高峰拥塞上做了很多。他们的网络每秒可以处理大量的链入连接。用户也参与了负载均衡，这也是Justin.TV需要用户使用Justin.TV自己的播放器的原因之一。至于TCP，由于它的典型处理速度就是百kbps级的，所以也不用对TCP协议做什么修改。

相对于他们的流量，他们的视频服务器看来来有些少，原因是他们可以使用Usher把每个视频服务器的性能发挥到最好，负载均衡可以确保流量从不会超过他们的负载极限。负载大部分是在内存中，因此这个系统可以让网络的速度发挥到极限。服务器他们是一次从Rackable(SGI服务器的一个系列)买了一整套，他们做的仅仅是从所有预置的里面做了下挑选。

Usher是Justin.TV开发的一款定制化软件，用来管理负载平衡，用户认证和其他一些流播放的处理逻辑。Usher通过计算出每个流需要多少台服务器提供支持，从而分配资源，保证系统处于最优状态，这是他们的系统和别家不同之处。Usher通常会从下面几个指标计算、衡量某个流媒体所需要的服务器：

每个数据中心的负载是多少
每个服务器的负载是多少
延迟优化的角度
当前这个流可用的服务器列表
用户的国家（通过IP地址获得）
用户是否有可用的对等网（通过在路由数据库中查询IP地址获得）
请求来自于哪个数据中心

Usher使用这些指标便可以在服务净成本上来优化，把服务放在比较空闲的服务器上，或者把服务放在离用户较近的服务器上，从而给用户带来更低的延迟和更好的表现。Usher有很多个可以选择的模式从而达到很细的控制粒度。

Justin.TV系统的每个服务器都可以做边缘服务器，直接为用户输出视频流，同时每个服务器也可以做源服务器，为其他服务器传递视频流。这个特性，使得视频流的负载结构成了动态的，经常改变的一个过程。

4.服务器形成了加权树

服务器之间由视频流的拷贝而产生的联系和加权树非常相似。数据流的数量经常被系统取样、统计，如果观看某个视频流的用户数量飞速上涨，系统便将其拷贝很多份到一些其他的服务器上去。这个过程反复执行，最终就形成了一个树状的结构，最终会将网络中所有的服务器都画在里面。Justin.TV的视频流从源服务器出发，被拷贝到其他服务器，或者拷贝到用户的整个过程中，都处于内存中，没有硬盘路径的概念。

5.RTMP和HTTP

Justin.TV尽可能的使用了Flash，因为它使用RTMP协议，对每个视频流，系统都有一个独立的Session去维护它。由于使用这个协议，成本就相当高。由于ISP不支持下载流，因而无法使用多路广播和P2P技术。Justin.TV确实想过用多路广播在内部服务器之间拷贝数据流，然而由于他们的系统控制覆盖整个网络，而且内部有大量的很便宜的带宽可以使用，这样使用多路广播的技术就并没有产生多少效益。同时，由于他们的优化算法是将每个服务器上的流数都最小化，这就使得在很细的力度上做些事情会非常麻烦，甚至超过了他们能得到收益。

Justin.TV的Usher使用HTTP请求去控制某个服务器负载哪个视频流，从而控制了服务的拓扑结构。Justin.TV在流数据上使用HTTP，但存在的一个问题是它没有延迟和实时方面的性能。有些人说实时的定义就是5-30秒，然而，面对数千人做实时视频的时候这显然不行，因为他们还需要实时的讨论，交流，这意味着延迟不能高于1/4秒。

6.从AWS到自己的数据中心

起初Justin.TV使用AWS，后来迁移到Akamai（云服务供应商），最后到了自己的数据中心。

离开AWS到Akamai的原因有：1，成本；2，网速不能满足他们的需求。视频直播对带宽非常敏感，因此有一个快速的，可靠的，稳定的和低延迟的网络非常关键。使用AWS时，你不能控制这些，它是一个共享的网络，常常超负载，AWS的网速不会比300Mbps更快。他们对动态范围改动和云API很重视，然而在性能和成本问题上没有做什么。

3年前，Justin.TV计算他们每个用户的成本，CDN是$0.135，AWS是0.0074，Datacenter是$0.001如今，他们的CDN成本降低了，但他们的数据中心的成本却仍然一样。

拥有多个数据中心的关键是为了能够接近所有的主要交换节点，他们选择国内最好的位置从而使得他们为国内最多的节点提供了入口，而且节约了成本，构建了这些数据中心后，他们就直接连入了这些其他的网络，从而就省去了之前处理这些中转流量的费用，还提高了性能，他们直接连入了他们所谓的"eyeball"网络，这个网络中包含了大量的cable/DSL用户，和"content"网络连接有些类似，Justin.TV的"eyeball"连接的流量主要来自终端用户，在大多数情况下，这些都是免费的，不用任何花一分钱，要做的就是连进来就行。Justin.TV有一个主干网，用于在不同的数据中心传输视频流，因为要到一个可用节点的选拔过程是去找愿意和你做对等节点的过程，这通常是很困难的。

7.存储

视频流不是从磁盘形成，而是要存到磁盘上去。源服务器将一个传入的视频流在本地磁盘上复制一份，之后便将这个文件上传到长期存储器上，视频的每一秒都被录下来并且存档了。

存储设备和YouTube类似，就是一个磁盘库，使用XFS文件系统。这个结构用于记录通过服务器传播的广播。默认的视频流是保存7天，用户可以手动的设置，甚至你可以保存到永远（如果公司没有倒闭的话）。

8.实时转码

增加了实时的转码功能，可以将任何一种流式数据转化为传输层数据或者是代码，并且可以用新的格式将它重新编为流媒体。有一个转码集群，用来处理转换工作转，换的会话使用job系统进行管理。如果需要的转码服务超过了集群的处理能力，那所有的服务器都可以用作转码服务器。

Web结构

Web 结构

1.Justin.TV前端使用Ruby on Rails。

2.用Twice做缓存

系统个每个页面都使用了他们自己定制的Twice缓存系统，Twice扮演的角色是轻量级反向代理服务器和模板系统的合并角色。思路是对每一个用户，缓存每一个页面，然后将每个页面的更新再并入其中。使用Twice以后，每个进程每秒可以处理150条请求，同时可以在后台处理10-20个请求，这就扩展了7-10倍之前的服务器可以处理的网页的数量。大部分动态网页访问都在5ms以内。Twice有一个插件结构，所以它可以支持应用程序的一个特点，例如添加地理信息。

不用触及应用服务器，便能自动缓存像用户名一样的数据。

Twice是一个为Justin.TV的需求和环境而定制化开发的。如果开发一个新的Rails应用，使用Varnish或许是一个更好的主意。

3.网络流量由一个数据中心服务，其他的数据中心为视频服务。

4.Justin.TV 对所有的操作都做了监控.每一个点击，查看页面和每一个动作都被记录下来，这样就可以不断提高服务。前端，网络呼叫或者一个应用服务器的日志消息都被转换成系统日志消息，通过syslog-ngto转发。他们扫描所有的数据，将它装入MongoDB，使用Mongo执行查询。

5.Justin.TV的API来自网站的应用服务器，它使用相同缓冲引擎，通过扩展网站来扩展他们的API。

6.PostegreSQL是他们最主要的数据库。结构是简单的主从结构，由一个主机和多个从属读数据库组成。

由于他们网站的类型，他们不需要许多写数据库，缓冲系统控制着这些读数据库。他们发现PostgreSQL并不擅长处理写操作，因此Justin.TV就是用MemcachedDB去处理那些经常要写的数据，例如计数器。

7.他们有一个聊天服务器集群，专门用来为聊天功能服务。如果用户进入了一个频道，用户就会有5个不同的聊天服务器为他服务，扩展聊天功能要比扩展视频功能简单的多，用户可以被划分到不同的房间，这些房间又由不同的服务器负载。他们也不会让100,000个人同时在一起聊天。他们限制每个房间200人，这样就可以在一个小组里进行更有意义的交谈。这同时对扩展也很有帮助，这真的是一个很聪明的策略。

8.AWS用于存储文档镜像。他们没有为存储许多小镜像而开发专门的系统，他们使用了S3。它非常方便，而且很便宜，这就不用在他们上面花更多的时间了。他们的镜像使用频率很高，所有他们是可缓冲的，也没有留下什么后续问题。

网络拓扑结构设计

网络拓扑结构非常简单，每个服务器机架顶都有一对1G的卡，每个机架都有多个10G的接口，接口连接到外部的核心路由器。他们使用Dell Power Edge交换机，这些交换机对L3（TCP/IP）并不是完全支持，但是比L2（ethernet）要好的多。每个交换机每天要传输20G的数据，而且很便宜。核心路由器是思科的6500的系列。Justin.TV想要将节点最小化，从而让延迟降低，并且降低每个packet的处理时间。Usher管理着所有的接入控制和其他的逻辑，而不仅仅限于网络硬件。

使用多个数据中心可以充分利用对等网的优势，把流量转移到离用户最近的地方。和其他的网络和节点的连接非常多。这样就有多个可选的传输途径，所以可以使用最好的那个路径。如果他们遇到了网络的拥塞，就可以选择一条别的路。他们可以通过IP地址和时间，找到对应的ISP。

开发和部署

他们使用Puppet服务器主机，有20中不同种类的服务器。从数据库中出来的任何东西都要经过缓存器，使用Puppet他们可以把这个缓存器变成他们想要的任何东西。

他们有两个软件队伍。一个是产品队伍，另一个是硬件基础设施队伍。他们的队伍非常小，大概每个队伍只有7-8个人，每个队伍都有一个产品经理。他们雇佣一般的技术员，但却雇佣了网络结构和数据库相关的专家。

他们使用了基于网络的开发系统，所以每个新的改动都会在几分钟内完成。QA必须在变成产品之前完成，在这里通常需要5-10分钟。

Justin.TV使用Git管理源代码。Justin.TV喜欢Git的这个功能，你可以写一个程序副本，20-30行，然后它可以融合到其他人手里正在修改的副本。这个工作是独立的，模块化的。在你不得不撤销你提交的副本时，你可以很容易就修改或者撤销你的代码。每过几天每个人都会试着将自己的代码副本融入到主代码中去消除冲突。他们每天对软件做5-15个修改，范围从1行代码中的bug到大范围的测试都有。

数据库模式通过手动更新完成。将他们复制的数据库副本迁移到一起就会形成一个最新的动态记录的版本。在把改动最终应用到产品之前会在许多不同的环境下对其进行测试。

Puppet管理配置文件。每个小的改动基本上就是一个实验，他们会追踪每个对核心文件的改动的影响和之前的版本。这些测试很重要，因为通过它他们可以找出哪些改动是真正提高他们关心的指标。

Justin.TV的未来

他们的目标是增加一个数量级。首先要切分他们的视频元数据系统，由于流数据和服务器的大幅增长，他们的元数据负载也指数级的爆发增长，因此，他们需要将其大范围进行切分，对于网络数据库，将使用Cassandra对其进行拆分。其次，为了灾后恢复，要对核心数据中心进行备份。

学到的东西

自己开发还是购买。他们在这个问题上已经做了很多错误的决策。例如，他们起初应该买一台视频服务器而不是自己去做了一台。软件工程师喜欢将软件做的个性化，然后使用开源社区维护的东西却有很多益处。因此他们提出了一个更好的流程去做这个决定：1.这个项目是活动？还是维护？还是修补漏洞？2.有其他的人要用它么？你能向别人请教下该如何定义它？3.扩展性的问题，他们必须去做改变。4.如果我们自己开发，我们可以做到更快，更好，还是我们可以获得更多我们需要的特性呢？就像使用Usher，他们考虑他们可否创造一个新的外部特性，并且和另外一个系统交互。把Usher做为视频扩展性的核心针对相对笨拙的视频服务器来说是一个非常好的决策的例子。
关注自己做的事情，不要在意别人怎么干。他们的目标是有用最好的系统，最多的服务时间和最完美的扩展性。他们用了3年去开发能管理百万个广播并发的技术。
不要外包。你学到的核心价值在于经验，而不是代码或者硬件。
把一切都当做实验来做。对所有的东西都进行测量，局部测试，追踪，测量。这很划算。从一开始就做，使用优秀的测量工具。例如，他们在复制的URL上附加一个标签，然后就可以知道你是否分享了这个链接。他们从不测量的走到了如今高度测量。通过重写广播进程，使得他们的会话数量增长了700%。他们想要网站运行更快，响应更快，网页装载更快，视频服务更好，系统挤出的每一毫秒的延迟都带来了更多的广播者。他们有40个实验，如果他们希望让一个用户变成一个广播者，对每个实验他们都想要看一下广播后的留存率，广播的可用性，会话率，然后对每个改动都做一个明智的决策。
最重要的一件事是理解你的网站如何共享服务，怎么优化它。他们通过减少共享的链接在菜单中的深度，成功的提高了500%的分享率。
使用公共的构建模块和基础设施意味着系统将立刻识别什么是重要的，然后执行。具有网络能力很重要，这也是他们应该从开始就关注的地方。
让系统忙起来。使用系统的所有能力，为什么要把钱放在桌子上呢？构建可以通过应答对系统进行合理的分配的系统。
对不重要的事情不要浪费时间。如果它非常方便并且不用花费多少，就没有必要在它上面花费时间。使用S3去存储镜像就是一个很典型的例子。
试着为用户想做的事情提供支持，而不是做你认为用户该这样使用的东西。Justin.TV的终极目标似乎是把所有人都变成一个广播点。在用户实验时，通过尽可能的走出用户的使用方式，他们试着让这个过程变得尽可能简单。在这过程中，他们发现，游戏是一个巨大的作用力。用户喜欢将Xbox截图出来，并且与大家分享，讨论它，很有可能有些东西是你没想过要放在商务计划里的。
为负载峰值做设计。如果你只为了静态的状态做了设计，之后你的网站将会在峰值来临时垮掉。在实时视频上，这通常是一个大事，如果你陷入了这个麻烦，很快人们就开始传播对你不利的话。为峰值负载进行设计需要使用一个所有层次的技术。
让网络结构保持简单。使用多数据中心，使用点对点网络连接结构。
不要担心将东西划分到更多的可扩展块中去。例如，与其使用一个100,000人的频道，不如将他们划分到更多的社会和可扩展的频道去。
实时系统不能隐藏来自用户的任何问题，这就是的说服用户你的网站很可靠变的很困难。由于他们和实时系统之间的联系是固定的，这会使的系统的每个问题和故障都让大家知道，你藏不住。每个人都会发现，并且每个人都会通过交流传播发生了什么，很快，用户就会有一个你的网站有很多问题的感觉。在这种情况下，和你的用户交流就变得很重要，从一开始就构建一个可信赖的，高质量的，可扩展的，高性能的系统，设计一个用户用起来尽可能简单和舒服的系统。（编译：@康文博/审校：仲浩）

原文：Gone Fishin': Justin.Tv's Live Video Broadcasting Architecture

本文为CSDN编译整理，未经允许不得转载。如需转载请联系market@csdn.net。

2019年全国职业院校技能大赛中职组“网络空间安全”正式赛卷 ——（flag答案） Beluga 安全服务器网络中科磐云技能竞赛
2019年全国职业院校技能大赛中职组“网络空间安全”正式赛卷任务1.Wireshark数据包分析（100分）1.使用Wireshark查看并分析PYsystem20191桌面下的capture4.pcap数据包文件，找出黑客获取到的可成功登录目标服务器FTP的账号密码，并将黑客获取到的账号密码作为Flag值（用户名与密码之间以英文逗号分隔，例如：root,toor）提交；（9分）答案：
从零开始 CMake 学习笔记（E）installing OOOrchid 混合计算 c++cmake
从零开始CMake学习笔记（E）installing开始前先默念三遍口诀：DeclareatargetDeclaretarget’straitsIt’sallabouttargets本系列主要根据GitHub上的cmake-examples项目进行翻译总结，同时对于不清晰的概念及函数进行查阅理解记录形成。文章目录从零开始CMake学习笔记（E）installing1介绍1.1文件树1.2文件简介2
Connector for Python ZHIHAN__
PythonMySQL-mysql-connector驱动MySQL是最流行的关系型数据库管理系统，如果你不不熟悉MySQL，可以阅读MySQL教程。介绍使用mysql-connector来连接使用MySQL，mysql-connector是MySQL官方提供的驱动器。我们可以使用pip命令来安装mysql-connector：python-mpipinstallmysql-connector使用
冗余-安全设计的基石功能安全功能安全轨道交通冗余安全设计铁路信号
冗余构成原理就是在系统中采用2套中央处理器（CPU）单元，其中1套为工作主机，1套为热备，一旦工作主机发生故障，热备的CPU将自动投入工作，此时热备的CPU变为工作主机，原工作主机故障处理完成后就变为热备CPU。除主机冗余外，输入输出模板也可以采用冗余构成或非冗余构成。按照主机冗余方式和输入输出冗余方式，系统可以有各种不同类型。1.单一故障准则在一个系统的运行过程中，单一子系统出现故障或失效的几率
spring-ioc-bean 周周写不完的代码 spring java 后端
本文重点在于充分应用Spring提供的IoC特性，介绍如何创建一个好用的Bean。基础篇不涉及后置处理器、BeanDefinition以及Spring加载原理相关的知识。引入ioc的起源**接口与实现类的需求变更**：最初的静态工厂模式。**反射机制**：延迟加载，避免编译时依赖。**外部化配置**：将Bean的全限定名存储在配置文件中。**缓存机制**：存储已创建的Bean对象。入门使用Spri
STM32学习笔记——TIM_Period 和 TIM_Prescaler 优雅的造轮狮嵌入式学习笔记单片机嵌入式硬件
概念TIM_TimeBaseStructure.TIM_Period和TIM_TimeBaseStructure.TIM_Prescaler是STM32定时器（Timer）的两个重要参数。TIM_Period：这个参数代表的是定时器的自动重装载值（Auto-reloadvalue）。当定时器的计数值达到这个值时，定时器就会产生一个中断或更新事件。这个参数可以用来控制定时器中断的间隔时间。例如，如果
利用docker部署ftp服务用于共享团队的资料 qq_14910065 linux docker容器相关 docker 容器运维
公司需要一个ftp服务器，用户收集团队的共享文件1.docker创建命令dockerrun-d\-p21:21\-p30000-30009:30000-30009\-eFTP_USER_NAME=ftpuser\-eFTP_USER_PASS=ftppassword\-eFTP_USER_HOME=/home/ftpuser\-v/home/ftp_data:/home/ftpuser\--nam
[点点搬家]初试mod_perl+apache 之二 promenade perl apache
[四年前的博客了，学习apache的纯真年代]学习practicalmod_perl中关于apache的配置，章节连接如下http://www.modperlbook.org/html/4-1-1-Configuration-Files.html1,".htaccess"文件，可以看到httpd.conf中有这样的模块AllowOverrideNoneOptionsNoneOrderallow,d
狂赞！海量数据迁移方案，免费送给你无意摘花 java 经验积累 mysql 数据迁移
一、背景在创业初期，为了快速把项目搭建运行起来，往往不会过多地去考虑系统是否可以支持未来更大的数据吞吐量，所以往往不会分表或分库。可当项目真正运行了一年两年之后，会发现原来的单表已经存储不了更多的数据了，或者查询性能受到影响，此时就要考虑分库或分表了。一般涉及到分库分表，数据迁移是必须要做的一个工作。那么接下来，笔者就以自己亲身实践过的一次数据迁移经验为依据，向大家介绍一下，当数据量过亿时，进行数
MySQL的主从同步 m0_74536424 Linux学习笔记 mysql linux 运维数据库
MySQL的主从同步1.MySQL中从同步原理简介MySQL主从同步是一种数据库复制技术，它可以将一台MySQL数据库（称为主服务器）的数据复制到另一台或多台MySQL数据库（称为从服务器）。主从同步可以用于以下目的：主服务器将所有数据变更记录到二进制日志（binlog）中。从服务器连接到主服务器，并从主服务器的二进制日志中获取数据变更信息。从服务器将获取到的数据变更信息应用到自己的数据库中，从而
Linux文件类型和根目录结构 m0_74536424 Linux学习笔记 linux 运维服务器
Linux文件类型和根目录结构1.文件类型字符文件类型说明~普通文件类似于Windows的记事本d目录文件类似于windows文件夹c字符设备文件串行端口设备，顺序读写，键盘b块设备文件可供存储的接口设备，随机读写，硬盘p管道文件用于进程间的通信s套接字文件通常用于网络上的通信。可以启动一个程序来监听客户端的要求，客户端可以通过套接字来进行数据通信l符号链接又叫软链接，和原来文件不是同一个文件例如
网络空间安全（13）上传验证绕过 IT 青年网安知识库网络空间安全
前言上传验证绕过是一种网络安全攻击手段，攻击者利用目标系统或应用程序在文件上传过程中存在的漏洞，绕过文件上传的验证机制，上传恶意文件，从而实现对目标系统的攻击。一、常见类型客户端验证绕过定义：客户端验证通常通过JavaScript在浏览器中执行，用于检查文件类型、大小等。客户端验证绕过是指攻击者通过禁用JavaScript或修改前端代码，绕过这些验证。绕过方法：禁用JavaScript：直接在浏览
网络空间安全（15）文件包含漏洞 IT 青年网安知识库网络空间安全
一、概述1.定义文件包含漏洞（FileInclusionVulnerability）是指应用程序在包含文件时，没有对文件路径或来源进行严格的验证和过滤，导致攻击者可以构造恶意文件路径，使服务器执行任意文件或代码。2.产生原因开发人员为了方便代码的复用，通常会将可重复使用的函数或代码写入单个文件中，在需要使用这些函数或代码时，通过文件包含函数直接调用这些文件。然而，如果文件包含函数加载的参数没有经过
【Linux】【网络】UDP打洞--＞不同子网下的客户端和服务器通信（成功版）钟离墨笺 Linux 网络服务器 linux
【Linux】【网络】UDP打洞–＞不同子网下的客户端和服务器通信（成功版）根据上个文章的分析问题可能出现在代码逻辑上面我这里重新查找资料怀疑：1NAT映射可能需要多次数据包的发送才能建立。2NAT映射保存时间太短，并且NAT可能会在短时间内改变这些映射，需要一直保持映射。有些NAT设备会因为短时间内没有数据而回收端口映射，导致服务器提供的IP:Port失效。保活机制：双方定期发送保活包以防NAT
Scala 中的数据类型转换规则闯闯桑 scala 大数据算法
在Scala中，数据类型转换是将一个类型的值转换为另一个类型的过程。Scala提供了多种数据类型转换的方式，包括自动类型转换（隐式转换）和显式类型转换。以下是Scala中数据类型转换的规则和方法的详细介绍：1.自动类型转换（隐式转换）Scala支持在某些情况下自动进行类型转换，这种转换通常是安全的，不会导致数据丢失。自动类型转换的规则如下：1.1数值类型的自动转换Scala支持从低精度数值类型向高
如何使用BeautifulSoup轻松解析网页内容？字节王德发 python beautifulsoup
在当今这个信息爆炸的时代，网络上有大量的数据等待我们去挖掘。如何从网页中提取我们需要的信息呢？使用Python的BeautifulSoup库，能够让这一过程变得简单而高效！接下来，我将带你走进BeautifulSoup的世界，教你如何进行网页解析。BeautifulSoup是什么？BeautifulSoup是一个Python库，专门用于从HTML和XML文件中提取数据。它能够将复杂的网页结构转化为
深入解析 Umi-OCR：高效的免费开源 OCR 文字识别工具萧鼎 python基础到进阶教程 ocr python Umi-OCR
1.Umi-OCR简介1.1什么是Umi-OCR？Umi-OCR是一款开源、免费、支持离线使用的光学字符识别（OCR）工具，基于PaddleOCR和Tesseract-OCR，能够高效识别图片中的文字，尤其适用于批量截图文字提取、PDF文字识别、手写体识别等应用场景。它具备轻量级、易用、支持多种格式等特点，在文字识别任务中表现优异。1.2Umi-OCR的核心特点完全免费开源：Umi-OCR在Git
简述KMP模式匹配算法，next函数和nextval函数 Lkkkkkkkcy c语言数据结构与算法字符串算法数据结构
KMP算法首先KMP算法是基于next函数而实现的，与BF算法相比，KMP算法是没有了主串指针回溯的情况。改进后的算法复杂度为O(m+n).KMP算法的简述每一次比较时，当子串与主串不相等的时候，主串的指针不回溯，而是通过next函数所求得的值当作下一位子串开始比较的位置。(即尽可能地向右边滑动一段的距离，从而减少比较的次数)。KMP算法匹配过程示例第一趟匹配： ababcabcac
常用的分布式 ID 设计方案梦城忆分布式
文章目录1.UUID2.数据库自增ID3.雪花算法4.Redis生成ID5.美团Leaf1.UUID原理：UUID是由数字和字母组成的128位标识符，通过特定算法随机生成，包括时间戳、计算机网卡地址等信息。常见的版本有版本1（基于时间戳和MAC地址）、版本4（纯随机数）等。优点：生成简单，本地生成，不需要依赖额外的组件或服务，能有效减少网络开销。全球唯一，基本能保证在任何场景下不会重复。缺点：长度
Spring使用JWT进行登录验证 PXM的算法星球 Java后端 spring java 后端
前情提要：由于这学期课设需要使用SSM技术栈，导致一些好用的登录框架无法适配，所以改用手写JWT进行登录验证JWT简介JSONWebToken(JWT)是一种用于在网络应用环境中进行用户身份验证和信息交换的开放标准。它通过将数据以JSON格式进行编码，使得信息在不同的系统和应用之间得以安全传递。JWT的主要特点是结构简洁且安全性高，广泛应用于单点登录（SSO）、API授权和用户身份认证。JWT由三
北京大学DeepSeek课程1《DeepSeek与AIGC应用》 daly520 AIGC 人工智能 ai python 深度学习机器学习
北京大学发布的《DeepSeek与AIGC应用》报告及配套教程，系统介绍了DeepSeek技术特性、AIGC应用场景及实践方法，主要包含以下核心内容：PDF完整版下载北京大学DeepSeek课程《DeepSeek与AIGC应用》下载https://ollama.net.cn/deepseek/14.html一、DeepSeek-R1模型的技术解析1.模型特性与优势DeepSeek-R1是一款专注于
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响 24K不怕分布式分布式ID Snowfake
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响分布式ID定义典型实现方案基于数据库自增序列的实现UUID方案Redis方案Snowflake方案Snowfake是否受冬令时切换影响分布式ID定义全局唯一：区别于单点系统的唯一，全局是要求分布式系统内唯一。有序性：通常都要保证生成的ID是有序递增的。例如，在数据库存储场景中，有序ID便于确定数据位置，往往更加高效。典型实现方案
提高SQL查询性能的7个法宝傻儿哥 ORACLE sql 数据库报表 sql server sybase 存储
【IT168专稿】每个数据库平台上的SQL开发人员都是在困难中求得生存，我们总是一次又一次犯同样的错误，这是因为数据库领域还相对不成熟，是的，每个数据库厂商都在做着各种不同的努力，但作为开发人员仍然要克服各种问题，无论是在SQLServer，Oracle，DB2，Sybase，MySQL数据库，还是其它关系数据库平台上编写SQL代码，并发性、资源管理、空间管理和SQL运行速度总是困扰着开发人员。遗
0基础学前端---品优购项目Day14 学代码的小前端 0基础学前端 javascript 前端 html css
0基础学前端—品优购项目Day14视频参考：B站Pink老师本节重点：all项目链接：完整的项目已放到品优购完整项目大家可以自行下载强调内容这里主要强调两个知识点：(1)网站TDK三个标签SEO优化(2)logoSEO优化网站TDK三个标签SEO优化T:title网站名（产品名）网站的介绍D:网站是做什么的K:关键字6~8个最好logoSEO优化（1）logo里面首先放一个h1标签，目的是为了提权
PythonWeb框架djiango第二章 _AndyLau 手把手学python django python
PythonWeb框架djiango第二章文章目录PythonWeb框架djiango第二章模版方式1（推荐）方式2render方法详解模版语法{{contxt中字典的key}}{%%}标签ifelifelseendif条件选择for{##}常用标签过滤器模版结构{%include"xxx.html"%}模版继承静态文件模型模型安装和配置单表crudMetaFieldAPI外键ForeignKey
Vue打印组件 _AndyLau vue.js
Vue打印组件vue-print-nb是一个用于Vue.js的轻量级打印插件，它允许你轻松地将页面或特定元素转换为可打印格式，并提供了额外的功能如预览和生成PDF。下面是使用vue-print-nb的步骤：安装首先，你需要通过npm或yarn来安装vue-print-nb。bash深色版本npminstallvue-print-nb--save#或者yarnaddvue-print-nb引入并注册
JAVA开发技术学习规划 —— 给未来20年技术领航者的你 _AndyLau 学习
亲爱的大学生朋友们，在这个信息爆炸、技术日新月异的时代，选择成为一名JAVA开发者，意味着你将踏入一个充满挑战与机遇的广阔天地。作为一位在JAVA开发领域深耕20年的老兵，我亲历了JAVA从诞生、成长到壮大的全过程，见证了它如何从一个新兴的语言逐渐发展成为企业级应用开发的首选。今天，我想将这份宝贵的经验凝聚成一份详实的技术学习规划，为即将踏上这条征途的你们，指引方向，助力你们在JAVA开发的道路上
腾讯云数据库 TencentDB for PostgreSQL常见问题的解答上云使者腾讯云知识分享腾讯云数据库 postgresql mysql sql
本页面提供关于云数据库PostgreSQL的一些常见问题的解答，如果您在使用过程中遇到问题，您也可以在文章中评论提问来寻求帮助。更多参阅腾讯云官方文档。腾讯云数据库TencentDBforPostgreSQL强大的计算性能、空间地理信息处理能力，面向企业复杂SQL处理的OLTP场景云数据库PostgreSQL简介腾讯云数据库PostgreSQL（TencentDBforPostgreSQL，云AP
Manus：中国AI创新力，开启通用智能体的新时代 YuKeeHgg Manus 人工智能 Manus
更多精彩内容可点击「华彬智融知识数据库」免费解锁～2025年3月6日，中国科技领域迎来里程碑式突破——由Monica.im团队研发的全球首款通用AI智能体产品“Manus”正式上线。这款被业界誉为“聪明实习生”的AI助手，凭借其自主执行复杂任务的能力，一夜之间引爆全球科技圈，推动A股AI相关板块大涨，软件ETF单日涨幅超3%。Manus的诞生不仅刷新了AI技术应用的高度，更标志着中国团队在智能体（
9.1 shell文本处理 Qiu_SaMa Linux Shell的学习 linux vim
通常shell脚本最大的用途就在于解析和显示文本文件中的数据，比如日志文件和错误文件。Linux环境包含了两个非常有用的工具：sed和gawk，两者都能够在shell脚本中处理文本数据。1.sed编辑器sed编辑器被称为流编辑器（streameditor），和普通的交互式文本编辑器恰好相反。在交互式文本编辑器中（如vim），可以用键盘命令来交互式地插入、删除或替换数据中的文本。流编辑器则会在编辑器
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

YouTube的挑战者 JustinTV教你如何打造实时视频网站

YouTube的挑战者 JustinTV教你如何打造实时视频网站

你可能感兴趣的:(YouTube的挑战者 JustinTV教你如何打造实时视频网站)