zhibudefeng

视频网站是怎么建成的--------JustinTV教你如何打造实时视频网站

摘要：实时的定义应该是延迟小于250ms，按照这个标准，实时的成功应用立马成了凤毛麟角。本文详细阐述Justin.TV实时系统的技术细节，解密实时视频网站的内幕。文章内容来自Highscalability对Justin.TV创始人兼副总裁Kyle Vogt的采访，由CSDN记者编译整理。

Justin.TV每月有3000万个独立访问量，在游戏视频上传领域打败了YouTube ，他们每天每分钟新增30个小时的视频，而YouTube只有23。

下面从Justin.TV的实时视频系统使用到的平台，他们的架构细节，从他们身上应该学到的东西等几个方面逐一展开。

使用到的平台

Twice —— 代理服务系统，主要用缓冲优化应用服务器负载
XFS —— 文件系统
HAProxy —— 用于TCP/HTTP负载平衡
LVS stack and Idirectord —— 高可靠性
Ruby on Rails —— 应用服务器系统
Nginx —— web服务器系统
PostgreSQL —— 数据库，用于用户和meta数据
MongoDB —— 数据库，用于内部分析
MemcachedDB —— 数据库，用于存放经常要修改的数据
Syslog-ng —— 日志服务系统
RabitMQ —— job系统
Puppet —— 创建服务
Git —— 源代码管理
Wowza —— Flash/H.264视频服务器和许多Java写的custome modules
Usher —— 播放视频流的逻辑控制服务器
S3 —— 用于存储小型镜像

Justin.TV的一些统计数据

有覆盖全美的4个数据中心
在任何时候都有2000多个同时流入的数据流
每天每分钟新增30个小时的视频
每月有3000万个独立访问量（不计同一用户多次访问）
每秒实时的网络流量在45G左右

实时视频结构详述

实时视频结构

1.使用了P2P和CDN

一般人认为，只需要不断提高带宽，把传来的数据都放入内存，不断的接收数据流就可以了，事实并非如此。实时视频要求不能打断，这就意味着你不可以超负荷的使用带宽。YouTube只需要让播放器缓冲一下，就可以用8G的带宽解决10G通道的需求，但在实时视频里，你不能缓冲，如果在信道上的流量超过了它的传输能力，哪怕只是一瞬间，那么所有的正在看的用户在那一刻都会卡。如果你在它的极限能力上再加入了一点儿负载，所有人立刻就会进入缓冲状态。

Justin.TV使用了点对点的结构来解决这个问题，当然他们也有更好的解决办法，CDN（内容分发网络）便是之一。当用户的流量负载超过Justin.TV的负载能力时，Justin.TV便很巧妙的将超标流量引入到一个CDN中去。Usher控制着这个处理逻辑。一旦接到了超标用户的负载请求，Usher便立刻将这些新用户转发到CDN中去。

2.100%可用时间和维护的矛盾

实时视频构建的系统既要保证100%的可用时间，又要保证机器可以进行维护。与一般网站不同，一般网站维护时出现的问题只有少数人会发现、关注，而实时视频网站不同，用户很快就会发现维护时带来的任何问题，并且互相传播的非常快，这就使得没有什么问题可以隐瞒用户，面对现在用户的挑剔，你必须避免维护时出问题。对一个服务器维护时，你不能主动结束用户的进程，必须等待所有在这个服务器上的用户自己结束服务才能开始，而这个过程往往非常缓慢。

3.Usher与负载均衡

Justin.TV遇到的最大的麻烦是即时拥塞，当大量的用户同时看同一个栏目的时候，便会突然产生突发网络拥塞。他们开发了一个实时的服务器和数据中心调度系统，它就是Usher。

Justin.TV的系统在突发的高峰拥塞上做了很多。他们的网络每秒可以处理大量的链入连接。用户也参与了负载均衡，这也是Justin.TV需要用户使用Justin.TV自己的播放器的原因之一。至于TCP，由于它的典型处理速度就是百kbps级的，所以也不用对TCP协议做什么修改。

相对于他们的流量，他们的视频服务器看来来有些少，原因是他们可以使用Usher把每个视频服务器的性能发挥到最好。负载均衡可以确保流量从不会超过他们的负载极限。负载大部分是在内存中，因此这个系统可以让网络的速度发挥到极限。服务器他们是一次从Rackable(SGI服务器的一个系列)买了一整套。他们做的仅仅是从所有预置的里面做了下挑选。

Usher是Justin.TV开发的一款定制化软件，用来管理负载平衡，用户认证和其他一些流播放的处理逻辑。Usher通过计算出每个流需要多少台服务器提供支持，从而分配资源，保证系统处于最优状态。这是他们的系统和别家不同之处。Usher通常会从下面几个指标计算、衡量某个流媒体所需要的服务器：

每个数据中心的负载是多少
每个服务器的负载是多少
延迟优化的角度
当前这个流可用的服务器列表
用户的国家（通过IP地址获得）
用户是否有可用的对等网（通过在路由数据库中查询IP地址获得）
请求来自于哪个数据中心

Usher使用这些指标便可以在服务净成本上来优化，把服务放在比较空闲的服务器上，或者把服务放在离用户较近的服务器上，从而给用户带来更低的延迟和更好的表现。Usher有很多个可以选择的模式从而达到很细的控制粒度。

Justin.TV系统的每个服务器都可以做边缘服务器，直接为用户输出视频流，同时每个服务器也可以做源服务器，为其他服务器传递视频流。这个特性，使得视频流的负载结构成了动态的，经常改变的一个过程。

4.服务器形成了加权树

服务器之间由视频流的拷贝而产生的联系和加权树非常相似。数据流的数量经常被系统取样、统计，如果观看某个视频流的用户数量飞速上涨，系统便将其拷贝很多份到一些其他的服务器上去。这个过程反复执行，最终就形成了一个树状的结构，最终会将网络中所有的服务器都画在里面。Justin.TV的视频流从源服务器出发，被拷贝到其他服务器，或者拷贝到用户的整个过程中，都处于内存中，没有硬盘路径的概念。

5.RTMP和HTTP

Justin.TV尽可能的使用了Flash，因为它使用RTMP协议，对每个视频流，系统都有一个独立的Session去维护它。由于使用这个协议，成本就相当高。由于下载流的ISP不支持，因而无法使用多路广播和P2P技术。Justin.TV确实想过用多路广播在内部服务器之间拷贝数据流，然而由于他们的系统控制覆盖整个网络，而且内部有大量的很便宜的带宽可以使用，这样使用多路广播的技术就并没有产生多少效益。同时，由于他们的优化算法是将每个服务器上的流数都最小化，这就使得在很细的力度上做些事情会非常麻烦，甚至超过了他们能得到收益。

Justin.TV的Usher使用HTTP请求去控制某个服务器负载哪个视频流，从而控制了服务的拓扑结构。Justin.TV在流数据上使用HTTP，但存在的一个问题是它没有延迟和实时方面的性能。有些人说实时的定义就是5-30秒，然而，面对数千人做实时视频的时候这显然不行，因为他们还需要实时的讨论，交流。这意味着延迟不能高于1/4秒。

6.从AWS到自己的数据中心

起初Justin.TV使用AWS，后来迁移到Akamai（云服务供应商），最后到了自己的数据中心。

离开AWS到Akamai的原因有：1，成本；2，网速不能满足他们的需求。视频直播对带宽非常敏感，因此有一个快速的，可靠的，稳定的和低延迟的网络非常关键。使用AWS时，你不能控制这些。它是一个共享的网络，常常超负载，AWS的网速不会比300Mbps更快。他们对动态范围改动和云API很重视，然而在性能和成本问题上没有做什么。

3年前，Justin.TV计算他们每个用户的成本，CDN是$0.135，AWS是0.0074，Datacenter是$0.001如今，他们的CDN成本降低了，但他们的数据中心的成本却仍然一样。

拥有多个数据中心的关键是为了能够接近所有的主要交换节点。他们选择国内最好的位置从而使得他们为国内最多的节点提供了入口。而且节约了成本。构建了这些数据中心后，他们就直接连入了这些其他的网络，从而就省去了之前处理这些中转流量的费用。还提高了性能。他们直接连入了他们所谓的"eyeball"网络。这个网络中包含了大量的cable/DSL用户。和"content"网络连接有些类似，Justin.TV的"eyeball"连接的流量主要来自终端用户。在大多数情况下，这些都是免费的，不用任何花一分钱，要做的就是连进来就行。Justin.TV有一个主干网，用于在不同的数据中心传输视频流。因为要到一个可用节点的选拔过程是去找愿意和你做对等节点的过程，这通常是很困难的。

7.存储

视频流不是从磁盘形成，而是要存到磁盘上去。源服务器将一个传入的视频流在本地磁盘上复制一份，之后便将这个文件上传到长期存储器上。视频的每一秒都被录下来并且存档了。

存储设备和YouTube类似，就是一个磁盘库。使用XFS文件系统。这个结构用于记录通过服务器传播的广播。默认的视频流是保存7天。用户可以手动的设置，甚至你可以保存到永远（如果公司没有倒闭的话）。

8.实时转码

增加了实时的转码功能，可以将任何一种流式数据转化为传输层数据或者是代码，并且可以用新的格式将它重新编为流媒体。有一个转码集群，用来处理转换工作。转换的会话使用job系统进行管理。如果需要的转码服务超过了集群的处理能力，那所有的服务器都可以用作转码服务器。

Web结构

Web 结构

1.Justin.TV前端使用Ruby on Rails。

2.用Twice做缓存

系统个每个页面都使用了他们自己定制的Twice缓存系统。Twice扮演的角色是轻量级反向代理服务器和模板系统的合并角色。思路是对每一个用户，缓存每一个页面，然后将每个页面的更新再并入其中。使用Twice以后，每个进程每秒可以处理150条请求，同时可以在后台处理10-20个请求，这就扩展了7-10倍之前的服务器可以处理的网页的数量。大部分动态网页访问都在5ms以内。Twice有一个插件结构，所以它可以支持应用程序的一个特点，例如添加地理信息。

不用触及应用服务器，便能自动缓存像用户名一样的数据。

Twice是一个为Justin.TV的需求和环境而定制化开发的。如果开发一个新的Rails应用，使用Varnish或许是一个更好的主意。

3.网络流量由一个数据中心服务，其他的数据中心为视频服务。

4.Justin.TV 对所有的操作都做了监控.每一个点击，查看页面和每一个动作都被记录下来，这样就可以不断提高服务。前端，网络呼叫或者一个应用服务器的日志消息都被转换成系统日志消息，通过syslog-ngto转发。他们扫描所有的数据，将它装入MongoDB，使用Mongo执行查询。

5.Justin.TV的API来自网站的应用服务器。它使用相同缓冲引擎，通过扩展网站来扩展他们的API.

6.PostegreSQL是他们最主要的数据库。结构式是简单的主从结构，由一个主机和多个从属读数据库组成。

由于他们网站的类型，他们不需要许多写数据库。缓冲系统控制着这些读数据库。他们发现PostgreSQL并不擅长处理写操作。因此Justin.TV就是用MemcachedDB去处理那些经常要写的数据，例如计数器。

7.他们有一个聊天服务器集群，专门用来为聊天功能服务。如果用户进入了一个频道，用户就会有5个不同的聊天服务器为他服务。扩展聊天功能要比扩展视频功能简单的多。用户可以被划分到不同的房间，这些房间又由不同的服务器负载。他们也不会让100,000个人同时在一起聊天。他们限制每个房间200人，这样就可以在一个小组里进行更有意义的交谈。这同时对扩展也很有帮助，这真的是一个很聪明的策略。

8.AWS用于存储文档镜像。他们没有为存储许多小镜像而开发专门的系统，他们使用了S3。它非常方便，而且很便宜，这就不用在他们上面花更多的时间了。他们的镜像使用频率很高，所有他们是可缓冲的，也没有留下什么后续问题。

网络拓扑结构设计

网络拓扑结构非常简单。每个服务器机架顶都有一对1G的卡。每个机架都有多个10G的接口，接口连接到外部的核心路由器。他们使用Dell Power Edge交换机，这些交换机对L3（TCP/IP）并不是完全支持，但是比L2（ethernet）要好的多。每个交换机每天要传输20G的数据，而且很便宜。核心路由器是思科的6500的系列。Justin.TV想要将节点最小化，从而让延迟降低，并且降低每个packet的处理时间。Usher管理着所有的接入控制和其他的逻辑，而不仅仅限于网络硬件。

使用多个数据中心可以充分利用对等网的优势，把流量转移到离用户最近的地方。和其他的网络和节点的连接非常多。这样就有多个可选的传输途径，所以可以使用最好的那个路径。如果他们遇到了网络的拥塞，就可以选择一条别的路。他们可以通过IP地址和时间，找到对应的ISP。

开发和部署

他们使用Puppet服务器主机，有20中不同种类的服务器。从数据库中出来的任何东西都要经过缓存器。使用Puppet他们可以把这个缓存器变成他们想要的任何东西。

他们有两个软件队伍。一个是产品队伍，另一个是硬件基础设施队伍。他们的队伍非常小，大概每个队伍只有7-8个人。每个队伍都有一个产品经理。他们雇佣一般的技术员，但却雇佣了网络结构和数据库相关的专家。

他们使用了基于网络的开发系统，所以每个新的改动都会在几分钟内完成。QA必须在变成产品之前完成，在这里通常需要5-10分钟。

Justin.TV使用Git管理源代码。Justin.TV喜欢Git的这个功能，你可以写一个程序副本，20-30行，然后它可以融合到其他人手里正在修改的副本。这个工作是独立的，模块化的。在你不得不撤销你提交的副本时，你可以很容易就修改或者撤销你的代码。每过几天每个人都会试着将自己的代码副本融入到主代码中去消除冲突。他们每天对软件做5-15个修改。范围从1行代码中的bug到大范围的测试都有。

数据库模式通过手动更新完成。将他们复制的数据库副本迁移到一起就会形成一个最新的动态记录的版本。在把改动最终应用到产品之前会在许多不同的环境下对其进行测试。

Puppet管理配置文件。每个小的改动基本上就是一个实验。他们会追踪每个对核心文件的改动的影响和之前的版本。这些测试很重要，因为通过它他们可以找出哪些改动是真正提高他们关心的指标。

Justin.TV的未来

他们的目标是增加一个数量级。首先要切分他们的视频元数据系统。由于流数据和服务器的大幅增长，他们的元数据负载也指数级的爆发增长，因此，他们需要将其大范围进行切分。对于网络数据库，将使用Cassandra对其进行拆分。其次，为了灾后恢复，要对核心数据中心进行备份。

学到的东西

自己开发还是购买。他们在这个问题上已经做了很多错误的决策。例如，他们起初应该买一台视频服务器而不是自己去做了一台。软件工程师喜欢将软件做的个性化，然后使用开源社区维护的东西却有很多益处。因此他们提出了一个更好的流程去做这个决定：1.这个项目是活动？还是维护？还是修补漏洞？2.有其他的人要用它么？你能向别人请教下该如何定义它？3.扩展性的问题。他们必须去做改变。4.如果我们自己开发，我们可以做到更快，更好，还是我们可以获得更多我们需要的特性呢？就像使用Usher，他们考虑他们可否创造一个新的外部特性，并且和另外一个系统交互。把Usher做为视频扩展性的核心针对相对笨拙的视频服务器来说是一个非常好的决策的例子。
关注自己做的事情，不要在意别人怎么干。他们的目标是有用最好的系统，最多的服务时间和最完美的扩展性。他们用了3年去开发能管理百万个广播并发的技术。
不要外包。你学到的核心价值在于经验，而不是代码或者硬件。
把一切都当做实验来做。对所有的东西都进行测量。局部测试，追踪，测量。这很划算。从一开始就做。使用优秀的测量工具。例如，他们在复制的URL上附加一个标签，然后就可以知道你是否分享了这个链接。他们从不测量的一段时间走到了如今高度测量。通过重写广播进程，使得他们的会话数量增长了700%。他们想要网站运行更快，响应更快，网页装载更快，视频服务更好。系统挤出的每一毫秒的延迟都带来了更多的广播者。他们有40个实验，如果他们希望让一个用户变成一个广播者。对每个实验他们都想要看一下广播后的留存率，广播的可用性，会话率，然后对每个改动都做一个明智的决策。
最重要的一件事是理解你的网站如何共享服务，怎么优化它。他们通过减少共享的链接在菜单中的深度，成功的提高了500%的分享率。
使用公共的构建模块和基础设施意味着系统将立刻识别什么是重要的，然后执行。具有网络能力很重要，这也是他们应该从开始就关注的地方。
让系统忙起来。使用系统的所有能力。为什么要把钱放在桌子上呢？构建可以通过应答对系统进行合理的分配的系统。
对不重要的事情不要浪费时间。如果它非常方便并且不用花费多少，就没有必要在它上面花费时间。使用S3去存储镜像就是一个很典型的例子。
试着为用户想做的事情提供支持，而不是做你认为用户该这样使用的东西。Justin.TV的终极目标似乎是把所有人都变成一个广播点。在用户实验时，通过尽可能的走出用户的使用方式，他们试着让这个过程变得尽可能简单。在这过程中，他们发现，游戏是一个巨大的用力。用户喜欢将Xbox截图出来，并且与大家分享，讨论它。很有可能有些东西是你没想过要放在商务计划里的。
为负载峰值做设计。如果你只为了静态的状态做了设计，之后你的网站将会在峰值来临时垮掉。在直播时，这通常是一个大事，如果你陷入了这个麻烦，很快人们就开始传播对你不利的话。为峰值负载进行设计需要使用一个所有层次的技术。
让网络结构保持简单。使用多数据中心。使用点对点网络连接结构。
不要担心将东西划分到更多的可扩展块中去。例如，与其使用一个100,000人的频道，不如将他们划分到更多的社会和可扩展的频道去。
实时系统不能隐藏来自用户的任何问题，这就是的说服用户你的网站很可靠变的很困难。由于他们和实时系统之间的联系是固定的，这会使的系统的每个问题和故障都让大家知道。你藏不住。每个人都会发现。并且每个人都会通过交流传播发生了什么。很快，用户就会有一个你的网站有很多问题的感觉。在这种情况下，和你的用户交流就变得很重要，从一开始就构建一个可信赖的，高质量的，可扩展的，高性能的系统，设计一个用户用起来尽可能简单和舒服的系统。（编译：@康文博/审校：仲浩）

原文：Gone Fishin': Justin.Tv's Live Video Broadcasting Architecture

2019年全国职业院校技能大赛中职组“网络空间安全”正式赛卷 ——（flag答案） Beluga 安全服务器网络中科磐云技能竞赛
2019年全国职业院校技能大赛中职组“网络空间安全”正式赛卷任务1.Wireshark数据包分析（100分）1.使用Wireshark查看并分析PYsystem20191桌面下的capture4.pcap数据包文件，找出黑客获取到的可成功登录目标服务器FTP的账号密码，并将黑客获取到的账号密码作为Flag值（用户名与密码之间以英文逗号分隔，例如：root,toor）提交；（9分）答案：
从零开始 CMake 学习笔记（E）installing OOOrchid 混合计算 c++cmake
从零开始CMake学习笔记（E）installing开始前先默念三遍口诀：DeclareatargetDeclaretarget’straitsIt’sallabouttargets本系列主要根据GitHub上的cmake-examples项目进行翻译总结，同时对于不清晰的概念及函数进行查阅理解记录形成。文章目录从零开始CMake学习笔记（E）installing1介绍1.1文件树1.2文件简介2
Connector for Python ZHIHAN__
PythonMySQL-mysql-connector驱动MySQL是最流行的关系型数据库管理系统，如果你不不熟悉MySQL，可以阅读MySQL教程。介绍使用mysql-connector来连接使用MySQL，mysql-connector是MySQL官方提供的驱动器。我们可以使用pip命令来安装mysql-connector：python-mpipinstallmysql-connector使用
冗余-安全设计的基石功能安全功能安全轨道交通冗余安全设计铁路信号
冗余构成原理就是在系统中采用2套中央处理器（CPU）单元，其中1套为工作主机，1套为热备，一旦工作主机发生故障，热备的CPU将自动投入工作，此时热备的CPU变为工作主机，原工作主机故障处理完成后就变为热备CPU。除主机冗余外，输入输出模板也可以采用冗余构成或非冗余构成。按照主机冗余方式和输入输出冗余方式，系统可以有各种不同类型。1.单一故障准则在一个系统的运行过程中，单一子系统出现故障或失效的几率
spring-ioc-bean 周周写不完的代码 spring java 后端
本文重点在于充分应用Spring提供的IoC特性，介绍如何创建一个好用的Bean。基础篇不涉及后置处理器、BeanDefinition以及Spring加载原理相关的知识。引入ioc的起源**接口与实现类的需求变更**：最初的静态工厂模式。**反射机制**：延迟加载，避免编译时依赖。**外部化配置**：将Bean的全限定名存储在配置文件中。**缓存机制**：存储已创建的Bean对象。入门使用Spri
STM32学习笔记——TIM_Period 和 TIM_Prescaler 优雅的造轮狮嵌入式学习笔记单片机嵌入式硬件
概念TIM_TimeBaseStructure.TIM_Period和TIM_TimeBaseStructure.TIM_Prescaler是STM32定时器（Timer）的两个重要参数。TIM_Period：这个参数代表的是定时器的自动重装载值（Auto-reloadvalue）。当定时器的计数值达到这个值时，定时器就会产生一个中断或更新事件。这个参数可以用来控制定时器中断的间隔时间。例如，如果
利用docker部署ftp服务用于共享团队的资料 qq_14910065 linux docker容器相关 docker 容器运维
公司需要一个ftp服务器，用户收集团队的共享文件1.docker创建命令dockerrun-d\-p21:21\-p30000-30009:30000-30009\-eFTP_USER_NAME=ftpuser\-eFTP_USER_PASS=ftppassword\-eFTP_USER_HOME=/home/ftpuser\-v/home/ftp_data:/home/ftpuser\--nam
[点点搬家]初试mod_perl+apache 之二 promenade perl apache
[四年前的博客了，学习apache的纯真年代]学习practicalmod_perl中关于apache的配置，章节连接如下http://www.modperlbook.org/html/4-1-1-Configuration-Files.html1,".htaccess"文件，可以看到httpd.conf中有这样的模块AllowOverrideNoneOptionsNoneOrderallow,d
狂赞！海量数据迁移方案，免费送给你无意摘花 java 经验积累 mysql 数据迁移
一、背景在创业初期，为了快速把项目搭建运行起来，往往不会过多地去考虑系统是否可以支持未来更大的数据吞吐量，所以往往不会分表或分库。可当项目真正运行了一年两年之后，会发现原来的单表已经存储不了更多的数据了，或者查询性能受到影响，此时就要考虑分库或分表了。一般涉及到分库分表，数据迁移是必须要做的一个工作。那么接下来，笔者就以自己亲身实践过的一次数据迁移经验为依据，向大家介绍一下，当数据量过亿时，进行数
MySQL的主从同步 m0_74536424 Linux学习笔记 mysql linux 运维数据库
MySQL的主从同步1.MySQL中从同步原理简介MySQL主从同步是一种数据库复制技术，它可以将一台MySQL数据库（称为主服务器）的数据复制到另一台或多台MySQL数据库（称为从服务器）。主从同步可以用于以下目的：主服务器将所有数据变更记录到二进制日志（binlog）中。从服务器连接到主服务器，并从主服务器的二进制日志中获取数据变更信息。从服务器将获取到的数据变更信息应用到自己的数据库中，从而
Linux文件类型和根目录结构 m0_74536424 Linux学习笔记 linux 运维服务器
Linux文件类型和根目录结构1.文件类型字符文件类型说明~普通文件类似于Windows的记事本d目录文件类似于windows文件夹c字符设备文件串行端口设备，顺序读写，键盘b块设备文件可供存储的接口设备，随机读写，硬盘p管道文件用于进程间的通信s套接字文件通常用于网络上的通信。可以启动一个程序来监听客户端的要求，客户端可以通过套接字来进行数据通信l符号链接又叫软链接，和原来文件不是同一个文件例如
网络空间安全（13）上传验证绕过 IT 青年网安知识库网络空间安全
前言上传验证绕过是一种网络安全攻击手段，攻击者利用目标系统或应用程序在文件上传过程中存在的漏洞，绕过文件上传的验证机制，上传恶意文件，从而实现对目标系统的攻击。一、常见类型客户端验证绕过定义：客户端验证通常通过JavaScript在浏览器中执行，用于检查文件类型、大小等。客户端验证绕过是指攻击者通过禁用JavaScript或修改前端代码，绕过这些验证。绕过方法：禁用JavaScript：直接在浏览
网络空间安全（15）文件包含漏洞 IT 青年网安知识库网络空间安全
一、概述1.定义文件包含漏洞（FileInclusionVulnerability）是指应用程序在包含文件时，没有对文件路径或来源进行严格的验证和过滤，导致攻击者可以构造恶意文件路径，使服务器执行任意文件或代码。2.产生原因开发人员为了方便代码的复用，通常会将可重复使用的函数或代码写入单个文件中，在需要使用这些函数或代码时，通过文件包含函数直接调用这些文件。然而，如果文件包含函数加载的参数没有经过
【Linux】【网络】UDP打洞--＞不同子网下的客户端和服务器通信（成功版）钟离墨笺 Linux 网络服务器 linux
【Linux】【网络】UDP打洞–＞不同子网下的客户端和服务器通信（成功版）根据上个文章的分析问题可能出现在代码逻辑上面我这里重新查找资料怀疑：1NAT映射可能需要多次数据包的发送才能建立。2NAT映射保存时间太短，并且NAT可能会在短时间内改变这些映射，需要一直保持映射。有些NAT设备会因为短时间内没有数据而回收端口映射，导致服务器提供的IP:Port失效。保活机制：双方定期发送保活包以防NAT
Scala 中的数据类型转换规则闯闯桑 scala 大数据算法
在Scala中，数据类型转换是将一个类型的值转换为另一个类型的过程。Scala提供了多种数据类型转换的方式，包括自动类型转换（隐式转换）和显式类型转换。以下是Scala中数据类型转换的规则和方法的详细介绍：1.自动类型转换（隐式转换）Scala支持在某些情况下自动进行类型转换，这种转换通常是安全的，不会导致数据丢失。自动类型转换的规则如下：1.1数值类型的自动转换Scala支持从低精度数值类型向高
如何使用BeautifulSoup轻松解析网页内容？字节王德发 python beautifulsoup
在当今这个信息爆炸的时代，网络上有大量的数据等待我们去挖掘。如何从网页中提取我们需要的信息呢？使用Python的BeautifulSoup库，能够让这一过程变得简单而高效！接下来，我将带你走进BeautifulSoup的世界，教你如何进行网页解析。BeautifulSoup是什么？BeautifulSoup是一个Python库，专门用于从HTML和XML文件中提取数据。它能够将复杂的网页结构转化为
深入解析 Umi-OCR：高效的免费开源 OCR 文字识别工具萧鼎 python基础到进阶教程 ocr python Umi-OCR
1.Umi-OCR简介1.1什么是Umi-OCR？Umi-OCR是一款开源、免费、支持离线使用的光学字符识别（OCR）工具，基于PaddleOCR和Tesseract-OCR，能够高效识别图片中的文字，尤其适用于批量截图文字提取、PDF文字识别、手写体识别等应用场景。它具备轻量级、易用、支持多种格式等特点，在文字识别任务中表现优异。1.2Umi-OCR的核心特点完全免费开源：Umi-OCR在Git
简述KMP模式匹配算法，next函数和nextval函数 Lkkkkkkkcy c语言数据结构与算法字符串算法数据结构
KMP算法首先KMP算法是基于next函数而实现的，与BF算法相比，KMP算法是没有了主串指针回溯的情况。改进后的算法复杂度为O(m+n).KMP算法的简述每一次比较时，当子串与主串不相等的时候，主串的指针不回溯，而是通过next函数所求得的值当作下一位子串开始比较的位置。(即尽可能地向右边滑动一段的距离，从而减少比较的次数)。KMP算法匹配过程示例第一趟匹配： ababcabcac
常用的分布式 ID 设计方案梦城忆分布式
文章目录1.UUID2.数据库自增ID3.雪花算法4.Redis生成ID5.美团Leaf1.UUID原理：UUID是由数字和字母组成的128位标识符，通过特定算法随机生成，包括时间戳、计算机网卡地址等信息。常见的版本有版本1（基于时间戳和MAC地址）、版本4（纯随机数）等。优点：生成简单，本地生成，不需要依赖额外的组件或服务，能有效减少网络开销。全球唯一，基本能保证在任何场景下不会重复。缺点：长度
Spring使用JWT进行登录验证 PXM的算法星球 Java后端 spring java 后端
前情提要：由于这学期课设需要使用SSM技术栈，导致一些好用的登录框架无法适配，所以改用手写JWT进行登录验证JWT简介JSONWebToken(JWT)是一种用于在网络应用环境中进行用户身份验证和信息交换的开放标准。它通过将数据以JSON格式进行编码，使得信息在不同的系统和应用之间得以安全传递。JWT的主要特点是结构简洁且安全性高，广泛应用于单点登录（SSO）、API授权和用户身份认证。JWT由三
北京大学DeepSeek课程1《DeepSeek与AIGC应用》 daly520 AIGC 人工智能 ai python 深度学习机器学习
北京大学发布的《DeepSeek与AIGC应用》报告及配套教程，系统介绍了DeepSeek技术特性、AIGC应用场景及实践方法，主要包含以下核心内容：PDF完整版下载北京大学DeepSeek课程《DeepSeek与AIGC应用》下载https://ollama.net.cn/deepseek/14.html一、DeepSeek-R1模型的技术解析1.模型特性与优势DeepSeek-R1是一款专注于
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响 24K不怕分布式分布式ID Snowfake
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响分布式ID定义典型实现方案基于数据库自增序列的实现UUID方案Redis方案Snowflake方案Snowfake是否受冬令时切换影响分布式ID定义全局唯一：区别于单点系统的唯一，全局是要求分布式系统内唯一。有序性：通常都要保证生成的ID是有序递增的。例如，在数据库存储场景中，有序ID便于确定数据位置，往往更加高效。典型实现方案
提高SQL查询性能的7个法宝傻儿哥 ORACLE sql 数据库报表 sql server sybase 存储
【IT168专稿】每个数据库平台上的SQL开发人员都是在困难中求得生存，我们总是一次又一次犯同样的错误，这是因为数据库领域还相对不成熟，是的，每个数据库厂商都在做着各种不同的努力，但作为开发人员仍然要克服各种问题，无论是在SQLServer，Oracle，DB2，Sybase，MySQL数据库，还是其它关系数据库平台上编写SQL代码，并发性、资源管理、空间管理和SQL运行速度总是困扰着开发人员。遗
0基础学前端---品优购项目Day14 学代码的小前端 0基础学前端 javascript 前端 html css
0基础学前端—品优购项目Day14视频参考：B站Pink老师本节重点：all项目链接：完整的项目已放到品优购完整项目大家可以自行下载强调内容这里主要强调两个知识点：(1)网站TDK三个标签SEO优化(2)logoSEO优化网站TDK三个标签SEO优化T:title网站名（产品名）网站的介绍D:网站是做什么的K:关键字6~8个最好logoSEO优化（1）logo里面首先放一个h1标签，目的是为了提权
PythonWeb框架djiango第二章 _AndyLau 手把手学python django python
PythonWeb框架djiango第二章文章目录PythonWeb框架djiango第二章模版方式1（推荐）方式2render方法详解模版语法{{contxt中字典的key}}{%%}标签ifelifelseendif条件选择for{##}常用标签过滤器模版结构{%include"xxx.html"%}模版继承静态文件模型模型安装和配置单表crudMetaFieldAPI外键ForeignKey
Vue打印组件 _AndyLau vue.js
Vue打印组件vue-print-nb是一个用于Vue.js的轻量级打印插件，它允许你轻松地将页面或特定元素转换为可打印格式，并提供了额外的功能如预览和生成PDF。下面是使用vue-print-nb的步骤：安装首先，你需要通过npm或yarn来安装vue-print-nb。bash深色版本npminstallvue-print-nb--save#或者yarnaddvue-print-nb引入并注册
JAVA开发技术学习规划 —— 给未来20年技术领航者的你 _AndyLau 学习
亲爱的大学生朋友们，在这个信息爆炸、技术日新月异的时代，选择成为一名JAVA开发者，意味着你将踏入一个充满挑战与机遇的广阔天地。作为一位在JAVA开发领域深耕20年的老兵，我亲历了JAVA从诞生、成长到壮大的全过程，见证了它如何从一个新兴的语言逐渐发展成为企业级应用开发的首选。今天，我想将这份宝贵的经验凝聚成一份详实的技术学习规划，为即将踏上这条征途的你们，指引方向，助力你们在JAVA开发的道路上
腾讯云数据库 TencentDB for PostgreSQL常见问题的解答上云使者腾讯云知识分享腾讯云数据库 postgresql mysql sql
本页面提供关于云数据库PostgreSQL的一些常见问题的解答，如果您在使用过程中遇到问题，您也可以在文章中评论提问来寻求帮助。更多参阅腾讯云官方文档。腾讯云数据库TencentDBforPostgreSQL强大的计算性能、空间地理信息处理能力，面向企业复杂SQL处理的OLTP场景云数据库PostgreSQL简介腾讯云数据库PostgreSQL（TencentDBforPostgreSQL，云AP
Manus：中国AI创新力，开启通用智能体的新时代 YuKeeHgg Manus 人工智能 Manus
更多精彩内容可点击「华彬智融知识数据库」免费解锁～2025年3月6日，中国科技领域迎来里程碑式突破——由Monica.im团队研发的全球首款通用AI智能体产品“Manus”正式上线。这款被业界誉为“聪明实习生”的AI助手，凭借其自主执行复杂任务的能力，一夜之间引爆全球科技圈，推动A股AI相关板块大涨，软件ETF单日涨幅超3%。Manus的诞生不仅刷新了AI技术应用的高度，更标志着中国团队在智能体（
9.1 shell文本处理 Qiu_SaMa Linux Shell的学习 linux vim
通常shell脚本最大的用途就在于解析和显示文本文件中的数据，比如日志文件和错误文件。Linux环境包含了两个非常有用的工具：sed和gawk，两者都能够在shell脚本中处理文本数据。1.sed编辑器sed编辑器被称为流编辑器（streameditor），和普通的交互式文本编辑器恰好相反。在交互式文本编辑器中（如vim），可以用键盘命令来交互式地插入、删除或替换数据中的文本。流编辑器则会在编辑器
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：deathwknight@163.com）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

视频网站是怎么建成的--------JustinTV教你如何打造实时视频网站

你可能感兴趣的:(视频网站是怎么建成的--------JustinTV教你如何打造实时视频网站)