冯立彬

优酷、YouTube、Twitter及JustinTV视频网站架构设计笔记

本文是整理的关于优酷、YouTube、Twitter及JustinTV几个视频网站的架构或笔记，对于不管是视频网站、门户网站或者其它的网站，在架构上都有一定的参考意义，毕竟成功者的背后总有值得学习的地方，虽然有些文章的发表时间有点久了，但是看看对开阔视野还是有帮助的。

优酷视频网站架构

一、网站基本数据概览
据2010年统计，优酷网日均独立访问人数（uv)达到了8900万，日均访问量（pv）更是达到了17亿，优酷凭借这一数据成为google榜单中国内视频网站排名最高的厂商。
硬件方面，优酷网引进的戴尔服务器主要以 PowerEdge 1950与PowerEdge 860为主，存储阵列以戴尔MD1000为主，2007的数据表明，优酷网已有1000多台服务器遍布在全国各大省市，现在应该更多了吧。
二、网站前端框架
从一开始，优酷网就自建了一套CMS来解决前端的页面显示，各个模块之间分离得比较恰当，前端可扩展性很好，UI的分离，让开发与维护变得十分简单和灵活，下图是优酷前端的模块调用关系：

这样，就根据module、method及params来确定调用相对独立的模块，显得非常简洁。下面附一张优酷的前端局部架构图：

三、数据库架构
应该说优酷的数据库架构也是经历了许多波折，从一开始的单台MySQL服务器（Just Running）到简单的MySQL主从复制、SSD优化、垂直分库、水平sharding分库，这一系列过程只有经历过才会有更深的体会吧，就像MySpace的架构经历一样，架构也是一步步慢慢成长和成熟的。
1、简单的MySQL主从复制:
MySQL的主从复制解决了数据库的读写分离，并很好的提升了读的性能，其原来图如下：

其主从复制的过程如下图所示：

但是，主从复制也带来其他一系列性能瓶颈问题：
-写入无法扩展
-写入无法缓存
-复制延时
-锁表率上升
-表变大，缓存率下降
那问题产生总得解决的，这就产生下面的优化方案，一起来看看。
2、MySQL垂直分区
如果把业务切割得足够独立，那把不同业务的数据放到不同的数据库服务器将是一个不错的方案，而且万一其中一个业务崩溃了也不会影响其他业务的正常进行，并且也起到了负载分流的作用，大大提升了数据库的吞吐能力。经过垂直分区后的数据库架构图如下：

然而，尽管业务之间已经足够独立了，但是有些业务之间或多或少总会有点联系，如用户，基本上都会和每个业务相关联，况且这种分区方式，也不能解决单张表数据量暴涨的问题，因此为何不试试水平sharding呢？

3、MySQL水平分片（Sharding）
这是一个非常好的思路，将用户按一定规则（按id哈希）分组，并把该组用户的数据存储到一个数据库分片中，即一个sharding，这样随着用户数量的增加，只要简单地配置一台服务器即可，原理图如下：

如何来确定某个用户所在的shard呢，可以建一张用户和shard对应的数据表，每次请求先从这张表找用户的shard id，再从对应shard中查询相关数据，如下图所示：

但是，优酷是如何解决跨shard的查询呢，这个是个难点，据介绍优酷是尽量不跨shard查询，实在不行通过多维分片索引、分布式搜索引擎，下策是分布式数据库查询（这个非常麻烦而且耗性能）

四、缓存策略

貌似大的系统都对“缓存”情有独钟，从http缓存到memcached内存数据缓存，但优酷表示没有用内存缓存，理由如下：
避免内存拷贝，避免内存锁
如接到老大哥通知要把某个视频撤下来，如果在缓存里是比较麻烦的
而且Squid 的 write() 用户进程空间有消耗，Lighttpd 1.5 的 AIO(异步I/O) 读取文件到用户内存导致效率也比较低下。
但为何我们访问优酷会如此流畅，与土豆相比优酷的视频加载速度略胜一筹？这个要归功于优酷建立的比较完善的内容分发网络（CDN），它通过多种方式保证分布在全国各地的用户进行就近访问——用户点击视频请求后，优酷网将根据用户所处地区位置，将离用户最近、服务状况最好的视频服务器地址传送给用户，从而保证用户可以得到快速的视频体验。这就是CDN带来的优势，就近访问，有关CDN的更多内容，请大家Google一下。

这是一个完整的PDF：http://www.blogkid.net/qconppt/youkuqiudanqconbeijing-090423080809-phpapp01.pdf

转自：http://www.kaiyuanba.cn/html/1/131/147/7541.htm

YouTube网站架构

YouTube发展迅速，每天超过1亿的视频点击量，但只有很少人在维护站点和确保伸缩性。这点和PlentyOfFish类似，少数人维护庞大系统。是什么原因呢？放心绝对不是靠人品，也不是靠寂寞，下面就来看看YouTube的整体技术架构吧。
平台
1、Apache
2、Python
3、Linux(SuSe)
4、MySQL
5、psyco，一个动态的Python到C的编译器
6、lighttpd代替Apache做视频查看

状态

1、支持每天超过1亿的视频点击量
2、成立于2005年2月
3、于2006年3月达到每天3千万的视频点击量
4、于2006年7月达到每天1亿的视频点击量
5、2个系统管理员，2个伸缩性软件架构师
6、2个软件开发工程师，2个网络工程师，1个DBA

Web服务器

1，NetScaler用于负载均衡和静态内容缓存
2，使用mod_fast_cgi运行Apache
3，使用一个Python应用服务器来处理请求的路由
4，应用服务器与多个数据库和其他信息源交互来获取数据和格式化html页面
5，一般可以通过添加更多的机器来在Web层提高伸缩性
6，Python的Web层代码通常不是性能瓶颈，大部分时间阻塞在RPC
7，Python允许快速而灵活的开发和部署
8，通常每个页面服务少于100毫秒的时间
9，使用psyco(一个类似于JIT编译器的动态的Python到C的编译器)来优化内部循环
10，对于像加密等密集型CPU活动，使用C扩展
11，对于一些开销昂贵的块使用预先生成并缓存的html
12，数据库里使用行级缓存
13，缓存完整的Python对象
14，有些数据被计算出来并发送给各个程序，所以这些值缓存在本地内存中。这是个使用不当的策略。
    应用服务器里最快的缓存将预先计算的值发送给所有服务器也花不了多少时间。只需弄一个代理来监听更改，预计算，然后发送。

视频服务

1，花费包括带宽，硬件和能源消耗
2，每个视频由一个迷你集群来host，每个视频被超过一台机器持有
3，使用一个集群意味着：
   -更多的硬盘来持有内容意味着更快的速度
   -failover。如果一台机器出故障了，另外的机器可以继续服务
   -在线备份
4，使用lighttpd作为Web服务器来提供视频服务：
   -Apache开销太大
   -使用epoll来等待多个fds
   -从单进程配置转变为多进程配置来处理更多的连接
5，大部分流行的内容移到CDN：
-CDN在多个地方备份内容，这样内容离用户更近的机会就会更高
-CDN机器经常内存不足，因为内容太流行以致很少有内容进出内存的颠簸
6，不太流行的内容(每天1-20浏览次数)在许多colo站点使用YouTube服务器
-长尾效应。一个视频可以有多个播放，但是许多视频正在播放。随机硬盘块被访问
-在这种情况下缓存不会很好，所以花钱在更多的缓存上可能没太大意义。
-调节RAID控制并注意其他低级问题
-调节每台机器上的内存，不要太多也不要太少

视频服务关键点

1，保持简单和廉价
2，保持简单网络路径，在内容和用户间不要有太多设备
3，使用常用硬件，昂贵的硬件很难找到帮助文档
4，使用简单而常见的工具，使用构建在Linux里或之上的大部分工具
5，很好的处理随机查找(SATA，tweaks)

缩略图服务

1，做到高效令人惊奇的难
2，每个视频大概4张缩略图，所以缩略图比视频多很多
3，缩略图仅仅host在几个机器上
4，持有一些小东西所遇到的问题：
   -OS级别的大量的硬盘查找和inode和页面缓存问题
   -单目录文件限制，特别是Ext3，后来移到多分层的结构。内核2.6的最近改进可能让 Ext3允许大目录，但在一个文件系统里存储大量文件不是个好主意
   -每秒大量的请求，因为Web页面可能在页面上显示60个缩略图
   -在这种高负载下Apache表现的非常糟糕
   -在Apache前端使用squid，这种方式工作了一段时间，但是由于负载继续增加而以失败告终。它让每秒300个请求变为20个
   -尝试使用lighttpd但是由于使用单线程它陷于困境。遇到多进程的问题，因为它们各自保持自己单独的缓存
   -如此多的图片以致一台新机器只能接管24小时
   -重启机器需要6-10小时来缓存
5，为了解决所有这些问题YouTube开始使用Google的BigTable，一个分布式数据存储：
   -避免小文件问题，因为它将文件收集到一起
   -快，错误容忍
   -更低的延迟，因为它使用分布式多级缓存，该缓存与多个不同collocation站点工作
   -更多信息参考Google Architecture，GoogleTalk Architecture和BigTable

数据库

1，早期
   -使用MySQL来存储元数据，如用户，tags和描述
   -使用一整个10硬盘的RAID 10来存储数据
   -依赖于信用卡所以YouTube租用硬件
   -YouTube经过一个常见的革命：单服务器，然后单master和多read slaves，然后数据库分区，然后sharding方式
   -痛苦与备份延迟。master数据库是多线程的并且运行在一个大机器上所以它可以处理许多工作，slaves是单线程的并且通常运行在小一些的服务器上并且备份是异步的，所以slaves会远远落后于master
   -更新引起缓存失效，硬盘的慢I/O导致慢备份
   -使用备份架构需要花费大量的money来获得增加的写性能
   -YouTube的一个解决方案是通过把数据分成两个集群来将传输分出优先次序：一个视频查看池和一个一般的集群
2，后期
   -数据库分区
   -分成shards，不同的用户指定到不同的shards
   -扩散读写
   -更好的缓存位置意味着更少的IO
   -导致硬件减少30%
   -备份延迟降低到0
   -现在可以任意提升数据库的伸缩性

数据中心策略

1，依赖于信用卡，所以最初只能使用受管主机提供商
2，受管主机提供商不能提供伸缩性，不能控制硬件或使用良好的网络协议
3，YouTube改为使用colocation arrangement。现在YouTube可以自定义所有东西并且协定自己的契约
4，使用5到6个数据中心加CDN
5，视频来自任意的数据中心，不是最近的匹配或其他什么。如果一个视频足够流行则移到CDN
6，依赖于视频带宽而不是真正的延迟。可以来自任何colo
7，图片延迟很严重，特别是当一个页面有60张图片时
8，使用BigTable将图片备份到不同的数据中心，代码查看谁是最近的

学到的东西

1，Stall for time。创造性和风险性的技巧让你在短期内解决问题而同时你会发现长期的解决方案
2，Proioritize。找出你的服务中核心的东西并对你的资源分出优先级别
3，Pick your battles。别怕将你的核心服务分出去。YouTube使用CDN来分布它们最流行的内容。创建自己的网络将花费太多时间和太多money
4，Keep it simple！简单允许你更快的重新架构来回应问题
5，Shard。Sharding帮助隔离存储，CPU，内存和IO，不仅仅是获得更多的写性能
6，Constant iteration on bottlenecks：
   -软件：DB，缓存
   -OS：硬盘I/O
   -硬件：内存，RAID
7，You succeed as a team。拥有一个跨越条律的了解整个系统并知道系统内部是什么样的团队，如安装打印机，安装机器，安装网络等等的人。
   With a good team all things are possible。

转自：http://www.kaiyuanba.cn/html/1/131/147/7540.htm

Twitter网站架构

一、twitter网站基本情况概览
截至2011年4月，twitter的注册用户约为1.75亿，并以每天300000的新用户注册数增长，但是其真正的活跃用户远远小于这个数目，大部分注册用户都是没有关注者或没有关注别人的，这也是与facebook的6亿活跃用户不能相提并论的。
twitter每月有180万独立访问用户数，并且75%的流量来自twitter.com以外的网站。每天通过API有30亿次请求，每天平均产生5500次tweet，37%活跃用户为手机用户，约60%的tweet来自第三方的应用。
平台：Ruby on Rails 、Erlang 、MySQL 、Mongrel 、Munin 、Nagios 、Google Analytics 、AWStats 、Memcached
下图是twitter的整体架构设计图：

二、twitter的平台
twitter平台大致由twitter.com、手机以及第三方应用构成，如下图所示：

其中流量主要以手机和第三方为主要来源。
Ruby on Rails：web应用程序的框架
Erlang：通用的面向并发的编程语言，开源项目地址：http://www.erlang.org/
AWStats：实时日志分析系统：开源项目地址：http://awstats.sourceforge.net/
Memcached：分布式内存缓存组建
Starling：Ruby开发的轻量级消息队列
Varnish：高性能开源HTTP加速器
Kestrel：scala编写的消息中间件，开源项目地址：http://github.com/robey/kestrel
Comet Server：Comet是一种ajax长连接技术，利用Comet可以实现服务器主动向web浏览器推送数据，从而避免客户端的轮询带来的性能损失。
libmemcached：一个memcached客户端
使用mysql数据库服务器
Mongrel：Ruby的http服务器，专门应用于rails，开源项目地址：http://rubyforge.org/projects/mongrel/
Munin：服务端监控程序，项目地址：http://munin-monitoring.org/
Nagios：网络监控系统，项目地址：http://www.nagios.org/
三、缓存
讲着讲着就又说到缓存了，确实，缓存在大型web项目中起到了举足轻重的作用，毕竟数据越靠近CPU存取速度越快。下图是twitter的缓存架构图：

大量使用memcached作缓存
例如，如果获得一个count非常慢，你可以将count在1毫秒内扔入memcached
获取朋友的状态是很复杂的，这有安全等其他问题，所以朋友的状态更新后扔在缓存里而不是做一个查询。不会接触到数据库
ActiveRecord对象很大所以没有被缓存。Twitter将critical的属性存储在一个哈希里并且当访问时迟加载
90%的请求为API请求。所以在前端不做任何page和fragment缓存。页面非常时间敏感所以效率不高，但Twitter缓存了API请求
在memcached缓存策略中，又有所改进，如下所述：
1、创建一个直写式向量缓存Vector Cache，包含了一个tweet ID的数组，tweet ID是序列化的64位整数，命中率是99%
2、加入一个直写式行缓存Row Cache，它包含了数据库记录：用户和tweets。这一缓存有着95%的命中率。
3、引入了一个直读式的碎片缓存Fragmeng Cache，它包含了通过API客户端访问到的sweets序列化版本，这些sweets可以被打包成json、xml或者Atom格式，同样也有着95%的命中率。
4、为页面缓存创建一个单独的缓存池Page Cache。该页面缓存池使用了一个分代的键模式，而不是直接的实效。
四、消息队列
大量使用消息。生产者生产消息并放入队列，然后分发给消费者。Twitter主要的功能是作为不同形式(SMS，Web，IM等等)之间的消息桥
使用DRb，这意味着分布式Ruby。有一个库允许你通过TCP/IP从远程Ruby对象发送和接收消息，但是它有点脆弱
移到Rinda，它是使用tuplespace模型的一个分享队列，但是队列是持久的，当失败时消息会丢失
尝试了Erlang
移到Starling，用Ruby写的一个分布式队列
分布式队列通过将它们写入硬盘用来挽救系统崩溃。其他大型网站也使用这种简单的方式
五、总结
1、数据库一定要进行合理索引
2、要尽可能快的认知你的系统，这就要你能灵活地运用各种工具了
3、缓存，缓存，还是缓存，缓存一切可以缓存的，让你的应用飞起来。

部分转自：http://timyang.net/architecture/twitter-cache-architecture/

这里还有一份根据英文翻译的：http://hideto.iteye.com/blog/130044

JustinTV网站架构

Justin.TV每月有3000万个独立访问量，在游戏视频上传领域打败了YouTube ，他们每天每分钟新增30个小时的视频，而YouTube只有23。

下面从Justin.TV的实时视频系统使用到的平台，他们的架构细节，从他们身上应该学到的东西等几个方面逐一展开。

使用到的平台

Twice —— 代理服务系统，主要用缓冲优化应用服务器负载
XFS —— 文件系统
HAProxy —— 用于TCP/HTTP负载平衡
LVS stack and Idirectord —— 高可靠性
Ruby on Rails —— 应用服务器系统
Nginx —— web服务器系统
PostgreSQL —— 数据库，用于用户和meta数据
MongoDB —— 数据库，用于内部分析
MemcachedDB —— 数据库，用于存放经常要修改的数据
Syslog-ng —— 日志服务系统
RabitMQ —— job系统
Puppet —— 创建服务
Git —— 源代码管理
Wowza —— Flash/H.264视频服务器和许多Java写的custome modules
Usher —— 播放视频流的逻辑控制服务器
S3 —— 用于存储小型镜像

Justin.TV的一些统计数据

有覆盖全美的4个数据中心
在任何时候都有2000多个同时流入的数据流
每天每分钟新增30个小时的视频
每月有3000万个独立访问量（不计同一用户多次访问）
每秒实时的网络流量在45G左右

实时视频结构详述

实时视频结构

1.使用了P2P和CDN

一般人认为，只需要不断提高带宽，把传来的数据都放入内存，不断的接收数据流就可以了，事实并非如此。实时视频要求不能打断，这就意味着你不可以超负荷的使用带宽。YouTube只需要让播放器缓冲一下，就可以用8G的带宽解决10G通道的需求，但在实时视频里，你不能缓冲，如果在信道上的流量超过了它的传输能力，哪怕只是一瞬间，那么所有的正在看的用户在那一刻都会卡。如果你在它的极限能力上再加入了一点儿负载，所有人立刻就会进入缓冲状态。

Justin.TV使用了点对点的结构来解决这个问题，当然他们也有更好的解决办法，CDN（内容分发网络）便是之一。当用户的流量负载超过Justin.TV的负载能力时，Justin.TV便很巧妙的将超标流量引入到一个CDN中去，Usher控制着这个处理逻辑，一旦接到了超标用户的负载请求，Usher便立刻将这些新用户转发到CDN中去。

2.100%可用时间和维护的矛盾

实时视频构建的系统既要保证100%的可用时间，又要保证机器可以进行维护。与一般网站不同，一般网站维护时出现的问题只有少数人会发现、关注，而实时视频网站不同，用户很快就会发现维护时带来的任何问题，并且互相传播的非常快。这就使得没有什么问题可以隐瞒用户，面对现在用户的挑剔，你必须避免维护时出问题。对一个服务器维护时，你不能主动结束用户的进程，必须等待所有在这个服务器上的用户自己结束服务才能开始，而这个过程往往非常缓慢。

3.Usher与负载均衡

Justin.TV遇到的最大的麻烦是即时拥塞，当大量的用户同时看同一个栏目的时候，便会突然产生突发网络拥塞。他们开发了一个实时的服务器和数据中心调度系统，它就是Usher。

Justin.TV的系统在突发的高峰拥塞上做了很多。他们的网络每秒可以处理大量的链入连接。用户也参与了负载均衡，这也是Justin.TV需要用户使用Justin.TV自己的播放器的原因之一。至于TCP，由于它的典型处理速度就是百kbps级的，所以也不用对TCP协议做什么修改。

相对于他们的流量，他们的视频服务器看来来有些少，原因是他们可以使用Usher把每个视频服务器的性能发挥到最好，负载均衡可以确保流量从不会超过他们的负载极限。负载大部分是在内存中，因此这个系统可以让网络的速度发挥到极限。服务器他们是一次从Rackable(SGI服务器的一个系列)买了一整套，他们做的仅仅是从所有预置的里面做了下挑选。

Usher是Justin.TV开发的一款定制化软件，用来管理负载平衡，用户认证和其他一些流播放的处理逻辑。Usher通过计算出每个流需要多少台服务器提供支持，从而分配资源，保证系统处于最优状态，这是他们的系统和别家不同之处。Usher通常会从下面几个指标计算、衡量某个流媒体所需要的服务器：

每个数据中心的负载是多少
每个服务器的负载是多少
延迟优化的角度
当前这个流可用的服务器列表
用户的国家（通过IP地址获得）
用户是否有可用的对等网（通过在路由数据库中查询IP地址获得）
请求来自于哪个数据中心

Usher使用这些指标便可以在服务净成本上来优化，把服务放在比较空闲的服务器上，或者把服务放在离用户较近的服务器上，从而给用户带来更低的延迟和更好的表现。Usher有很多个可以选择的模式从而达到很细的控制粒度。

Justin.TV系统的每个服务器都可以做边缘服务器，直接为用户输出视频流，同时每个服务器也可以做源服务器，为其他服务器传递视频流。这个特性，使得视频流的负载结构成了动态的，经常改变的一个过程。

4.服务器形成了加权树

服务器之间由视频流的拷贝而产生的联系和加权树非常相似。数据流的数量经常被系统取样、统计，如果观看某个视频流的用户数量飞速上涨，系统便将其拷贝很多份到一些其他的服务器上去。这个过程反复执行，最终就形成了一个树状的结构，最终会将网络中所有的服务器都画在里面。Justin.TV的视频流从源服务器出发，被拷贝到其他服务器，或者拷贝到用户的整个过程中，都处于内存中，没有硬盘路径的概念。

5.RTMP和HTTP

Justin.TV尽可能的使用了Flash，因为它使用RTMP协议，对每个视频流，系统都有一个独立的Session去维护它。由于使用这个协议，成本就相当高。由于ISP不支持下载流，因而无法使用多路广播和P2P技术。Justin.TV确实想过用多路广播在内部服务器之间拷贝数据流，然而由于他们的系统控制覆盖整个网络，而且内部有大量的很便宜的带宽可以使用，这样使用多路广播的技术就并没有产生多少效益。同时，由于他们的优化算法是将每个服务器上的流数都最小化，这就使得在很细的力度上做些事情会非常麻烦，甚至超过了他们能得到收益。

Justin.TV的Usher使用HTTP请求去控制某个服务器负载哪个视频流，从而控制了服务的拓扑结构。Justin.TV在流数据上使用HTTP，但存在的一个问题是它没有延迟和实时方面的性能。有些人说实时的定义就是5-30秒，然而，面对数千人做实时视频的时候这显然不行，因为他们还需要实时的讨论，交流，这意味着延迟不能高于1/4秒。

6.从AWS到自己的数据中心

起初Justin.TV使用AWS，后来迁移到Akamai（云服务供应商），最后到了自己的数据中心。

离开AWS到Akamai的原因有：1，成本；2，网速不能满足他们的需求。视频直播对带宽非常敏感，因此有一个快速的，可靠的，稳定的和低延迟的网络非常关键。使用AWS时，你不能控制这些，它是一个共享的网络，常常超负载，AWS的网速不会比300Mbps更快。他们对动态范围改动和云API很重视，然而在性能和成本问题上没有做什么。

3年前，Justin.TV计算他们每个用户的成本，CDN是$0.135，AWS是0.0074，Datacenter是$0.001如今，他们的CDN成本降低了，但他们的数据中心的成本却仍然一样。

拥有多个数据中心的关键是为了能够接近所有的主要交换节点，他们选择国内最好的位置从而使得他们为国内最多的节点提供了入口，而且节约了成本，构建了这些数据中心后，他们就直接连入了这些其他的网络，从而就省去了之前处理这些中转流量的费用，还提高了性能，他们直接连入了他们所谓的"eyeball"网络，这个网络中包含了大量的cable/DSL用户，和"content"网络连接有些类似，Justin.TV的"eyeball"连接的流量主要来自终端用户，在大多数情况下，这些都是免费的，不用任何花一分钱，要做的就是连进来就行。Justin.TV有一个主干网，用于在不同的数据中心传输视频流，因为要到一个可用节点的选拔过程是去找愿意和你做对等节点的过程，这通常是很困难的。

7.存储

视频流不是从磁盘形成，而是要存到磁盘上去。源服务器将一个传入的视频流在本地磁盘上复制一份，之后便将这个文件上传到长期存储器上，视频的每一秒都被录下来并且存档了。

存储设备和YouTube类似，就是一个磁盘库，使用XFS文件系统。这个结构用于记录通过服务器传播的广播。默认的视频流是保存7天，用户可以手动的设置，甚至你可以保存到永远（如果公司没有倒闭的话）。

8.实时转码

增加了实时的转码功能，可以将任何一种流式数据转化为传输层数据或者是代码，并且可以用新的格式将它重新编为流媒体。有一个转码集群，用来处理转换工作转，换的会话使用job系统进行管理。如果需要的转码服务超过了集群的处理能力，那所有的服务器都可以用作转码服务器。

Web结构

Web 结构

1.Justin.TV前端使用Ruby on Rails。

2.用Twice做缓存

系统个每个页面都使用了他们自己定制的Twice缓存系统，Twice扮演的角色是轻量级反向代理服务器和模板系统的合并角色。思路是对每一个用户，缓存每一个页面，然后将每个页面的更新再并入其中。使用Twice以后，每个进程每秒可以处理150条请求，同时可以在后台处理10-20个请求，这就扩展了7-10倍之前的服务器可以处理的网页的数量。大部分动态网页访问都在5ms以内。Twice有一个插件结构，所以它可以支持应用程序的一个特点，例如添加地理信息。

不用触及应用服务器，便能自动缓存像用户名一样的数据。

Twice是一个为Justin.TV的需求和环境而定制化开发的。如果开发一个新的Rails应用，使用Varnish或许是一个更好的主意。

3.网络流量由一个数据中心服务，其他的数据中心为视频服务。

4.Justin.TV 对所有的操作都做了监控.每一个点击，查看页面和每一个动作都被记录下来，这样就可以不断提高服务。前端，网络呼叫或者一个应用服务器的日志消息都被转换成系统日志消息，通过syslog-ngto转发。他们扫描所有的数据，将它装入MongoDB，使用Mongo执行查询。

5.Justin.TV的API来自网站的应用服务器，它使用相同缓冲引擎，通过扩展网站来扩展他们的API。

6.PostegreSQL是他们最主要的数据库。结构是简单的主从结构，由一个主机和多个从属读数据库组成。

由于他们网站的类型，他们不需要许多写数据库，缓冲系统控制着这些读数据库。他们发现PostgreSQL并不擅长处理写操作，因此Justin.TV就是用MemcachedDB去处理那些经常要写的数据，例如计数器。

7.他们有一个聊天服务器集群，专门用来为聊天功能服务。如果用户进入了一个频道，用户就会有5个不同的聊天服务器为他服务，扩展聊天功能要比扩展视频功能简单的多，用户可以被划分到不同的房间，这些房间又由不同的服务器负载。他们也不会让100,000个人同时在一起聊天。他们限制每个房间200人，这样就可以在一个小组里进行更有意义的交谈。这同时对扩展也很有帮助，这真的是一个很聪明的策略。

8.AWS用于存储文档镜像。他们没有为存储许多小镜像而开发专门的系统，他们使用了S3。它非常方便，而且很便宜，这就不用在他们上面花更多的时间了。他们的镜像使用频率很高，所有他们是可缓冲的，也没有留下什么后续问题。

网络拓扑结构设计

网络拓扑结构非常简单，每个服务器机架顶都有一对1G的卡，每个机架都有多个10G的接口，接口连接到外部的核心路由器。他们使用Dell Power Edge交换机，这些交换机对L3（TCP/IP）并不是完全支持，但是比L2（ethernet）要好的多。每个交换机每天要传输20G的数据，而且很便宜。核心路由器是思科的6500的系列。Justin.TV想要将节点最小化，从而让延迟降低，并且降低每个packet的处理时间。Usher管理着所有的接入控制和其他的逻辑，而不仅仅限于网络硬件。

使用多个数据中心可以充分利用对等网的优势，把流量转移到离用户最近的地方。和其他的网络和节点的连接非常多。这样就有多个可选的传输途径，所以可以使用最好的那个路径。如果他们遇到了网络的拥塞，就可以选择一条别的路。他们可以通过IP地址和时间，找到对应的ISP。

开发和部署

他们使用Puppet服务器主机，有20中不同种类的服务器。从数据库中出来的任何东西都要经过缓存器，使用Puppet他们可以把这个缓存器变成他们想要的任何东西。

他们有两个软件队伍。一个是产品队伍，另一个是硬件基础设施队伍。他们的队伍非常小，大概每个队伍只有7-8个人，每个队伍都有一个产品经理。他们雇佣一般的技术员，但却雇佣了网络结构和数据库相关的专家。

他们使用了基于网络的开发系统，所以每个新的改动都会在几分钟内完成。QA必须在变成产品之前完成，在这里通常需要5-10分钟。

Justin.TV使用Git管理源代码。Justin.TV喜欢Git的这个功能，你可以写一个程序副本，20-30行，然后它可以融合到其他人手里正在修改的副本。这个工作是独立的，模块化的。在你不得不撤销你提交的副本时，你可以很容易就修改或者撤销你的代码。每过几天每个人都会试着将自己的代码副本融入到主代码中去消除冲突。他们每天对软件做5-15个修改，范围从1行代码中的bug到大范围的测试都有。

数据库模式通过手动更新完成。将他们复制的数据库副本迁移到一起就会形成一个最新的动态记录的版本。在把改动最终应用到产品之前会在许多不同的环境下对其进行测试。

Puppet管理配置文件。每个小的改动基本上就是一个实验，他们会追踪每个对核心文件的改动的影响和之前的版本。这些测试很重要，因为通过它他们可以找出哪些改动是真正提高他们关心的指标。

Justin.TV的未来

他们的目标是增加一个数量级。首先要切分他们的视频元数据系统，由于流数据和服务器的大幅增长，他们的元数据负载也指数级的爆发增长，因此，他们需要将其大范围进行切分，对于网络数据库，将使用Cassandra对其进行拆分。其次，为了灾后恢复，要对核心数据中心进行备份。

学到的东西

自己开发还是购买。他们在这个问题上已经做了很多错误的决策。例如，他们起初应该买一台视频服务器而不是自己去做了一台。软件工程师喜欢将软件做的个性化，然后使用开源社区维护的东西却有很多益处。因此他们提出了一个更好的流程去做这个决定：1.这个项目是活动？还是维护？还是修补漏洞？2.有其他的人要用它么？你能向别人请教下该如何定义它？3.扩展性的问题，他们必须去做改变。4.如果我们自己开发，我们可以做到更快，更好，还是我们可以获得更多我们需要的特性呢？就像使用Usher，他们考虑他们可否创造一个新的外部特性，并且和另外一个系统交互。把Usher做为视频扩展性的核心针对相对笨拙的视频服务器来说是一个非常好的决策的例子。
关注自己做的事情，不要在意别人怎么干。他们的目标是有用最好的系统，最多的服务时间和最完美的扩展性。他们用了3年去开发能管理百万个广播并发的技术。
不要外包。你学到的核心价值在于经验，而不是代码或者硬件。
把一切都当做实验来做。对所有的东西都进行测量，局部测试，追踪，测量。这很划算。从一开始就做，使用优秀的测量工具。例如，他们在复制的URL上附加一个标签，然后就可以知道你是否分享了这个链接。他们从不测量的走到了如今高度测量。通过重写广播进程，使得他们的会话数量增长了700%。他们想要网站运行更快，响应更快，网页装载更快，视频服务更好，系统挤出的每一毫秒的延迟都带来了更多的广播者。他们有40个实验，如果他们希望让一个用户变成一个广播者，对每个实验他们都想要看一下广播后的留存率，广播的可用性，会话率，然后对每个改动都做一个明智的决策。
最重要的一件事是理解你的网站如何共享服务，怎么优化它。他们通过减少共享的链接在菜单中的深度，成功的提高了500%的分享率。
使用公共的构建模块和基础设施意味着系统将立刻识别什么是重要的，然后执行。具有网络能力很重要，这也是他们应该从开始就关注的地方。
让系统忙起来。使用系统的所有能力，为什么要把钱放在桌子上呢？构建可以通过应答对系统进行合理的分配的系统。
对不重要的事情不要浪费时间。如果它非常方便并且不用花费多少，就没有必要在它上面花费时间。使用S3去存储镜像就是一个很典型的例子。
试着为用户想做的事情提供支持，而不是做你认为用户该这样使用的东西。Justin.TV的终极目标似乎是把所有人都变成一个广播点。在用户实验时，通过尽可能的走出用户的使用方式，他们试着让这个过程变得尽可能简单。在这过程中，他们发现，游戏是一个巨大的作用力。用户喜欢将Xbox截图出来，并且与大家分享，讨论它，很有可能有些东西是你没想过要放在商务计划里的。
为负载峰值做设计。如果你只为了静态的状态做了设计，之后你的网站将会在峰值来临时垮掉。在实时视频上，这通常是一个大事，如果你陷入了这个麻烦，很快人们就开始传播对你不利的话。为峰值负载进行设计需要使用一个所有层次的技术。
让网络结构保持简单。使用多数据中心，使用点对点网络连接结构。
不要担心将东西划分到更多的可扩展块中去。例如，与其使用一个100,000人的频道，不如将他们划分到更多的社会和可扩展的频道去。
实时系统不能隐藏来自用户的任何问题，这就是的说服用户你的网站很可靠变的很困难。由于他们和实时系统之间的联系是固定的，这会使的系统的每个问题和故障都让大家知道，你藏不住。每个人都会发现，并且每个人都会通过交流传播发生了什么，很快，用户就会有一个你的网站有很多问题的感觉。在这种情况下，和你的用户交流就变得很重要，从一开始就构建一个可信赖的，高质量的，可扩展的，高性能的系统，设计一个用户用起来尽可能简单和舒服的系统。（编译：@康文博/审校：仲浩）

摘自： http://www.csdn.net/article/2012-11-23/2812183-JustinTV_real-time_architecture

你可能感兴趣的:(系统架构,优酷,youtube,twitter,justInTV,网站架构)

聊聊 iframe：网页中的“窗口”是怎么回事？结城前端前端 html
在网页开发中，是一个挺常见但又有点“低调”的HTML标签。你可能在浏览网页时见过它，比如嵌入的YouTube视频、地图，或者一些外部的小工具。它就像网页里开了一扇小窗口，能把另一个网页的内容嵌进来。今天就来聊聊iframe的前世今生、怎么用、包括srcdoc的妙用，它在微前端、传统后端开发、打印场景、通信机制中的应用，以及如何防止别人用iframe内嵌你的网站，尽量说得自然又接地气。iframe是
我是家庭总动员 b66c6f1f6d41
收到消息，4月25日全国75个城市71场辟谷营开班，我动员了我爸和我二姐一起去参加这次辟谷营。二姐在江苏参加，我带爸爸在南宁参加，不过我们学习的内容都是一样的，因为上次学习了这些内容后收益匪浅，所以回家后和爸爸沟通了。图片发自App清明节回家扫墓，我和爸爸沟通一下，我说：“爸，你相信吸引力法则吗？”我爸一脸茫然，好吧，我知道我爸听不懂什么叫吸引力法则，于是给他解释了一通，然后还给他在优酷视频里能找
12306系统架构的演进
演进过程12306系统架构的演进是中国铁路信息化建设的重要里程碑，其核心围绕高并发处理、数据一致性保障、跨地域容灾三大挑战展开。以下是其分阶段的技术演进过程：第一阶段：单机架构与双机热备（2011年）背景2011年上线初期，12306仅支持京津城际列车购票，日均售票量不足百万。系统采用传统单体架构，依赖小型机和集中式数据库，缺乏分布式设计。架构特点技术栈：JavaServlet+JSP+Sybas
Unity VR多人手术模拟恢复2：客户端移动同步问题分析与解决方案马特说 unity vr 游戏引擎
UnityVR多人手术模拟恢复2：客户端移动同步问题分析与解决方案问题背景在开发基于UnityMirror网络架构的VR多人手术模拟系统时，我们遇到了一个复杂的客户端移动同步问题：主要操作者（第一个客户端）：VR设备，拥有完整权限，可以控制手术工具观察者客户端（第二个及以上客户端）：桌面模式，观看模式，应该能使用WASD进行移动问题现象：观察者客户端无法使用WASD移动，但鼠标视角控制正常系统架构
新版进销存管理系统完整教程：PB9.0与SQL Server 2000的实战应用语嫣凝冰
本文还有配套的精品资源，点击获取简介：本文档提供了一个基于PowerBuilder9.0和SQLServer2000开发的进销存管理系统的全面教程。系统涵盖了企业管理中的采购、销售和库存管理环节，通过强大的数据窗口组件和三层架构设计，实现了业务逻辑和数据库的有效交互。文章详细解释了系统的技术栈、核心功能、系统架构、数据窗口组件、数据库设计、报表分析及权限安全管理等关键点，旨在帮助用户深入理解进销存
三层架构 vs SOA vs 微服务：该选谁？ Echo_Wish 架构运维实战：高可用与高性能架构微服务云原生
三层架构vsSOAvs微服务：该选谁？一、从单体到分布式：架构演进的必然性最早的系统架构通常是单体架构（MonolithicArchitecture），所有功能都打包在一个应用里，部署方便，但扩展性和灵活性有限。后来，为了让系统更具可维护性，三层架构成为主流。但当业务变得复杂，单纯的三层架构不再够用，SOA应运而生，再到后来的微服务，都是在解决“架构如何更灵活、可扩展、好维护”这个核心问题。那么，
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
聚合cps+cpa分销系统开发实战：覆盖多领域的CPS+CPA双模式技术架构解析
引言在数字经济时代，聚合分销系统通过整合CPS（按销售分成）与CPA（按行动付费）双模式，为短剧、小说、外卖、电商、网盘、APP拉新等领域提供了高效的商业变现解决方案。本文结合微服务架构、中台化设计及实战案例，深度解析该系统的技术实现与架构设计。系统架构设计微服务与中台化双引擎采用SpringCloudAlibaba框架构建分布式微服务架构，将系统拆分为8大核心服务：mermaidgraphTDA
软考热门科目全套学习资料启航挨踢软考资料整理笔记
软考热门科目学习资料免费分享，包括：系统集成项目工程师、数据库系统工程师、软件设计师、信息系统项目管理师、系统架构师等科目的教材、视频教程、历年真题，需要的小伙伴自取。资料来自互联网整理，如有侵权，请联系删除！通过百度网盘分享的文件：（软考中级）信息系统管理工程师链接:https://pan.baidu.com/s/1mCdZSIJHIDcd8g1TY3rAag?pwd=ywxd提取码:ywxd通
基于Spring Boot的超市管理系统详细设计方案漫逗科技 spring boot 后端 java 毕业设计课程设计毕设
基于SpringBoot的超市管理系统详细设计方案1.系统总体设计1.1系统架构图┌─────────────────────────────────────────────────┐│客户端层││┌───────────┐┌───────────┐┌───────────┐│││Web端││移动端App││POS终端│││└───────────┘└───────────┘└──────────
《亿级流量系统架构设计与实战》通用高并发架构设计读场景 Momentary_SixthSense 系统架构 mysql redis 架构
高并发架构设计的要点场景分类读多写少、写多读少，读多写多高并发读场景方案1：数据库读/写分离数据库承受的高并发请求压力，主要来自读请求。我们可以把数据库按照读/写请求分成专门负责处理写请求的数据库（写库）和专门负责处理读请求的数据库（读库），让所有的写请求都落到写库，写库将写请求处理后的最新数据同步到读库，所有的读请求都从读库中读取数据。这就是数据库读/写分离的思路。数据库读/写分离使大量的读请求
《亿级流量系统架构设计与实战》MySQL高可用架构 Momentary_SixthSense 系统架构 mysql 架构
主从模式一台MySQL服务器作为Master（主节点）,若干MySQL服务器作为Slave（从节点）。在正常情况下，只有Master处理写数据请求，同时Master与Slave通过主从复制技术保持数据一致。当Master发生故障宕机时，某个Slave会被提升为Master继续对外提供服务。主从复制技术：当Master数据发生变更(包括新增、删除、修改等操作)时，Master将数据的变更日志写入二进
服务化架构、SOA 与微服务：关系、演进与实战落地全解析要阿尔卑斯吗. 架构微服务云原生
在分布式系统架构面试中，面试官常常会问到一个核心问题：“你能说说服务化架构、SOA和微服务之间到底是什么关系吗？有什么区别？”这并不是一个单纯的理论问题，而是对开发者系统认知和实践经验的综合考察。今天，我们将系统梳理这个话题，结合架构演进历史、核心设计理念、技术实现路径及落地经验，帮助大家理清服务化架构的发展脉络，走好系统设计之路。一、什么是服务化架构？它与SOA、微服务是什么关系？首先需要明确一
基于Python的Twitter Card数据爬取与分析实战：从入门到精通 Python爬虫项目 python twitter dreamweaver 自动化开发语言宽度优先爬虫
摘要本文详细介绍了如何使用Python最新技术栈构建一个高效的TwitterCard数据爬虫系统。我们将从TwitterCard的基本概念讲起，逐步深入到爬虫架构设计、反爬策略应对、数据解析与存储等核心环节。文章包含完整的代码实现，使用Playwright+Asyncio的高性能爬取方案，以及数据分析与可视化的实战案例。通过本文，读者将掌握大规模社交媒体数据采集的关键技术，并能够将这些技术应用于实
Python爬虫实战：高效解析OpenGraph协议数据 Python爬虫项目 python 爬虫开发语言宽度优先音视频 json
OpenGraph协议简介OpenGraph协议是由Facebook于2010年推出的一种网页元数据标准，旨在使任何网页都能成为社交图中的丰富对象。通过在网页的部分添加特定的标签，网站所有者可以控制内容在社交媒体上分享时的呈现方式。OpenGraph协议的核心元数据包括：html这些标签不仅被Facebook使用，也被Twitter、LinkedIn、WhatsApp等主流社交平台广泛支持。据统计
尋找靈魂之旅——靈性旅程 e6d9a01d355b
今天我在youtube上看了幾個videos，有些感慨。影片的內容是一個加拿大靈媒，她從小體質異於常人，可以看到另外世界或另外軌道的東西。她講述到人是否有輪迴，上輩子是否存在過。要怎麼找到上輩子活過的證據，那就是，你仔細在腦海里回憶，你是否有對那一種東西沒有理由沒有源頭的喜愛或者厭惡，譬如，你喜歡法語或者法國文化，而這種喜歡完全沒有任何來由，你不曉得為什麼喜歡，那麼這就是你上輩子是法國人或者在法國
计算机毕设——高校在线学习平台
随着教育信息化改革不断推进，传统教学模式逐渐暴露出诸多弊端，例如资源分散、互动匮乏、教学反馈滞后等。如何借助现代Web技术构建一个功能完善、稳定高效的教学平台，成为许多高校面临的重要课题。本文将从我的毕业设计项目《在线学习平台》出发，分享一个完整在线教育平台的设计与开发过程，涵盖技术选型、系统架构、核心模块实现以及系统测试等内容，适合对SpringBoot+Vue全栈开发感兴趣的同学学习参考。一、
从零开始学 Linux：循序渐进的学习指南我爱学嵌入式 Linux基础 linux 服务器
Linux作为一款开源、稳定且安全的操作系统，在服务器领域、嵌入式开发、云计算等场景中占据着举足轻重的地位。对于程序员、运维工程师或IT爱好者而言，掌握Linux技能已成为一项核心竞争力。但面对命令行界面和复杂的系统架构，很多初学者往往感到无从下手。本文将为你梳理一条清晰的Linux学习路径，助你从入门到精通。一、明确学习目标：为什么学Linux？学习Linux前需明确目标，不同目标对应不同的学习
智界R7智驾功能和性能评价 TheWanderers 智能驾驶智界
一、智驾行车能力标题硬件配置与系统架构感知硬件：Max/Ultra版搭载1个192线激光雷达、3个毫米波雷达（含1个4D成像雷达）、12个超声波雷达、11个高清摄像头（含前向800万像素双目+鱼眼镜头）。Pro版未配备激光雷达，但保留3个毫米波雷达和10个摄像头。核心算法：HUAWEIADS3.0系统，基于端到端架构，整合感知、决策与控制模块，支持全场景目标识别（如非标准障碍物、夜间行人）。算力支
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
深度学习方法生成抓取位姿与6D姿态估计的完整实现 ZPC8210 ROS 深度学习人工智能
如何将GraspNet等深度学习模型与6D姿态估计集成到ROS2和MoveIt中，实现高精度的机器人抓取系统。1.系统架构text[RGB-D传感器]→[物体检测与6D姿态估计]→[GraspNet抓取位姿生成]→[MoveIt运动规划]→[执行抓取]2.环境配置2.1安装依赖bash#安装PyTorch(根据CUDA版本选择)pip3installtorchtorchvisiontorchaud
系统架构设计师教程第二章计算机系统基础知识-2.9 系统性能 AncleLeen 软考-系统架构设计师-学习路线系统架构软考-系统架构师
系统架构设计师教程第二章计算机系统基础知识-2.9系统性能2.9.1.性能指标2.9.1.1计算机的性能指标2.9.1.2路由器的性能指标（了解即可）2.9.1.3交换机的性能指标（了解即可）2.9.1.4网络的性能指标2.9.1.5操作系统的性能指标2.9.1.6数据库管理系统的性能指标2.9.1.7Web服务器的性能指标2.9.2.性能计算2.9.3.性能设计2.9.3.1性能调整2.9.3.
早安分享20200901——寻路的使命做好这三件事吃草的狮子_李程
发展教练合伙人：自我教练与教练他人能力；现工作及企业的发展能力；教练业务拓展的系统架构。寻路魔创的核心使命，长期坚持必有成果！李程
2018-08-25 周六竹村浪里个郎
爱范儿今天搞怀旧，弄了一篇谈饭否的文章。我07年8月有的饭否，比我用Twitter还早。刚想去登陆看看，账号邮箱和密码忘了，因为当时邮箱是自己域名弄了google套件自架的邮箱，而那个域名早已没用，自然邮箱也废弃了的。所以，找不回来了，这辈子是找不回来了。唉，记得以前里面个个都是人才的。我想起个日文名。回想我出生的农村，我们村坐落在一座山上，但村子还是被地势划开，山腰半个村，我们说上村，山脚半个村
【实用工具】OBS Studio（用于视频录制、直播推流、虚拟摄像头）晴雨日记安装日记音视频实时音视频
OBSStudio是一款非常强大且免费开源的软件，主要用于视频录制、直播推流、虚拟摄像头。它在游戏直播、教学录制、视频会议、演示制作等领域非常流行。一、OBSStudio介绍核心功能：直播推流：将你的电脑屏幕、摄像头画面、游戏画面、音频等内容实时推送到Twitch,YouTube,Bilibili,斗鱼,虎牙,抖音直播伴侣(需配合虚拟摄像头)等主流直播平台。视频录制：高质量录制你的屏幕、特定窗口、
零基础搭建免费IP代理池：从原理到实战的保姆级指南傻啦嘿哟关于代理IP那些事儿 tcp/ip 网络协议网络
目录一、代理池的核心价值与底层原理二、环境搭建全流程详解2.1开发环境准备2.2核心组件安装三、核心配置深度解析3.1配置文件精要（setting.py）3.2自定义代理源开发四、核心模块实现原理4.1调度系统架构4.2代理验证算法五、运维实战技巧5.1性能优化策略5.2故障排查手册六、安全加固方案七、扩展升级路径八、典型问题解决方案九、性能基准测试十、合规使用指南一、代理池的核心价值与底层原理在
AI 技术重塑 IT 服务，解锁架构可视化的未来腾讯云开发者人工智能架构
引言在当下时代，企业数字化转型已迈入深水区，传统的IT运维模式正面临着成本升高、效率瓶颈、服务质量难以保障等难题，在此时，架构可视化与AI技术的出现成为企业IT服务管理上新的突破口。架构可视化能够通过图形化手段，将复杂的系统架构直观呈现，提升系统设计的可理解性、可维护性和协作效率，降低认知门槛，帮助团队快速掌握系统全貌。应该如何在多云、混合云的复杂环境中实现统一管理？如何让IT架构从抽象的技术语言
RabitQ 量化：既省内存又提性能大禹智库《向量数据库指南》《实战AI智能体》人工智能 AI自动化大禹智库 AI智能体向量数据库
突破高维向量内存瓶颈：MlivusCloudRaBitQ量化技术的工程实践与调优指南作为大禹智库高级研究员，拥有三十余年向量数据库与AI系统架构经验的我发现，在当今多模态AI落地的核心场景中，高维向量引发的内存资源消耗问题已成为制约系统规模化部署的“卡脖子”因素。特别是在大规模图像检索、个性化推荐系统和语义搜索引擎中，动辄数亿级别的向量数据需要实时处理，传统全精度索引方式会让内存资源消耗呈指数级增
Python,Java,C++开发磁悬浮原理与技术实操APP Geeker-2025 python java c++
#磁悬浮原理与技术实操APP技术方案基于Python、Java和C++开发的磁悬浮原理学习与应用APP，结合理论教学与实操模拟：##系统架构设计```mermaidgraphTDA[跨平台客户端-C++/Qt]-->|API调用|B[后端服务-Java/Spring]B-->C[磁悬浮模拟引擎-Python]B-->D[硬件控制接口]C-->E[物理模型计算]D-->F[磁悬浮套件]A-->G[3
Python,C++开发电学/动力学与发明创造APP
#电学/动力学与发明创造APP-Python与C++集成解决方案##系统架构设计```mermaidgraphTDA[用户界面-Qt/PyQt]-->B[应用逻辑层-Python]B-->C[核心引擎-C++]C-->D[硬件接口]C-->E[物理引擎]B-->F[3D可视化]F-->G[OpenGL/Vulkan]```##技术栈分工|组件|技术|功能||------|------|------
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st