linking530

Flickr网站架构分析

文章来源 http://www.itivy.com/ivy/archive/2011/3/7/634351294385186067.html

Flickr.com 是网上最受欢迎的照片共享网站之一，还记得那位给Windows Vista拍摄壁纸的Hamad Darwish吗？他就是将照片上传到Flickr，后而被微软看中成为Vista壁纸御用摄影师。

Flickr.com 是最初由位于温哥华的Ludicorp公司开发设计并于2004年2月正式发布的，由于大量应用了WEB 2.0技术，注重用户体验，使得其迅速获得了大量的用户，2007年11月，Flickr迎来了第20亿张照片，一年后，这个数字就达到了30亿，并且还在以加速度增长。 2005年3月，雅虎公司以3千500万美元收购了Ludicorp公司和Flickr.com。虽然Flickr并不是最大的照片共享网站（Facebook以超过100亿张照片排名第一），但这笔收购仍然被认为是WEB 2.0浪潮中最精明的收购，因为仅仅一年后，Google就以16亿美元的高价收购了YouTube，而2007年10月，微软斥资2.4亿美元收购 Facebook 1.6%股份，此举使Facebook估值高达150亿美元。估计Ludicorp公司的创始人Stewart Butterfield和Caterina Fake夫妇现在还在后悔吧。

在2005年温哥华PHP协会的简报以及随后的一系列会议上，Flickr的架构师Cal Henderson公开了大部分Flickr所使用的后台技术，使得我们能有机会来分享和研究其在构建可扩展Web站点的经验。本文大部分资料来自互联网和自己的一点点心得，欢迎大家参与讨论，要是能够起到抛砖引玉的作用，本人将不胜荣幸。

Flickr整体框架图

在讨论Flickr 网站架构之前，让我们先来看一组统计数据（数据来源：April 2007 MySQL Conf and Expo和Flickr网站）

每天多达40亿次的查询请求
squid总计约有3500万张照片（硬盘+内存）
squid内存中约有200万张照片
总计有大约4亿7000万张照片，每张图片又生成不同尺寸大小的4－5份图片
每秒38，000次Memcached请求 (Memcached总共存储了1200万对象)
超过2 PB 存储，其中数据库12TB
每天新增图片超过 40万（周日峰值超过200万，约1.5TB)
超过8百50万注册用户
超过1千万的唯一标签（tags)
响应4万个照片访问请求
处理10万个缓存操作
运行13万个数据库查询

这张是Flickr的网站架构图，我们这里只作一些简要的描述，具体的分析请静待后续文章。

Pair of ServerIron’s做负载均衡方案
Squid Caches 代理，用于缓存静态的HTML和照片
Net App公司的Filer, NAS存储设备，用于存储照片
PHP App Servers
－运行REDHAT LINUX,Apache上的PHP应用，Flickr网站的主体是大约6万行PHP代码
－没有使用PHP session, 应用是stateless,便于扩展，并避免PHP Server故障所带来的Session失效。
－每个页面有大约27～35个查询（不知道为什么这么设计，个人觉得没有必要）
－另有专门的Apache Web Farm 服务于静态文件（HTML和照片）的访问
Storage Manager 运行私有的，适用于海量文件存储的Flickr File System
Dual Tree Central Database
－ MySQL 数据库，存放用户表，记录的信息是用户主键以及此用户对以的数据库Shard区，从中心用户表中查出用户数据所在位置，然后直接从目标Shard中取出数据。
－ “Dual Tree”架构是”Master－Master”和“Master-Slave”的有效结合，双Master 避免了“单点故障”，Master－Slave又提高了读取速度，因为用户表的操作90％以上是读。
Master-master shards
－ MySQL 数据库，存储实际的用户数据和照片的元数据（Meta Data)，每个Shard 大约40万个用户，120GB 数据。每个用户的所有数据存放在同一个shard中。
－ Shard中的每一个server的负载只是其可最大负载的50％，这样在需要的时候可以Online停掉一半的server进行升级或维护而不影响系统性能。
－为了避免跨Shard查询所带来的性能影响，一些数据有在不同的Shard有两份拷贝，比如用户对照片的评论，通过事务来保证其同步。
Memcached Cluster 中间层缓存服务器，用于缓存数据库的SQL查询结果等。
Big Search Engine
- 复制部分Shard数据（Owner’s single tag）到Search Engine Farm以响应实时的全文检索。
- 其他全文检索请求利用Yahoo的搜索引擎处理（Flickr是Yahoo旗下的公司）
服务器的硬件配置：
- Intel或AMD 64位CPU，16GB RAM
- 6-disk 15K RPM RAID-10.
- 2U boxes.
服务器数量：(数据来源：April 2008 MySQL Conference & Expo)
166 DB servers, 244 web servers(不知道是否包括 squid server？), 14 Memcached servers

数据库最初的扩展-Replication

也许有人不相信，不过Flickr确实是从一台服务器起步的，即Apache/PHP和MySQL是运行在同一台服务器上的，很快MySQL服务器就独立了出来，成了双服务器架构。随着用户和访问量的快速增长，MySQL数据库开始承受越来越大的压力，成为应用瓶颈，导致网站应用响应速度变慢,MySQL 的扩展问题就摆在了Flickr的技术团队面前。

不幸的是，在当时，他们的选择并不多。一般来说，数据库的扩展无外是两条路，Scale-Up和Scale-Out,所谓Scale-Up，简单的说就是，在同一台机器内增加CPU,内存等硬件来增加数据库系统的处理能力，一般不需要修改应用程序；而Scale-Out,就是我们通常所说的数据库集群方式，即通过增加运行数据库服务器的数量来提高系统整体的能力，而应用程序则一般需要进行相应的修改。

在常见的商业数据库中，Oracle具有很强的 Scale-Up的能力，很早就能够支持几十个甚至数百个CPU，运行大型关键业务应用；而微软的SQL SERVER，早期受Wintel架构所限，以Scale-Out著称，但自从几年前突破了Wintel体系架构8路CPU的的限制，Scale-Up的能力一路突飞猛进，最近更是发布了SQL 2008在Windows 2008 R2版运行256个CPU核心(core)的测试结果，开始挑战Oracle的高端市场。而MySQL，直到今年4月，在最终采纳了GOOGLE公司贡献的SMP性能增强的代码后，发布了MySQL5.4后，才开始支持16路CPU的X86系统和64路CPU的CMT系统(基于Sun UltraSPARC 的系统）。

从另一方面来说，Scale-Up受软硬件体系的限制，不可能无限增加ＣＰＵ和内存，相反Scale-Out却是可以”几乎”无限的扩展,以Google 为例，２006年Google一共有超过４５万台服务器（谁能告诉我现在他们有多少？！）；而且大型ＳＭＰ服务器的价格远远超过普通的双路服务器，对于很多刚刚起步或是业务增长很难预测的网站来说，不可能也没必要一次性投资购买大型的硬件设备，因而虽然Scale-Out会随着服务器数量的增多而带来管理，部署和维护的成本急剧上升，但确是大多数大型网站当然也包括Flickr的唯一选择。

经过统计，Flickr的技术人员发现，查询即SELECT语句的数量要远远大于添加，更新和删除的数量，比例达到了大约13：1甚至更多，所以他们采用了“Master-Slave”的复制模式，即所有的“写”操作都在发生在“Master”，然后”异步“复制到一台或多台“Slave”上，而所有的”读“操作都转到”Slave”上运行，这样随着“读”交易量的增加，只需增加Slave服务器就可以了。

让我们来看一下应用系统应该如何修改来适应这样的架构，除了”读/写“分离外，对于”读“操作最基本的要求是：1）应用程序能够在多个”Slave“上进行负载均分；2）当一个或多个”slave”出现故障时，应用程序能自动尝试下一个“slave”，如果全部“Slave”失效，则返回错误。 Flickr曾经考虑过的方案是在Web应用和”Slave“群之间加入一个硬件或软件的”Load Balancer“，如下图

这样的好处是应用所需的改动最小，因为对于应用来说，所有的读操作都是通过一个虚拟的Slave来进行，添加和删除“Slave”服务器对应用透明，Load Balancer 实现对各个Slave服务器状态的监控并将出现故障的Slave从可用节点列表里删除，并可以实现一些复杂的负载分担策略，比如新买的服务器处理能力要高过Slave群中其他的老机器，那么我们可以给这个机器多分配一些负载以最有效的利用资源。一个简单的利用Apache proxy_balancer_module的例子如下：

。。。。。。。。。。。。。。
LoadModule proxy_module modules/mod_proxy.so
LoadModule proxy_balancer_module modules/mod_proxy_balancer.so
LoadModule proxy_http_module modules/mod_proxy_http.so
。。。。。。。。。。。。。。。。。。。。
< Proxy balancer://mycluster>
BalancerMember "http://slave1:8008/App" loadfactor= 4
BalancerMember "http://slave2:8008/App" loadfactor= 3
BalancerMember "http://slave3:8008/App" loadfactor= 3
....................
///slave load ratio 4: 3: 3.

最终，Flickr采用了一种非常“轻量”但有效的“简易”PHP实现，基本的代码只有10几行：

在上述代码中，如果需要对特定的Slave赋予更高的负载，只要在$hosts中多出现一次或多次就可以了。这段代码只要稍稍改进，就可以实现更复杂的功能，如当connect失败时自动将host从hosts列表中去除等。

“Master”-”Slave”模式的缺点是它并没有对于“写’操作提供扩展能力，而且存在单点故障，即一旦Master故障，整个网站将丧失“更新” 的能力。解决的办法采用“Master”-”Master”模式，即两台服务器互为”Master“-”Slave”,这样不仅”读/写“能力扩展了一倍，而且有效避免了”单点故障“，结合已有的“Master”-”Slave”,整个数据库的架构就变成了下面的”双树“结构，

。

“双树”架构并没有支撑太久的时间，大概6个月后，随着用户的激增，系统再一次达到了极限，不仅”写”操作成为了瓶颈，而且“异步复制”也由于 ”Slave“服务器过于繁忙而出现了严重的滞后而造成读数据的不一致。那么，能不能在现有架构加以解决，比如说增加新的”Master“服务器和考虑采用”同步复制“呢？答案是否定的，在Master超过两台的设置中，只能采用”闭环链“的方式进行复制，在大数据量的生产环境中，很容易造成在任意时刻没有一个Master或Slave节点是具有全部最新数据的（有点类似于”人一次也不能踏进同一条河“？），这样很难保障数据的一致性，而且一旦其中一个 Master出现故障，将中断整个复制链；而对于”同步复制“，当然这是消除”复制滞后“的最好办法，不过在当时MySQL的同步复制还远没有成熟到可以运用在投产环境中。

Flickr网站的架构，需要一次大的变化来解决长期持续扩展的问题。

Shard – 大型网站数据库扩展的终极武器？

2005年７月，另一位大牛(MySQL 2005、2006年度 “Application of the Year Award”获得者)Dathan Pattishall加入了Flickr团队。一个星期之内，Dathan解决了Flickr数据库40%的问题，更重要的是，他为Flickr引进了Shard架构，从而使Flickr网站具备了真正“线性”Scale-Out的增长能力，并一直沿用至今，取得了巨大的成功。

Shard主要是为了解决传统数据库Master/Slave模式下单一Master数据库的“写”瓶颈而出现的，简单的说Shard就是将一个大表分割成多个小表，每个小表存储在不同机器的数据库上，从而将负载分散到多个机器并行处理而极大的提高整个系统的“写”扩展能力。相比传统方式，由于每个数据库都相对较小，不仅读写操作更快，甚至可以将整个小数据库缓存到内存中，而且每个小数据库的备份，恢复也变得相对容易，同时由于分散了风险，单个小数据库的故障不会影响其他的数据库，使整个系统的可靠性也得到了显著的提高。

对于大多数网站来说，以用户为单位进行Shard分割是最合适不过的，常见的分割方法有按地域（比如邮编），按Key值（比如Hash用户ID),这些方法可以简单的通过应用配置文件或算法来实现，一般不需要另外的数据库，缺点是一旦业务增加，需要再次分割Shard时要修改现有的应用算法和重新计算所有的Shard KEY值；而最为灵活的做法是以“目录”服务为基础的分割，即在Shard之前加一个中央数据库（Global Lookup Cluster），应用要先根据用户主键值查询中央数据库，获得用户数据所在的Shard，随后的操作再转向Shard所在数据库，例如下图：

而应用的主要修改在于要添加一个Lookup访问层，例如将以下的代码：

string connectionString = @"Driver={MySQL};SERVER=dbserver;DATABASE=CustomerDB;" ;
OdbcConnection conn = new OdbcConnection (connectionString ) ;
conn . Open ( ) ;

变为：

string connectionString = GetDatabaseFor (customerId ) ;
OdbcConnection conn = new OdbcConnection (connectionString ) ;
conn . Open ( ) ;

GetDatabaseFor()函数完成根据用户ID获取Shard connectionString的作用。

对应我们前面所提到过的Flickr架构

Dual Tree Central Database就是中央数据库，存放用户表，记录的信息是用户主键以及此用户对以的数据库Shard区；而Master-Master Shards就是一个个的Shard用户数据库，存储实际的用户数据和照片的元数据（Meta Data)。

Flickr Shard的设计我们在Flickr 网站架构研究（１）中已经总结过了，在此不再赘述。我们在此谈一下Shard架构的主要问题和Flickr的解决办法：１）Shard只适用于不需要 join操作的表，因为跨Shard join操作的开销太大，解决的办法是将一个用户的所有数据全部存放在同一个Shard里，对于一些传统方式下需要跨Shard查询的数据，只能采取冗余的方法，比如Shard1的用户A对Shard2的用户B的照片进行了评论，那么这条评论将同时存放在Shard1 和Shard2中。这样就存在一个数据一致性的问题，常规的做法是用数据库事务(Transaction)、”两阶段提交“(2 phase commit)来解决，但做过两阶段提交（2PC）应用的都知道，2PC的效率相对较差，而且实际上也不能100%保证数据的完整性和一致性；另外，一旦由于其中一个Shard故障而提交失败回滚，用户只能放弃或再试一遍，用户体验较差。Flickr对于数据一致性的解决方案是Queue（Flickr用 PHP开发了一个强大的Queue系统，将所有可以异步的任务都用Queue来实现，每天处理高达１千万以上的任务。）,事实上当用户A对用户B的照片进行评论时，他并不关心这条评论什么时候出现在用户B的界面上，即将这条评论添加到用户B的交易是可以异步的，允许一定的迟延，通过Queue处理，既保证了数据的一致性，又缩短了用户端的相应时间，提高了系统性能。２）Shard的另一个主要问题Rebalancing,既当现有Shard的负载达到一定的阀值，如何将现有数据再次分割，Flickr目前的方式依然是手工的，既人工来确定哪些用户需要迁移，然后运行一个后台程序进行数据迁移，迁移的过程用户账户将被锁住。（据说Google做到了完全自动的Rebalancing,本着”萨大“坑里不再挖坑的原则，如果有机会的话，留到下一个系列再研究吧）

Memcached的应用和争论

大家应该已经注意到，Flickr为中央数据库配置了Memcached作为数据库缓存，接下来的问题是，为什么用Memcached?为什么 Shard不需要Memcached?Memcached和Master,Slave的关系怎样？笔者将试图回答这些问题供大家参考，网上的相关争论很多，有些问题尚未有定论。

Memecached是一个高性能的，分布式的，开源的内存对象缓存系统，顾名思义，它的主要目的是将经常读取的对象放入内存以提高整个系统，尤其是数据库的扩展能力。Memcached的主要结构是两个Hash Table,Server端的HashTable以key-value pair的方式存放对象值，而Client端的HashTable的则决定某一对象存放在哪一个Memcached Server.举个例子说，后台有３个Memecached Server,A、B、C,Client1需要将一个对象名为”userid123456“，值为“鲁丁”的存入，经过Client1的Hash计算，”userid123456″的值应该放入Memcached ServerB, 而这之后，Client2需要读取”userid123456″的值，经过同样的Hash计算，得出”userid123456″的值如果存在的话应该在 Memcached ServerB，并从中取出。最妙的是Server之间彼此是完全独立的，完全不知道对方的存在，没有一个类似与Master或Admin Server的存在，增加和减少Server只需在Client端”注册”并重新Hash就可以了。

Memcached作为数据库缓存的作用主要在于减轻甚至消除高负载数据库情况下频繁读取所带来的Disk I/O瓶颈，相对于数据库自身的缓存来说，具有以下优点：１）Memecached的缓存是分布式的，而数据库的缓存只限于本机；２）Memcached 缓存的是对象，可以是经过复杂运算和查询的最终结果，并且不限于数据，可以是任何小于１MB的对象，比如html文件等；而数据库缓存是以”row”为单位的，一旦”row”中的任何数据更新，整个“row”将进行可能是对应用来说不必要的更新；３）Memcached的存取是轻量的，而数据库的则相对较重，在低负载的情况下，一对一的比较,Memcached的性能未必能超过数据库，而在高负载的情况下则优势明显。

Memcached并不适用于更新频繁的数据，因为频繁更新的数据导致大量的Memcached更新和较低的缓冲命中率，这可能也是为什么Shard没有集成它的原因；Memcached更多的是扩展了数据库的”读“操作，这一点上它和Slave的作用有重叠，以至于有人争论说应该让”Relication”回到它最初的目的”Online Backup”数据库上，而通过Memcached来提供数据库的“读”扩展。（当然也有人说，考虑到Memcached的对应用带来的复杂性，还是慎用。）

然而，在体系架构中增加Memecached并不是没有代价的，现有的应用要做适当的修改来同步Memcached和数据库中的数据，同时Memcached不提供任何冗余和“failover”功能，这些复杂的控制都需要应用来实现。基本的应用逻辑如下：

对于读操作：

$data = memcached_fetch ( $id ) ;
return $data if $data
$data = db_fetch ( $id ) ;
memcached_store ( $id , $data ) ;
return $data ;

对于写操作：

db_store ( $id , $data ) ;
memcached_store ( $id , $data ) ;

我们看到在每一次数据更新都需要更新Memcached，而且数据库或Memcached任何一点写错误应用就可能取得“过期”的数据而得到错误的结果，如何保证数据库和Memcached的同步呢？

复制滞后和同步问题的解决

我们知道复制滞后的主要原因是数据库负载过大而造成异步复制的延迟，Shard架构有效的分散了系统负载，从而大大减轻了这一现象，但是并不能从根本上消除，解决这一问题还是要靠良好的应用设计。

当用户访问并更新Shard数据时，Flickr采用了将用户“粘”到某一机器的做法，

$id = intval ( substr ( $user_id , - 10 ) ) ;
$id % $count_of_hosts_in_shard

即同一用户每次登录的所有操作其实都是在Shard中的一个Master上运行的，这样即使复制到Slave，也就是另一台Master的时候有延时，也不会对用户有影响，除非是用户刚刚更新，尚未复制而这台Master就出现故障了，不过这种几率应该很小吧。

对于Central Database的复制滞后和同步问题，Flickr采用了一种复杂的“Write Through Cache”的机制来处理：

“Write Through Cache”就是将所有的数据库”写“操作都先写入”Cache”，然后由Cache统一去更新数据库的各个Node,“Write Through Cache”维护每一个Node的更新状态，当有读请求时，即将请求转向状态为”已同步“的Node，这样即避免了复制滞后和Memcached的同步问题，但缺点是其实现极为复杂，“Write Throug Cache”层的代码需要考虑和实现所有”journal”,”Transaction“，“failover”，和“recovery”这些数据库已经实现的功能，另外还要考虑自身的”failover”问题。我没有找到有关具体实现的说明，只能猜测这一部分的处理可能也是直接利用或是实现了类似于 Flickr的Queue系统吧。

算法在各领域的广泛应用：100 个实例全解析软件职业规划 AI&模型算法
一、互联网与信息技术领域搜索引擎算法：如谷歌的PageRank算法，用于根据网页的重要性和相关性对搜索结果进行排序，帮助用户快速找到所需信息。推荐系统算法：例如亚马逊和Netflix使用的协同过滤算法。根据用户的历史行为（购买、观看记录等）和其他相似用户的偏好，为用户推荐可能感兴趣的产品或内容。社交网络分析算法：用于分析社交网络中的用户关系，如Facebook通过算法发现用户的好友推荐、社区划分等
hive 数字转换字符串_Hive架构及Hive SQL的执行流程解读 weixin_39756416 hive 数字转换字符串
1、Hive产生背景MapReduce编程的不便性HDFS上的文件缺少Schema(表名，名称，ID等，为数据库对象的集合)2、Hive是什么Hive的使用场景是什么？基于Hadoop做一些数据清洗啊(ETL)、报表啊、数据分析可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。Hive是SQL解析引擎，它将SQL语句转译成M/RJob然后在Hadoop执行。由Facebook开源，
探索未来：FacebookResearch的JEPa项目详解瞿旺晟
探索未来：FacebookResearch的JEPa项目详解去发现同类优质开源项目:https://gitcode.com/项目简介是FacebookResearch推出的一个开源项目，全称为"JointEmbeddingofProgramsandAttributes"。它是一个用于程序理解和属性预测的深度学习框架，旨在提升代码的理解和自动化程度，为开发者提供更智能的编程辅助工具。技术分析**1.
Yarn：包管理优化与工作空间的最佳实践
在现代前端开发中，包管理工具是不可或缺的工具之一。Yarn作为一个快速、可靠且安全的包管理工具，相对于npm，提供了一些独特的功能和优化，尤其是在工作空间管理和性能优化方面尤为突出。本文将深入探讨Yarn的专业使用，包括其工作空间的强大功能、性能优化技术以及在大型项目中的最佳实践。Yarn简介Yarn是由Facebook开发的一个JavaScript包管理工具，它旨在解决npm的一些关键问题，如安
React Native svygh123 问题解决过程编程 js react native react.js javascript
ReactNative是一个用于构建原生移动应用的框架，它使用JavaScript和React（一个用于构建用户界面的JavaScript库）来开发iOS和Android平台的应用程序。ReactNative由Facebook开发并维护，并且是开源的。特点跨平台开发：ReactNative允许开发者使用相同的代码库为多个平台（如iOS和Android）编写应用，极大地提高了开发效率。热重载：开发者
react 和 reflux yunhai.du Java开发 react
目录一、介绍：二、特征：三、组成：四、react的基本概念：五、JSX语法：六、生命周期：七、简单的使用：一、介绍：react：最早来源于FaceBook,后来因为其独特的设计思想和惊人的性能被广大用户喜欢，现在是最受欢迎的前端框架之一。reflux:React的设计目的是管理视图层，所以对于大型应用来说，我们还需要数据层面的复用。所以facebook设计了flux架构，并官方发布了dispath
PyTorch：Python深度学习框架使用详解零度° python python 深度学习 pytorch
PyTorch是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理领域。它由Facebook的AI研究团队开发，因其动态计算图、易用性以及与Python的紧密集成而受到开发者的青睐。PyTorch的主要特点动态计算图：PyTorch的计算图在运行时构建，使得模型的修改和调试更加灵活。自动微分：自动计算梯度，简化了机器学习模型的训练过程。丰富的API：提供了丰富的神经网络层、函数和损失函数。跨平
8.6 “6.7GB→3.9GB！“Facebook OPT模型4-bit量化实战：显存狂降85%教程少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力语言模型人工智能 gpt
6.7GB→3.9GB！FacebookOPT模型4-bit量化实战：显存狂降85%教程实战FacebookOPT模型量化模型量化原理与技术选型在模型量化实战前，我们需要理解OPT模型的显存占用特点。以OPT-6.7B模型为例，其参数量为6.7B，每个参数默认使用FP32（4字节）存储时，显存占用计算公式为：显存占用=参数量×数据类型字节数=6.7B×4B=26.8GB当前主流的量化技术路线对比如
隐私保护在 Facebook 用户身份验证中的应用 ClonBrowser 反侦测指纹浏览器社交媒体网络 ClonBrowser 安全隐私保护
在这个数字化的时代，个人隐私保护成为了公众关注的焦点。社交媒体巨头Facebook作为全球最大的社交平台之一，拥有数十亿用户，其在用户身份验证过程中对隐私保护的重视程度直接影响着用户的安全感和信任度。本文将探讨Facebook在用户身份验证中如何应用隐私保护技术，以确保用户信息的安全。多因素认证（MFA）的安全性Facebook采用多因素认证（MFA）来增强账户的安全性。MFA要求用户提供两种或以
Facebook 的隐私保护数据存储方案研究 ClonBrowser 反侦测指纹浏览器社交媒体 tiktok ClonBrowser 互联网
Facebook的隐私保护数据存储方案研究在这个信息爆炸的时代，数据隐私保护已成为公众关注的热点。Facebook，作为全球最大的社交媒体平台之一，承载着海量用户数据，其隐私保护措施和数据存储方案对于维护用户隐私至关重要。本文将深入探讨Facebook在隐私保护方面的数据存储方案，以及这些方案如何帮助保护用户数据不被滥用。数据加密技术Facebook在数据存储方面采用了先进的加密技术。这意味着用户
Facebook 隐私风波：互联网时代数据安全警钟 Roc_z7 facebook 智能合约安全区块链
随着互联网的快速发展，我们的生活日益与数字世界交织在一起。社交媒体平台，尤其是Facebook，已经成为我们日常沟通和信息交流的重要工具。然而，随着用户数据泄露事件的不断曝光，Facebook的隐私风波引发了公众对于数据安全的深刻反思，成为互联网时代数据保护的一大警钟。数据安全：数字时代的新挑战互联网的兴起使得大量个人信息得以通过社交平台、电子商务等途径传递。然而，正因为这些数据在网络中流动，也带
隐私保护在 Facebook 内容审核系统中的应用 LokiSan 反侦测指纹浏览器社交媒体 Facebook facebook 人工智能大数据 ClonBrowser
在这个信息爆炸的数字时代，社交媒体平台如Facebook已成为全球数十亿人日常生活中不可或缺的一部分。它们不仅提供了一个交流和分享的场所，也承担着维护网络环境健康、安全的重要责任。其中，内容审核系统是确保用户隐私和网络安全的重要工具。本文将探讨隐私保护在Facebook内容审核系统中的应用，并展望未来的发展方向。内容审核系统的重要性内容审核系统是社交媒体平台用来监控和过滤不当内容的机制。这些内容可
如何打造一个安全稳定的海外社媒账号？ IPdodo全球网络服务安全网络
您好！随着TikTok、Instagram、Facebook等海外社媒平台的迅猛发展，越来越多的个人和企业希望借助这些平台实现全球化传播。然而，注册和运营海外社媒账号的过程中，许多人频繁遭遇到封禁、限制和账号关联等问题，常常导致严重的账号损失。想要拥有一个安全且稳定的海外社媒账号，我们需要从环境搭建到日常操作采取科学的策略。本篇文章将会为大家详细解析如何保护您的社媒账号，避免封禁。一.海外社媒账号
【AI学习从零至壹】pytorch基础 flyyyya AI 算法人工智能学习 pytorch
pytorch基础pytorch基础张量（Tensor）张量的属性张量的索引和切⽚：张量的拼接张量的算数运算单元素张量In-place操作与numpy之间的转换张量到numpy数组计算图静态计算图动态计算图pytorch计算图可视化pytorch基础PyTorch是⼀个开源的深度学习框架，由Facebook的⼈⼯智能研究团队开发和维护，在学术界和⼯业界都得到了⼴泛应⽤。张量（Tensor）张量（T
Web3 的优势：重塑互联网的未来纸鸢666 web3
简介在当今数字化时代，Web3作为互联网的下一个演进方向，正在引起广泛关注。它以区块链技术为核心，强调去中心化、用户自主权、安全性和新型经济模式的构建。本文将深入探讨Web3的主要优势，并分析其如何改变我们的数字世界。1.去中心化（Decentralization）传统的Web2依赖于中心化平台，如Google、Facebook和Amazon，这些公司控制了数据和服务，而Web3通过区块链技术实现
LLaMA-2 7B 简介 Ash Butterfield 自然语言处理（NLP）专栏 nlp 人工智能
LLaMA-27B是Meta（前Facebook）推出的LLaMA-2（LargeLanguageModelMetaAI2）系列中的一个7B参数（70亿参数）版本。LLaMA-2作为LLaMA的升级版本，专为更高效的推理和更广泛的应用场景设计，支持开源使用，并可用于研究和商业用途。LLaMA-27B主要特点参数规模：7B（70亿参数），适用于资源受限的环境，如边缘设备或小型服务器。训练数据：采用了
yarn如何用node替换
Yarn是一个流行的JavaScript包管理工具，它为npm提供了更快、更可靠的体验。尽管Yarn有其优势，但在许多情况下，我们可能想使用Node.js的本地包管理机制来替代Yarn。一、基本概念在开始之前，我们要明确一些基本个念：Node.js：一个高效的JavaScript运行环境，为构建服务器端应用程序提供支持。Yarn：一个Facebook开发的JavaScript包管理工具，用于处理项
使用指南：react-facebook-pixel开源项目深度探索梅研芊
使用指南：react-facebook-pixel开源项目深度探索react-facebook-pixelReactJSwrapperforFacebook'sPixel项目地址:https://gitcode.com/gh_mirrors/re/react-facebook-pixel1.项目目录结构及介绍react-facebook-pixel是一个专为React应用程序设计的库，用于轻松集成
深入理解 React.js：构建现代 Web 应用的核心技术布兰妮甜 JavaScript -行为 #React 前端 javascript react.js 前端框架
Hi，我是布兰妮甜！React.js是由Facebook开发并开源的一个用于构建用户界面的JavaScript库。自2013年发布以来，React迅速成为前端开发领域的主流工具之一。其组件化、声明式编程模型以及高效的虚拟DOM技术，使得开发者能够轻松构建高性能、可维护的Web应用。本文将深入探讨React.js的核心概念、优势以及如何在实际项目中应用。文章目录一、React.js的核心概念二、Re
Rust编程基础教程：Web开发入门 AI天才研究院 AI实战 DeepSeek R1 &大数据AI人工智能大模型 Python实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍由于Rust语言的出生地广泛流行于各个领域，有许多公司、组织都在用Rust进行开发，包括微软、Facebook、阿里巴巴、GitHub等。在移动端领域，包括华为、苹果、OPPO、vivo等都在大力推动Rust的应用。同时，Rust也越来越受欢迎，成为云计算、区块链、高性能计算等领域的主流编程语言。因此，对于新手而言，理解Rust编程语言的基本概念及特性，掌握
Meta Platforms （原Facebook）计划推出新的大型语言模型以应用于人工智能 PM简读馆技术杂谈人工智能 facebook 语言模型
一、引言在当今科技飞速发展的时代，人工智能领域成为众多科技巨头激烈角逐的关键战场。MetaPlatforms作为全球社交媒体和科技行业的领军者，一直积极投身于新技术的探索与创新。近期，有消息传出MetaPlatforms计划推出新的大型语言模型以应用于人工智能领域，这一举措无疑将对行业格局产生深远影响。本报告将对MetaPlatforms在人工智能领域的发展历程、此次计划推出新模型的背景、可能带来
深度学习框架之主流学习框架 uu1224 深度学习学习人工智能机器学习神经网络
深度学习框架是一类专门设计用来简化和加速神经网络模型开发过程的软件工具。它们提供了构建、训练和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点：TensorFlow：由Google开发，是一个广泛使用的开源深度学习框架。它以强大的图计算模型和分布式计算能力著称，并且通过高级API如Keras，为用户提供了易于上手的开发体验。PyTorch：由Facebook开发，以其动态计算图
用Meta的开源工具打造AI驱动的应用：LASER、Faiss与聊天加载器示例 dgay_hua 人工智能 faiss python
MetaPlatforms（原Facebook）在AI技术领域持续创新，推出了多个优秀的开源工具，比如用于多语言句子嵌入的LASER、用于高效相似性搜索的Faiss，以及用于加载和处理Messenger和WhatsApp聊天记录的工具。这些工具可以帮助开发者快速构建AI驱动的应用。在本文中，我们将深入介绍这些工具的功能，并通过可运行的代码示例展示如何将它们应用到实际项目中。技术背景介绍LASER（
yolov5-训练好的模型部署的几种方式-ONNX 黄晓魚 halcon3d PCL点云处理深度神经网络 YOLO C#python
ONNX，即OpenNeuralNetworkExchange，是微软和Facebook发布的一个深度学习开发工具生态系统，旨在让AI开发人员能够随着项目发展而选择正确的工具。ONNX所针对的是深度学习开发生态中最关键的问题之一，在任意一个框架上训练的神经网络模型，无法直接在另一个框架上用。开发者需要耗费大量时间精力把模型从一个开发平台移植到另一个。因此，如何实现不同框架之间的互操作性，简化从研究
【工具推荐】这开源工具，让你一键下载全网视频！全网都在偷摸着用！世味煮成茶. 软件音视频开源软件笔记经验分享 https
项目地址：https://github.com/soimort/you-get诞生年份：2012年（十年老将依然能打！）核心能力：用一行命令下载90%的网页音视频这个在GitHub上已经有50K+Star！！！五大核心功能，下载从未如此简单1️⃣全网主流平台通吃✅国内：B站/抖音/腾讯/优酷/爱奇艺✅海外：YouTube/推特/Instagram/Facebook✅音频：网易云/酷狗音乐2️⃣智能
React vs Vue3深度对比与使用场景分析匹马夕阳 VUE技术集锦 react.js 前端前端框架
在前端开发领域，React和Vue3是两个备受瞩目的框架。它们都提供了强大的功能和灵活的开发方式，但各自的设计理念、使用方式和适用场景有所不同。本文将深入探讨React和Vue3的区别，通过代码示例和具体的使用场景，帮助开发者更好地理解并选择适合自己的框架。一、核心概念与设计理念1.ReactReact是由Facebook开发的一个JavaScript库，主要用于构建用户界面。它的核心理念是组件化
机器学习安全核心算法全景解析金外飞176 网络空间安全机器学习安全算法
机器学习安全核心算法全景解析引言机器学习系统的脆弱性正成为安全攻防的新战场。从数据投毒到模型窃取，攻击者不断突破传统防御边界。本文系统性梳理ML安全关键技术图谱，重点解析12类核心算法及其防御价值。一、数据安全防护算法1.对抗样本防御算法名称核心思想2024年最新进展典型应用场景TRADES鲁棒性-准确性权衡优化Facebook提出自监督TRADES改进版自动驾驶目标检测JacobianSVD输入
大模型是如何蒸馏像Qwen-7B，Llama-3 这种小模型的？闫哥大数据大模型 llama 人工智能
1.Qwen-7B和Llama-3的所属公司Qwen-7B：属于阿里巴巴，是“通义千问”系列的开源模型，由阿里云团队研发。Llama-3：属于Meta（原Facebook），是Meta开源的Llama系列大语言模型的最新版本。2.蒸馏数据的使用与模型归属蒸馏技术的作用：DeepSeek将自研大模型（如DeepSeek-R1）生成的80万条高质量解题数据（称为“蒸馏数据”）用于训练Qwen、Llam
React之从0开始（2） ️○- 杂谈 react.js 前端前端框架
书接上回。我们介绍了index.html的基本结构。那么我就在想了，为啥必须得是index.html呢？我能不能换个名字？谁规定的运行React项目就要从index.html开始？好吧，应该是Facebook规定的。。。。。那没事了。反正结论就是不能改。如果硬要改，也不是不行，但是你得同时修改Vite或者其他构建工具的配置。然后我们还会发现，新建的一个项目里面有一个文件package.json。这
巴西Slot棋牌游戏出海投放Facebook脸书代投广告优势电报_@ye001111 游戏 facebook
巴西Slot游戏出海投放Facebook广告优势研究报告引言在全球游戏市场中，巴西作为一个充满潜力的新兴市场，正吸引着越来越多的游戏开发商的目光。特别是Slot游戏，凭借其独特的魅力和广泛的受众基础，在巴西市场上展现出巨大的增长潜力。而Facebook作为全球最大的社交媒体平台之一，在巴西拥有庞大的用户基数和高度活跃的社交互动，为Slot游戏的出海投放提供了得天独厚的优势。本报告将深入分析巴西Sl
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

Flickr网站架构分析

你可能感兴趣的:(FACEBOOK)