ajian005

[转帖]初探淘宝技术构架

原文： http://bbs.php100.com/read-htm-tid-56843.html

应用无状态（淘宝session框架）

俗话说，一个系统的伸缩性的好坏取决于 应用的状态如何管理。为什么这么说呢？咱们试想一下，假如我们在session中保存了大量与客户端的状态信息的话，那么当保存状态信息的server宕机的时候，我们怎么办？通常来说，我们都是通过集群来解决这个问题，而通常所说的集群，不仅有负载均衡，更重要的是要有失效恢复failover,比如tomcat采用的集群节点广播复制，jboss采用的配对复制等session状态复制策略，但是集群中的状态恢复也有其缺点，那就是严重影响了系统的伸缩性，系统不能通过增加更多的机器来达到良好的水平伸缩，因为集群节点间session的通信会随着节点的增多而开销增大，因此要想做到应用本身的伸缩性，我们需要保证应用的无状态性，这样集群中的各个节点来说都是相同的，从而是的系统更好的水平伸缩。

OK，上面说了无状态的重要性，那么具体如何实现无状态呢？此时一个session框架就会发挥作用了。幸运的是淘宝已经具有了此类框架。淘宝的session框架采用的是clientcookie实现，主要将状态保存到了cookie里面，这样就使得应用节点本身不需要保存任何状态信息，这样在系统用户变多的时候，就可以通过增加更多的应用节点来达到水平扩展的目的.但是采用客户端cookie的方式来保存状态也会遇到限制，比如每个cookie一般不能超过4K的大小，同时很多浏览器都限制一个站点最多保存20个cookie.淘宝cookie框架采用的是“多值cookie”，就是一个组合键对应多个cookie的值，这样不仅可以防止cookie数量超过20，同时还节省了cookie存储有效信息的空间，因为默认每个cookie都会有大约50个字节的元信息来描述cookie。

除了淘宝目前的session框架的实现方式以外，其实集中式session管理来完成，说具体点就是多个无状态的应用节点连接一个session 服务器，session服务器将session保存到缓存中，session服务器后端再配有底层持久性数据源，比如数据库，文件系统等等。

有效使用缓存（Tair）

做互联网应用的兄弟应该都清楚，缓存对于一个互联网应用是多么的重要，从浏览器缓存，反向代理缓存，页面缓存，局部页面缓存，对象缓存等等都是缓存应用的场景。

一般来说缓存根据与应用程序的远近程度不同可以分为：local cache 和 remote cache。一般系统中要么采用localcache，要么采用remote cache,两者混合使用的话对于local cache和remotecache的数据一致性处理会变大比较麻烦.

在大部分情况下,我们所说到的缓存都是读缓存,缓存还有另外一个类型:写缓存. 对于一些读写比不高，同时对数据安全性需求不高的数据，我们可以将其缓存起来从而减少对底层数据库的访问,比如统计商品的访问次数,统计API的调用量等等,可以采用先写内存缓存然后延迟持久化到数据库，这样可以大大减少对数据库的写压力。

OK，我以店铺线的系统为例，在用户浏览店铺的时候，比如店铺介绍，店铺交流区页面，店铺服务条款页面，店铺试衣间页面，以及店铺内搜索界面这些界面更新不是非常频繁，因此适合放到缓存中，这样可以大大减低DB的负载。另外宝贝详情页面相对也更新比较少，因此也适合放到缓存中来减低DB负载。

应用拆分（HSF）

首先，在说明应用拆分之前，我们先来回顾一下一个系统从小变大的过程中遇到的一些问题，通过这些问题我们会发现拆分对于构建一个大型系统是如何的重要。

系统刚上线初期，用户数并不多，所有的逻辑也许都是放在一个系统中的，所有逻辑跑到一个进程或者一个应用当中，这个时候因为比较用户少，系统访问量低，因此将全部的逻辑都放在一个应用未尝不可。但是，兄弟们都清楚，好景不长，随着系统用户的不断增加，系统的访问压力越来越多，同时随着系统发展，为了满足用户的需求，原有的系统需要增加新的功能进来，系统变得越来越复杂的时候，我们会发现系统变得越来越难维护，难扩展，同时系统伸缩性和可用性也会受到影响。

那么这个时候我们如何解决这些问题呢？明智的办法就是拆分（这也算是一种解耦），我们需要将原来的系统根据一定的标准，比如业务相关性等分为不同的子系统，不同的系统负责不同的功能，这样切分以后，我们可以对单独的子系统进行扩展和维护，从而提高系统的扩展性和可维护性，同时我们系统的水平伸缩性scaleout大大的提升了，因为我们可以有针对性的对压力大的子系统进行水平扩展而不会影响到其它的子系统，而不会像拆分以前，每次系统压力变大的时候，我们都需要对整个大系统进行伸缩，而这样的成本是比较大的，另外经过切分，子系统与子系统之间的耦合减低了，当某个子系统暂时不可用的时候，整体系统还是可用的，从而整体系统的可用性也大大增强了。

因此一个大型的互联网应用，肯定是要经过拆分，因为只有拆分了，系统的扩展性，维护性,伸缩性，可用性才会变的更好。但是拆分也给系统带来了问题，就是子系统之间如何通信的问题，而具体的通信方式有哪些呢？一般有同步通信和异步通信，这里我们首先来说下同步通信，下面的主题“消息系统”会说到异步通信。既然需要通信，这个时候一个高性能的远程调用框架就显得非常总要啦，因此咱们淘宝也有了自己的HSF框架。

上面所说的都是拆分的好处，但是拆分以后必然的也会带来新的问题，除了刚才说的子系统通信问题外，最值得关注的问题就是系统之间的依赖关系，因为系统多了，系统的依赖关系就会变得复杂，此时就需要更好的去关注拆分标准，比如能否将一些有依赖的系统进行垂直化，使得这些系统的功能尽量的垂直，这也是目前淘宝正在做的系统垂直化，同时一定要注意系统之间的循环依赖，如果出现循环依赖一定要小心，因为这可能导致系统连锁启动失败。

OK，既然明白了拆分的重要性，我们看看随着淘宝的发展，淘宝本身是如何拆分系统的。

从上面的图可以看出淘宝系统的一个演变过程，在这个演变的过程中，我们所说的拆分就出现V2.2和V3.0之间。在V2.2版本中，淘宝几乎所有的逻辑都放在(Denali)系统中，这样导致的问题就是系统扩展和修改非常麻烦，并且更加致命的是随着淘宝业务量的增加，如果按照V2.2的架构已经没有办法支撑以后淘宝的快速发展，因此大家决定对整个系统进行拆分。

从上图可以看出V3.0版本的系统对整个系统进行了水平和垂直两个方向的拆分，水平方向上，按照功能分为交易，评价，用户，商品等系统，同样垂直方向上，划分为业务系统，核心业务系统以及以及基础服务，这样以来，各个系统都可以独立维护和独立的进行水平伸缩，比如交易系统可以在不影响其它系统的情况下独立的进行水平伸缩以及功能扩展。

从上面可以看出，一个大型系统要想变得可维护，可扩展，可伸缩，我们必须的对它进行拆分，拆分必然也带来系统之间如何通信以及系统之间依赖管理等问题，关于通信方面，淘宝目前独立开发了自己的高性能服务框架HSF，此框架主要解决了淘宝目前所有子系统之间的同步和异步通信（目前HSF主要用于同步场合，FutureTask方式的调用场景还比较少）。至于系统间的依赖管理，目前淘宝还做的不够好，这应该也是我们以后努力解决的问题。

数据库拆分（TDDL）

在前面“应用拆分”主题中，我们提到了一个大型互联网应用需要进行良好的拆分，而那里我们仅仅说了”应用级别”的拆分，其实我们的互联网应用除了应用级别的拆分以外，还有另外一个很重要的层面就是存储如何拆分的。因此这个主题主要涉及到如何对存储系统，通常就是所说的RDBMS进行拆分。

好了，确定了这个小节的主题之后，我们回顾一下，一个互联网应用从小变大的过程中遇到的一些问题，通过遇到的问题来引出我们拆分RDBMS的重要性。

系统刚开始的时候，因为系统刚上线，用户不多，那个时候，所有的数据都放在了同一个数据库中，这个时候因为用户少压力小，一个数据库完全可以应付的了，但是随着运营那些哥们辛苦的呐喊和拼命的推广以后，突然有一天发现，oh,god,用户数量突然变多了起来，随之而来的就是数据库这哥们受不了，它终于在某一天大家都和惬意的时候挂掉啦。此时，咱们搞技术的哥们，就去看看究竟是啥原因，我们查了查以后，发现原来是数据库读取压力太大了，此时咱们都清楚是到了读写分离的时候，这个时候我们会配置一个server为master节点，然后配几个salve节点，这样以来通过读写分离，使得读取数据的压力分摊到了不同的salve节点上面，系统终于又恢复了正常，开始正常运行了。但是好景还是不长，有一天我们发现master这哥们撑不住了，它负载老高了，汗流浃背，随时都有翘掉的风险，这个时候就需要咱们垂直分区啦（也就是所谓的分库），比如将商品信息，用户信息，交易信息分别存储到不同的数据库中，同时还可以针对商品信息的库采用master，salve模式，OK，通过分库以后，各个按照功能拆分的数据库写压力被分担到了不同的server上面，这样数据库的压力终于有恢复到正常状态。但是是不是这样，我们就可以高枕无忧了呢？NO,这个NO，不是我说的，是前辈们通过经验总结出来的，随着用户量的不断增加，你会发现系统中的某些表会变的异常庞大，比如好友关系表，店铺的参数配置表等，这个时候无论是写入还是读取这些表的数据，对数据库来说都是一个很耗费精力的事情，因此此时就需要我们进行“水平分区”了（这就是俗话说的分表，或者说sharding）.

上面说了一大堆，无非就是告诉大家一个事实“数据库是系统中最不容易scaleout的一层”，一个大型的互联网应用必然会经过一个从单一DBserver,到Master/salve,再到垂直分区（分库），然后再到水平分区（分表，sharding）的过程，而在这个过程中，Master/salve 以及垂直分区相对比较容易，对应用的影响也不是很大，但是分表会引起一些棘手的问题，比如不能跨越多个分区join查询数据，如何平衡各个shards的负载等等，这个时候就需要一个通用的DAL框架来屏蔽底层数据存储对应用逻辑的影响，使得底层数据的访问对应用透明化。

拿淘宝目前的情况来说，淘宝目前也正在从昂贵的高端存储（小型机+ORACLE）切换到MYSQL,切换到MYSQL以后，势必会遇到垂直分区（分库）以及水平分区（Sharding）的问题，因此目前淘宝根据自己的业务特点也开发了自己的TDDL框架，此框架主要解决了分库分表对应用的透明化以及异构数据库之间的数据复制。

异步通信（Notify）

在”远程调用框架”的介绍中,我们说了一个大型的系统为了扩展性和伸缩性方面的需求,肯定是要进行拆分,但是拆分了以后,子系统之间如何通信就成了我们首要的问题,在”远程调用框架”小节中,我们说了同步通信在一个大型分布式系统中的应用,那么这一小节我们就来说说异步通信.好了,既然说到了异步通信,那么”消息中间件”就要登场了,采用异步通信这其实也是关系到系统的伸缩性，以及最大化的对各个子系统进行解耦.

说到异步通信，我们需要关注的一点是这里的异步一定是根据业务特点来的，一定是针对业务的异步，通常适合异步的场合是一些松耦合的通信场合，而对于本身业务上关联度比较大的业务系统之间，我们还是要采用同步通信比较靠谱。

OK,那么下一步我们说说异步能给系统带来什么样子的好处。首先我们想想，假如系统有A和B两个子系统构成，假如A和B是同步通信的话，那么要想使得系统整体伸缩性提高必须同时对A和B进行伸缩，这就影响了对整个系统进行scaleout.其次，同步调用还会影响到可用性，从数学推理的角度来说，A同步调用B，如果A可用，那么B可用，逆否命题就是如果B不可用，那么A也不可用，这将大大影响到系统可用性，再次，系统之间异步通信以后可以大大提高系统的响应时间，使得每个请求的响应时间变短，从而提高用户体验，因此异步在提高了系统的伸缩性以及可用性的同时，也大大的增强了请求的响应时间（当然了，请求的总体处理时间也许不会变少）。

下面我们就以淘宝的业务来看看异步在淘宝的具体应用。交易系统会与很多其它的业务系统交互，如果在一次交易过程中采用同步调用的话，这就要求要向交易成功，必须依赖的所有系统都可用，而如果采用异步通信以后，交易系统借助于消息中间件Notify和其它的系统进行了解耦，这样以来当其它的系统不可用的时候，也不会影响到某此交易，从而提高了系统的可用性。

最后，关于异步方面的讨论，我可以推荐大家一些资源：
1 . J2EE meets web2.0
2. Ebay架构特点(HPTS 2009)

非结构化数据存储 (TFS,NOSQL)

在一个大型的互联网应用当中，我们会发现并不是所有的数据都是结构化的，比如一些配置文件，一个用户对应的动态，以及一次交易的快照等信息，这些信息一般不适合保存到RDBMS中，它们更符合一种Key-value的结构，另外还有一类数据，数据量非常的大，但是实时性要求不高，此时这些数据也需要通过另外的一种存储方式进行存储，另外一些静态文件，比如各个商品的图片，商品描述等信息，这些信息因为比较大，放入RDBMS会引起读取性能问题，从而影响到其它的数据读取性能，因此这些信息也需要和其它信息分开存储，而一般的互联网应用系统都会选择把这些信息保存到分布式文件系统中，因此淘宝目前也开发了自己的分布式文件系统TFS，TFS目前限制了文件大小为2M，适合于一些小于2M数据的存放。

随着互联网的发展，业界从08年下半年开始逐渐流行了一个概念就是NOSQL。我们都知道根据CAP理论，一致性，可用性和分区容错性3者不能同时满足，最多只能同时满足两个，我们传统的关系数据采用了ACID的事务策略，而ACID的事务策略更加讲究的是一种高一致性而降低了可用性的需求，但是互联网应用往往对可用性的要求要略高于一致性的需求，这个时候我们就需要避免采用数据的ACID事务策略，转而采用BASE事务策略，BASE事务策略是基本可用性，事务软状态以及最终一致性的缩写，通过BASE事务策略，我们可以通过最终一致性来提升系统的可用性，这也是目前很多NOSQL产品所采用的策略，包括facebook 的cassandra,apachehbase,google bigtable等，这些产品非常适合一些非结构化的数据，比如key-value形式的数据存储，并且这些产品有个很好的优点就是水平伸缩性。目前淘宝也在研究和使用一些成熟的NOSQL产品。

监控、预警系统

对于大型的系统来说，唯一可靠的就是系统的各个部分是不可靠。因为一个大型的分布式系统中势必会涉及到各种各样的设备，比如网络交换机，普通PC机，各种型号的网卡，硬盘，内存等等，而这些东东都在数量非常多的时候，出现错误的概率也会变大，因此我们需要时时刻刻监控系统的状态，而监控也有粒度的粗细之分，粒度粗一点的话，我们需要对整个应用系统进行监控，比如目前的系统网络流量是多少，内存利用率是多少，IO，CPU的负载是多少，服务的访问压力是多少，服务的响应时间是多少等这一系列的监控，而细粒度一点的话，我们就需对比如应用中的某个功能，某个URL的访问量是多，每个页面的PV是多少，页面每天占用的带宽是多少，页面渲染时间是多少，静态资源比如图片每天占用的带宽是多少等等进行进一步细粒度的监控。因此一个监控系统就变得必不可少了。

前面说了一个监控系统的重要性，有了监控系统以后，更重要的是要和预警系统结合起来，比如当某个页面访问量增多的时候，系统能自动预警，某台Server的CPU和内存占用率突然变大的时候，系统也能自动预警，当并发请求丢失严重的时候，系统也能自动预警等等，这样以来通过监控系统和预警系统的结合可以使得我们能快速响应系统出现的问题，提高系统的稳定性和可用性。

配置统一管理

一个大型的分布式应用，一般都是有很多节点构成的，如果每次一个新的节点加入都要更改其它节点的配置，或者每次删除一个节点也要更改配置的话，这样不仅不利于系统的维护和管理，同时也更加容易引入错误。另外很多时候集群中的很多系统的配置都是一样的，如果不进行统一的配置管理，就需要再所有的系统上维护一份配置，这样会造成配置的管理维护很麻烦，而通过一个统一的配置管理可以使得这些问题得到很好的解决，当有新的节点加入或者删除的时候，配置管理系统可以通知各个节点更新配置，从而达到所有节点的配置一致性，这样既方便也不会出错。

编程自学指南：java程序设计开发，HTTPS 与认证授权进阶， HTTPS 的核心原理与加密机制，HTTPS 的配置流程与证书管理，认证与授权的核心概念与实现方式 zl515035644 java自学指南 #JavaWEB开发 java https 开发语言
编程自学指南：java程序设计开发，HTTPS与认证授权进阶一、课程信息学习目标理解HTTPS的核心原理与加密机制掌握HTTPS的配置流程与证书管理掌握认证与授权的核心概念与实现方式能在项目中集成HTTPS与安全框架二、课程导入：HTTP的不安全因素快递运输类比协议运输方式安全风险HTTP普通快递中途被拆包、篡改（明文传输）HTTPS加密快递（锁+钥匙）只有收件人能打开（加密+认证）三、HTTPS
【从零实现Json-Rpc框架】- 项目实现 - 零碎功能接口篇 JhonKI json rpc 网络协议
博客主页：https://blog.csdn.net/2301_779549673博客仓库：https://gitee.com/JohnKingW/linux_test/tree/master/lesson欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言️‍一、简单日志宏实现1.1意义:快速定位程序运行逻辑出错的位置。1
django.db.utils.OperationalError: database is locked 解决办法希望自己能一直努力 python django sqlite python
sqlite只允许单线程连接，进行操作时需要保证其他的数据库连接断开首先关闭数据库的连接，假如使用的是pycharm中的DBNavigator，选择diconnect即可假如不行的话，检查数据库表的操作权限
richeditor-android：打造Android移动应用的富文本编辑体验 Kingston Chang
本文还有配套的精品资源，点击获取简介：在移动应用开发中，richeditor-android为Android平台提供了一个功能强大的富文本编辑器，旨在提供与H5端类似的编辑体验，使开发者能够快速实现专业的文字编辑功能。框架以用户体验为中心，提供简洁的API、高度定制化能力和丰富的预设样式。集成简单，支持文本编辑的常见操作，并且经过性能优化确保在各种Android设备上流畅运行。通过设置回调、自定义
Python 数据库自动化操作指南老胖闲聊 Python python 数据库自动化
本指南详细讲解如何使用Python操作MySQL、Oracle和MicrosoftSQLServer数据库，涵盖常用库、基础操作、高级功能及完整代码示例。目录MySQL操作详解Oracle操作详解MicrosoftSQLServer操作详解通用注意事项一、MySQL操作详解1.常用库mysql-connector-python（官方驱动）安装：pipinstallmysql-connector-p
什么是架构，以及当前市面主流架构类型有哪些？ encoding-console 架构系统架构硬件架构数据库架构网络架构
什么是架构，以及当前市面主流架构有哪些在计算机领域，架构通常指系统设计的整体框架，定义了各组件之间的交互方式、功能划分以及技术规范。不同的架构层级（如硬件、软件、网络）有不同的架构类型。以下是核心概念和当前主流架构的分类说明：一、硬件架构：1.1硬件架构的概念即计算机硬件系统设计和组织方式，主要体现在处理器指令集和内存管理上。1.2硬件架构的主流类型1.2.1X86架构由Intel和AMD主导，主
MFC(1)-odbc-ado-调用mysql,sqlserver 多云的夏天 mfc mysql sqlserver
1.odbc调用mysql,sqlserver1.1配置odbc2.控制面板->管理工具->ODBC数据源管理程序->驱动配置与测试1.2程序实现步骤分配环境句柄(SQLAllocHandle)分配连接句柄(SQLAllocHandle)设置连接属性(可选)建立数据库连接(SQLConnect/SQLDriverConnect)分配语句句柄(SQLAllocHandle)执行SQL语句(
Java全栈面试宝典：JVM与Spring核心模块深度解析 Aphelios380 面试算法 java 面试 jvm spring 开发语言
目录一、JVM核心机制进阶问题10：元空间vs永久代：内存管理的代际革命技术演进对比表技术演进关键点问题11：JVM性能调优三剑客参数解析核心参数详解问题12：堆与栈的六大核心差异内存结构对比图二、Spring框架全景解析Spring核心价值三大支柱Spring模块架构全景图核心模块矩阵模块依赖关系Spring高频面试题集锦1.Spring的核心功能是什么？2.Spring中常用的设计模式？3.S
跨平台移动开发框架（如 Flutter、React Native）的性能对比与应用实践算法探索者 flutter react native react.js
摘要：随着移动应用市场的迅速发展，跨平台移动开发框架因其能够提高开发效率、降低成本而受到越来越多开发者的青睐。本文主要对Flutter和ReactNative这两个主流的跨平台移动开发框架进行性能对比与应用实践分析。通过对它们的渲染机制、内存管理、开发效率等方面的研究，结合实际应用案例，探讨各自的优势与不足，为开发者在选择合适的开发框架时提供参考依据。一、引言移动应用开发领域中，跨平台开发框架的出
C# Blazor Full-Stack架构前后端开发详解老胖闲聊 C#c#架构开发语言
Blazor是微软推出的一个基于C#和.NET的前端框架，允许开发者使用C#代替JavaScript来构建交互式Web应用。BlazorFull-Stack是指将Blazor前端与ASP.NETCore后端结合，形成一个完整的全栈开发解决方案。以下是对BlazorFull-Stack的发展历史、应用领域、开发工具和工作原理的详细讲解。一、发展历史1.1Blazor的起源2018年：Blazor首次
036-Python GUI 编程（Tkinter）小宝哥Code Python基础及AI开发 python 开发语言
Tkinter是Python标准库中的图形用户界面（GUI）开发工具，提供了创建窗口、按钮、文本框等基本控件的功能。由于其简单易用且与Python一起发布，Tkinter是快速开发桌面应用的首选工具之一。1.Tkinter基本概念1.1Tkinter的组成Tkinter提供了一个图形化界面的框架，主要包括以下几个核心概念：Tk：主窗口，是所有控件的容器。控件（Widget）：比如按钮、标签、文本框
如何用Flask构建API
你有没有想过你最喜欢的应用是如何互相通信的？点击手机上的按钮是如何立刻连接到一个信息的世界的？背后的魔力就是我们称之为API的东西，它代表着应用程序编程接口。它就像一个信使，接受请求，告诉系统你想要什么，然后带回响应。听起来很酷，对吧？今天，我们将学习如何使用Flask构建你自己的API，Flask是一个非常简单且轻量的PythonWeb框架。别担心，如果你觉得听起来有些复杂——我们会一步一步地以
SvelteKit 最新中文文档教程（13）—— Hooks
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
Java中的NoSQL数据库应用与优化省赚客app开发者 java nosql 开发语言
Java中的NoSQL数据库应用与优化大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将探讨Java中的NoSQL数据库应用与优化。NoSQL数据库因其灵活性、高性能和扩展性，已经成为现代应用程序中不可或缺的一部分。与传统的关系型数据库相比，NoSQL数据库能够处理大规模的数据和高并发请求，并且支持各种数据模型，如文档、键值、列族和图数据库。本文将介绍常见的
Java 前端与后端交互：解锁 RESTful API 设计的秘密小鹿( ﹡ˆoˆ﹡ ) Java java 安全 python Java
引言随着互联网技术的快速发展，前后端分离已经成为现代Web开发的主流趋势之一。在这个过程中，RESTfulAPI成为了连接前端界面与后端数据处理的重要桥梁。作为一位拥有20年实战经验的编码专家，我见证了RESTfulAPI在不同场景中的广泛应用，从简单的数据查询到复杂的业务逻辑处理，无不体现出它的强大与灵活。本文将带你深入了解Java在前后端交互中如何运用RESTfulAPI设计，不仅适合初学者入
开源深度学习框架PyTorch 深海水人工智能行业发展 IT应用探讨深度学习开源 pytorch 人工智能 python 机器训练
一、PyTorch介绍PyTorch是一个开源的深度学习框架，由Facebook的人工智能研究团队（FAIR）开发。它以动态图计算（DynamicComputationGraph）为核心，提供灵活的深度学习建模能力，广泛评估计算机视觉、自然语言处理、强化学习等领域。PyTorch的主要特点1.动态图计算（动态计算图）计算图在运行时构建，支持动态调整，适用于复杂任务。2.强大的GPU加速使用CUDA
IvorySQL 初始化（initdb）过程深度解析 IvorySQL IvorySQL postgresql 数据库
作为一款深度兼容Oracle的开源数据库，IvorySQL在初始化阶段通过多模式架构设计，实现从底层到应用层的灵活兼容。以下是其核心流程的拆解：一、初始化模式：PG与Oracle的“双面基因”1.模式选择与参数设计通过initdb命令的-m参数，用户可指定数据库的初始兼容模式：#初始化Oracle兼容模式（默认）./initdb-D/data-moracle#初始化PostgreSQL原生模式./
向量数据库的适用场景与局限性分析 CoreFMEA软件技术算法数据库向量数据库
一、核心适用场景1.多模态内容检索电商智能搜索：支持“以图搜图”“以文搜图”，例如用户上传一张碎花裙照片，系统可精准匹配相似款式商品，同时结合文本描述（如“雪纺材质”“夏季新款”）进行过滤，提升搜索效率。阿里云向量检索服务（VRS）在某电商平台实现亿级商品图片毫秒级检索，点击率提升35%。医疗影像分析：存储CT、MRI等医学影像的向量特征，支持病灶相似度匹配。例如，输入肺部结节影像，系统可快速检索
NoSQL 数据库的应用场景与挑战无界探索数据库 nosql
```htmlNoSQL数据库的应用场景与挑战随着互联网的快速发展，数据量呈爆炸式增长，传统的关系型数据库（如MySQL、Oracle等）在处理大规模数据时遇到了瓶颈。NoSQL数据库应运而生，它以其灵活的数据模型和强大的可扩展性，满足了现代应用对大数据存储和处理的需求。应用场景高并发读写场景：NoSQL数据库通过分布式架构设计，能够轻松应对高并发读写请求。例如，在电商网站中，用户浏览商品、下单购
Oracle数据库数据编程SQL＜2.2 DDL 视图、序列＞ Tyler先森 Oracle 数据库 oracle sql
目录一、Oracle视图(Views)（一）Oracle视图特点（二）Oracle视图创建语法关键参数：（三）Oracle视图类型1、普通视图2、连接视图（可更新）3、对象视图4、物化视图（MaterializedViews）（四）Oracle视图数据字典（五）Oracle可更新视图规则（六）视图的优缺点1、视图的优点：2、视图的缺点：3、视图和表的区别二、Oracle序列(Sequences)（
Oracle数据库数据编程SQL＜2.3 DML增、删、改及merge into＞ Tyler先森 Oracle 数据库 oracle sql
目录一、DML数据操纵语言（AateManipulationLanguage)二、【insert】插入数据1、单行插入2、批量插入3、将数据同时插入到多张表insertall/insertfirst三、【update】更新数据1、语法2、举例3、update使用注意事项：四、【delete】删除数据---多用于删除特定数据1、语法2、deletefrom表不加条件则删除全部数据五、delete和t
Oracle数据库数据编程SQL＜2.1 DDL、DCL表、列及约束＞ Tyler先森 Oracle 数据库 oracle sql
目录一、对表的操作（一）复制表1、语法2、练习3、仅复制表格式--在where后加一个不成立的条件（二）自建表1、数据类型（1）字符类型：char2、varchar/varchar2char（数）固定长度类型varchar/varchar2（数）可变长度类型（2）数值类型：number、intnumber（数1，数2）int（数）（3）日期类型：date、timestampdate不用加长度tim
Oracle数据库数据编程SQL＜1.4 表连接、子查询＞ Tyler先森 Oracle sql 数据库大数据 oracle
目录一、表连接（一）内连接innerjoin，等值连接（二）外连接outerjoin，等值连接1、左外连接left{outer}join2、右外连接right{outer}join3、全外连接full{outer}join（三）不等值连接（四）自连接（五）用where的方式进行表连接1、显示两张表共有的部分，没有(+)加号是内连接（innerjoin）2、显示左表全部的信息，(+)加号在等号右边是
android studio 运行flutter项目鹅肝手握高V五色 http udp https websocket 网络安全网络协议 tcp/ip
在AndroidStudio中运行Flutter项目简介Flutter是一个流行的跨平台移动应用开发框架，而AndroidStudio是一种强大的集成开发环境，支持Flutter开发。本文将介绍如何在AndroidStudio中运行Flutter项目，让开发者能够更加方便地进行Flutter应用程序的开发和调试。对于iOS开发者，如果需要在Mac上开发Flutter应用，可以考虑使用AppUplo
Flink SQL窗口表值函数聚合实现原理 VqhhMobile flink sql 大数据 Flink
Flink是一个流处理和批处理框架，提供了强大的大数据处理能力。FlinkSQL是Flink的一种高级查询语言，可以用于对数据流进行实时分析和处理。在FlinkSQL中，窗口表值函数聚合是一种常见的操作，它通过对数据流中的窗口进行聚合计算，并返回一个表作为结果。窗口表值函数聚合的实现原理涉及到以下几个关键概念和步骤：窗口定义：首先需要定义窗口，指定窗口的类型（例如滚动窗口、滑动窗口、会话窗口等）、
【数组】复习与企业真题小赵要加油 java java 开发语言
目录数组概述一维数组的使用（重要）二维数组的使用(难点)数组的常用算法Araays工具类的使用数组中的常见异常企业真题数组概述数组，就可以理解为多个数据的组合是程序中的容器：数组、集合框架(List、Set、Map)数组存储的数据的特点：依次紧密排序的，有序的，可以重复的此时的数组、集合框架都是在内存中对多个数据存储数组的其他特点：一旦初始化，其长度就是确定的、不可更改的一维数组的使用（重要）数组
微信小程序框架被甩了一耳光的梦小程序小程序
6个微信小程序热门的UI组件:minUI、vant、WeUI、colorUI、iviewUI、TaroUI、WuxUI1.minUI(http://www.miniui.com/)minUI代码轻量级，使开发者更专注于业务和服务端，从而能够轻松的实现页面开发，并且用户体验比较好。技术亮点：-快速开发：使用html配置界面，减少80%界面代码量。-易学易用：简单的API设计、可以独立、组合使用控件。
JS笔试题精讲3 ES6专题沿着路走到底面试题 javascript es6 前端
只要拼接字符串一律用模板字符串${}里:-可以放：变量、算术计算、三目、对象属性、创建对象、调用函数、访问数组元素——有返回值的合法的js表达式-不能放:没有返回值的js表达式也不能放分支/判断、循环等程序结构。比如:ifelseforwhile...等${}规则和今后各种框架中的绑定语法规则完全一样！varuname="丁丁";console.log(`Welcome${uname}`);var
通过pip命令导出和导入Python环境安装包程序员日子
导出Python环境安装包pipfreeze>packages.txt这将会创建一个packages.txt文件，其中包含了当前环境中所有包及各自的版本的简单列表（即piplist所列出的包列表）安装导入Python环境包pipinstall-rpackages.txt场景:开发完一个自动化测试框架后，需要将该框架移植到另外一个系统去运行，但是很多的依赖包都是自己安装的，为了解决环境问题，我们将依
Windows系统网络流量监控与限制攻略小白爱电脑 Windows windows
在现代互联网生活中，网络宽带流量管理变得越来越重要。特别是在家庭或小型办公环境中，有限的宽带流量需要被合理分配和有效利用。Windows系统提供了一些内置的工具和方法，可以帮助我们监控和限制电脑的网络宽带流量。一、监控网络宽带流量在Windows系统中，我们可以使用任务管理器来监控当前的网络数据流量。具体步骤如下：1.按下Ctrl+Shift+Esc组合键，打开任务管理器。2.点击“性能”选项卡，
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

[转帖]初探淘宝技术构架

你可能感兴趣的:(数据库,框架,session,互联网,NoSQL,配置管理)