神策数据

技术内参 | 神策分析架构演进：“变”与“不变” 中的思索与创新

作者：付力力，神策数据联合创始人&技术 VP

毕业于北京理工大学软件工程专业，2008 年至 2013 年期间历任百度新产品研发部、网页搜索部、基础架构部工程师。2013 年 9 月年至 2014 年 8 月担任豌豆荚数据部门资深研发工程师。2014 年 9 月至 2015 年 4 月担任黄金钱包技术合伙人。2018 年 8 月，荣登“2018 福布斯中国 30 岁以下精英榜”。

2015 年 9 月正式发布了神策分析 1.0 版本，在随后的 3 年里，我们的产品研发团队一直在不断地进行版本迭代，到目前为止一共发布了 12 个大版本。

相比于最初的 1.0 版本，现在的神策分析无论是在产品体验还是在底层架构上都已经发生了很大的变化：

从最初只能使用 3 个单薄的基础分析功能，到现在支持 10 个分析模型联合构建的场景化分析能力；从最初只能支持每天数万日活的小 App，到现在可以轻松应对一天产生数百亿的数据量巨型 App。

而另一方面，3 年内，神策分析里也有很多地方没有改变：

例如，从第一版的设计里就确定了模型的 Event-User，该模型现在依然是整个神策分析里最基础和重要的概念。

在这篇文章里，我给大家介绍神策分析最近在底层架构上一些比较大的设计改进，同时也会分享我们在这些架构设计中关于"变"与"不变"的思考。

从 SQL 查询引擎到用户行为分析引擎

我们之前在很多场合都对神策分析的底层架构做过详细的介绍，这个架构的主要特点之一是：

神策所有的分析结果都是从明细数据实时查询得出，而不是基于大多数分析系统所使用的预计算技术，之所以这么设计，因为我们希望系统数据分析能力的上限在于数据本身。

换句话说，我们期望只要是从已经采集的数据里可以分析得到的结论，神策都希望可以帮助我们的客户很容易的实现。

从结果看来，这种架构设计的好处是非常显著的：

它大大简化了整个系统的数据流，我们不需要为不同的分析模型来维护复杂的聚合表，并在数据回溯的时候保持这些数据之间的一致性（大多数类似的数据系统里要么抛弃数据回溯的能力，要么放弃数据一致性）。

受益于这种架构，我们在很短的时间内推出众多灵活的分析模型，并且这些分析模型之间可以通过分群等方式来进行自由的组合查询。

同时，配合我们开发的查询缓存机制，这套架构也可以在报表等相对固定的数据分析需求上得到比较好的使用体验。

当然，这种设计的另外一个结果是，神策分析很明确地抛弃了对高 QPS 查询需求的直接支持（例如不应该尝试在商品详情页里直接从神策分析获取这个商品本周的销量）。

不过，整体上我们认为，牺牲一个非必要的特性来换取数倍的分析灵活性以及一个简单可维护的架构，是一个非常划算的选择。

在这套架构里，Impala 作为我们使用的数据查询引擎，可以说是一个非常核心的模块。

在最初的设计选型上我们选择 Impala，一方面是因为 Impala 已经是一个相对比较成熟的 MPP 架构的查询引擎，而且对 SQL 有着比较良好的支持。另外一方面则是因为我们的研发团队在 Impala 的使用和二次开发上有着比较多的经验。

其中，是否支持 SQL 是一个很重要的选型依据。虽然 SQL 是一种有着几十年历史、至今也没有太多变化的古老工具，但是到目前为止它依然是对表格数据进行操作的最佳选择，在易用性和灵活性之间做到了比较好的平衡。

更重要的是，我们当初经过简单的调研发现，只使用 SQL 就可以很好的实现一个用户行为分析系统的大部分需求，除此之外，还可以通过 UDF/UDAF/UDAnF 等增加扩展能力，则几乎可以满足所有常见需求。

事实上，在神策分析比较早期的版本里，所有的分析模型都是用标准 SQL 直接实现的。

随着我们产品功能的增加，我们为了满足越来越复杂的分析模型和更高的性能指标，也对 Impala 做了很多改造。

不过，在这个过程中，SQL 自身的描述能力和 Impala 执行架构的局限性也逐渐暴露出来，例如我们很难像 Spark 的 DAG 模型一样来灵活的控制 SQL 的查询计划，导致一些复杂查询的性能不佳，以及在一些组合分析的场景下没有办法很容易的复用查询的中间结果。

因此，我们开始基于 Impala 构建一个全新的查询引擎。通过对已有的各种分析模型计算过程的理解，我们发现它们几乎都可以被抽象为如下的计算过程：

▹筛选出特定时间范围内的特定 Event 数据，如果查询还涉及到 User/Item，那么还需要再次进行 Join 操作，最终得到： List

▹对 List 按照 Event 中的用户 ID 进行 Shuffle，并按时间排序，最终得到每个用户 ID 的有序 Event 序列：(User Id, List)

▹对(User Id, List) 中的每个 UserId 的 List 应用具体的分析模型规则，例如漏斗、留存等，得出每个用户 ID 的中间计算结果，如下：(User Id, IntermediateResult)

▹对 (User Id, IntermediateResult) 进行最后一次聚合，得到最终的结果

不难看出，上述计算过程中最核心的难点在于如何快速的得到 (User Id, List) ，这中间可能涉及重排序和大数据量的 Shuffle 等操作。对于需要 Join User/Item 表的查询，Join 本身的性能也可能会成为瓶颈。

我们基于 Impala 原有的执行框架，在底层存储和查询逻辑上做了一系列的优化，最终实现的分析引擎相比于原有的方式在复杂查询的执行性能上有 10x 的提升，同时由于开发方式的简化，也直接加速了我们对各种复杂分析模型的迭代速度。

在后续的文章中，我们会详细介绍这个面向用户行为分析的查询引擎的具体优化细节。

扩展 Event-User 模型

模型扩展：从 Event-User 到 Event-Item-User

在神策分析最初的设计阶段，我们就确定了以 Event-User 为核心的逻辑数据模型，可以说，Event-User 模型是整个神策分析架构的基础。

3 年以来，神策分析在数百家不同行业的客户的实践结果也充分证明了这个模型的适应能力。

所有的数据模型本质上都是对现实世界的抽象，而在抽象之后必然会损失一些对现实世界的还原能力。

所以 Event-User 模型虽然在电商、金融、在线教育、互联网娱乐、企业服务等不同的行业上都发挥了很好的价值，但是随着客户需求的不断深入，尤其是在和具体行业业务的深入融合中，我们也逐渐发现了这个模型的一些缺点。

例如在 Event-User 模型中，出于性能和可解释性等各方面的考虑，Event 是被设计为不可变的。从逻辑上看似乎没有问题，因为 Event 代表的是历史上已经发生过的事件，一般来说不应该需要进行更新。

但是，在实际的应用过程中，并不一定是这么理想的状态。

例如，在很多客户进行埋点采集的过程中，他们会发现某些 Event 在最初的阶段并不能很容易的采集到完整的数据。

比如一个电商客户，在客户端 App 里采集"商品加入购物车"事件时，只能采集到商品的 ID、名称等基本信息，而对于后续分析需要的更多维度，例如商品的分类、促销的活动信息等等，则不一定能很容易的采集到（通常这些信息都是客户端在业务中没有使用到的，如果想要采集，则需要对服务端 API、客户端内部的信息传递都做比较大的修改）。

又或者是等到真正需要分析的时候，才发现当初的采集是不完备的，这个时候想再把历史数据补上就是一件非常困难的事情。

还有另外一种比较常见的场景。某个在线教育的 App 中会有很多和课程相关的事件，例如对课程的浏览、购买、学习等，而关于课程的一些基本信息中会有许多是不断变化的，如课程的分类、定价等等。

在 Event 里记录的，应当是 Event 发生的时刻这个课程的状态，例如一个购买课程的事件，我们可以记录下来当时课程的分类、价格属性，作为 Event 的一部分。而课程的分类、定价后续可能会随着业务的需要随时调整，如果业务方希望按照最新的（或者某个特定阶段的）课程分类或者定价来分析用户的历史行为，则是一个难以完成的需求。

从技术上来看，解决上述问题的方案并不复杂。很多熟悉数据仓库的朋友可能会发现，这些其实是在传统数据仓库里比较典型的维度表的问题，可以使用经典的雪花模型或者星型模型来轻松解决。

但是，我们并不希望引入这么复杂的模型，毕竟神策分析的设计目标并不是一个通用的数据仓库。虽然灵活性是神策分析最核心的设计目标之一，但也是建立在"用户行为分析"这个目标的基础之上的。

我们期望的一个理想方式是：对数据模型增加一点有限的复杂性，但是可以给整个系统带来十倍甚至百倍的灵活性提升。

为了满足上述需求，我们在新版的神策分析中对 Event-User 模型进行了扩展，引入了 Item 的概念。这里的所谓 Item，在严格意义上是指一个和用户行为相关联的实体，可能是一个商品、一个视频剧集、一部小说等等。

如果不严格约束的话，理论上它也可以存储其它任意的扩展维度信息。

在具体的技术实现上，我们允许客户定义多个不同的 Item 实体，例如电商有商品、配送点等不同的实体。

在使用前，客户要定义这些实体，并且把这些实体的数据通 SDK 发送到神策分析系统中，自动建立起一个或者多个 Item 表。然后，出于不同性能要求和业务需求的考虑，对于 Item 表的使用我们提供了不同的两种方式。

第一种方式，客户在进行 Event 埋点时，可以选择要进行关联导入的 Item 信息。

例如有一个"商品加入购物车"的事件，这个事件里只采集了"商品 ID"，但是同时因为我们事先已经定义好了"商品 Item"，那么通过"商品 ID"则直接可以先把 Event 和"商品 Item"进行关联，再把"商品 Item"的某一些属性作为 Event 的一部分进行直接导入。

使用这种方式，可以在最大程度满足业务分析的情况下简化客户端对数据采集的工作，同时在查询性能方面也不会有任何下降。

第二种方式，更类似于传统数据仓库的维度表。

我们在埋点时不做任何变动，而是在需要进行查询的时候，把 Item 表加入进来。

这种方式会有更好的灵活性，因为可以在 Event 发生之后对数据进行扩展，也可以支持随时使用最新的 Item 数据进行分析，但是另外一方面，这么做并不能很好的保留事件发生当时的某些状态，而且由于需要在查询的时候进行实时的数据 Join，也不可避免的会降低查询性能。

在把 Event-User 模型扩展为 Event-Item-User 模型之后，神策分析对复杂业务场景有了更好的支持，无论是在埋点工作的简化还是在分析能力的提升上都有非常直接的帮助。

后续我们也将继续在简化 Item 数据的接入和使用上做出更多的改进。

用户分群的进化

从 2 年前的神策分析 1.4 版本开始，我们引入了用户分群功能。从架构层面，我们主要做了两件事情：一是把分群的概念引入了我们的数据模型中，二是提供灵活、便利的定义分群规则的方式。

对于第一点，我们把分群看作是用户属性的一部分，只不过这个属性是根据用户已有的行为特征计算出来的，是一个衍生属性。所以在数据模型上，分群其实是对 Event-User 模型中 User 部分的一个扩展。

当然，在物理存储上，由于分群具有频繁更新、整体删除等特点，因此并不会直接和原有的用户属性信息存储在一起，而是采用独立存储的方式。

对于第二点，一方面，我们提供了一套描述规则，允许客户直接从 UI 上定义比较复杂的分群：在某段时间做过某个 Event 几次，或者完成了某个连续的 Event 序列等。

更重要的是，我们把所有已有分析模型的用户列表功能都看作为是分群规则定义的一部分，这种方式使得客户可以很容易的把各个分析模型的结果进行组合，产生 1+1>2 的效果。

整体上来看，神策分析 1.4 在引入分群的概念之后，架构上几乎没有做任何大的改动，就可以让所有的分群和普通的用户属性一样在任何的分析模型里直接使用。

这个也是完全得益于前文提到的实时分析架构，以及具有良好扩展能力的 Event-User 模型。

随着客户对神策分析的使用场景越来越复杂，我们的客户对分群功能也提出了更多的需求。

一个比较显著的问题是：现在的神策的每个分群只能保存一个最新的结果，而不能查看历史的状态。

比如在一个电商产品里，我们可以很容易的建立一个"日购买金额>=300"的用户分群，但是这个分群每天都会自动刷新，并且会丢掉前一天的状态。

如果我们想分析这个用户分群在时间轴上的变化趋势，或者考虑一个更复杂的场景，想分析"日购买金额>=300"的这个用户群体在当天购买的商品品类的分布情况，用现在的分群功能都是没办法直接实现的。

为了实现上述功能，我们在即将发布的 1.13 版本也对用户分群功能做了一次大的改进。

首先在数据模型上，我们扩展了分群的模型定义，加入了时间维度。即每个分群不只是代表这个分群的群体在某一时刻的状态，而是可以保存每天、每周等不同时间点下的状态。

其次，我们也进一步增强了分群的描述能力，除了增强了在 UI 上进行定义的功能之外，还允许用户直接上传分群好的结果（例如某个线下活动的用户列表），或者是从一个 SQL 结果导出成一个分群，避免让分群的能力受限于已有的规则定义。

另外，在分群的计算执行层面，我们也不再使用独立的 MapReduce 程序来进行，而是复用了上面提到的基于 Impala 的用户行为分析引擎。

因为分群的过程，其实也是一个很典型的用户行为分析的计算逻辑，这样就很自然的把整个神策系统内对于用户行为的分析都统一到了一个计算模块上来完成。

更精确的用户标识体系

如何准确地标识用户一直是用户行为数据系统中的一大难题。在过去的 3 年里，我们在客户端 SDK、服务端架构、数据接入的解决方案支持上做了持续的优化，解决了很多普遍的问题。

传统的网站或者 App 分析工具，通常以 Cookie 或设备号作为用户（其实是设备）的标识，同时这些分析工具大部分也并不支持跨端的分析，所以关于用户标识导致的各类问题并不突出。

但是在今天的用户行为分析场景中，准确的跨端标识用户变成了一个非常迫切的需求。尤其是在微信生态的情况下，一个自然人用户在 App、小程序、H5、公众号之间反复跳转，完成一系列行为是非常常见的场景，如果不能做到准确的标识用户，很多数据分析的需求将会无法准确完成。

在神策分析 1.13 版本之前，为了解决跨端标识用户的问题，我们提供了有限度的多设备用户关联体系。

这里的“有限”主要体现在一个注册用户在未登录状态下只能跟一个设备进行绑定。很显然，在很多场景下这种关联并不能很好的满足需求。

最典型的场景是，如果一个老用户更换了新的设备，那么他在这个新设备上未登录状态下的操作将会被识别为一个全新的用户，从而对某些分析结果的准确性产生影响。

因此，我们在最近的 1.13 版本提供了一个注册用户跟任意多个设备进行关联的机制。在这个新的机制下，一个注册用户可以使用多个设备进行登录，并且他在这些设备上注册/登录前后的行为都会被准确的识别到同一个用户身上，从而能在神策分析里更准确的还原一个用户的行为序列。

当然，这个在新的关联机制也并不是提供无限的灵活性。考虑这样一个场景：一个设备先后被多个注册用户登录使用，那这个设备上产生的匿名行为（即非登录状态下产生的行为）只会被关联到第一个在这个设备上登录的注册用户。

虽然在技术上我们也可以很容易的实现用户和设备之间的多重绑定，但是考虑到实际的应用场景并不常见，而且提供这种机制之后一定会给客户带来的更多理解上的复杂性，我们还是决定把新的关联机制限定在一个注册用户多个设备的场景下。

全新的用户标识体系虽然可以更准确地标识用户，但是同时也会引入一个新的问题：允许一个注册用户和多个设备进行关联，会导致历史数据的分析结果是不断变化的。我们可以看一个具体的例子，假设一个用户 X 进行了一系列操作：

▹ 7 月 1 日之前在设备 A 上注册、登录并使用 App

▹ 7 月 2 日开始在设备 B 上使用 App

▹ 7 月 5 日在设备 B 上使用之前的帐号进行登录，并继续使用

我们可以看到，在 7 月 5 日之前，神策分析并不知道使用设备 B 跟设备 A 背后都是用户 X 在操作，也就是说在这之前计算用户数都会是 2，同时在计算留存、漏斗等数据时也都会当作两个不同的用户。

而一旦到 7 月 5 日用户 X 登录了，神策分析可以知道之前的行为其实都是同一个人 X 产生的，那么这个时候再看 7 月 5 日之前的用户数也会变成了 1。

这种数据的变化在某些场景下可能会变得更加难以理解，我们假设一个比较极端的情况，如果上面的用户 X 是在一年之后才在设备 B 上进行登录，那么这一年内设备 B 所产生的行为是否都应该视作用户 X 产生的？现实情况下可能是，也可能不是，只凭借这些信息很难做出准确的判断。

本质上，新的用户标识体系是实现了对历史数据的修正，同时由于神策分析又是一个完全基于明细数据进行实时查询的分析系统，因此数据分析的结果跟着发生变化也是很自然的事情。

正如我们在上文的 Event-User 模型扩展中提到的，虽然 Event 代表的是已经发生的事件，但是依然会有一些信息在 Event 发生的当时是无法得到的。

比如在上面的例子中，7 月 2 日当天我们并不知道在设备 B 上使用的也是用户 X，只能在 3 天之后再对这个数据进行修正。我们在一定程度上破坏了 Event 的不变性，但是也带来了更高的数据准确性。

不过，除了技术上的难点，历史数据的变化还会给数据的可解释性造成比较大的影响：很多人都会对昨天甚至更早的数据报表会发生变化产生困惑。

因此，如何在提高数据准确性的同时降低客户对数据的理解难度，会是我们后面的重点方向。

更多干货和案例，可以关注“神策数据”和“用户行为洞察研究院”公众号了解~

UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

技术内参 | 神策分析架构演进：“变”与“不变” 中的思索与创新

从 SQL 查询引擎到用户行为分析引擎

扩展 Event-User 模型

用户分群的进化

你可能感兴趣的:(数据分析,技术)