Percent_bigdata

百分点大数据技术团队：舆情平台架构实践与演进

编者按

现代社会每天都有大量信息产生，抖音、小红书等自媒体的普及，不断丰富着人们表达看法、传播诉求、分享信息的渠道和形式。如何完成多源异构数据的收集和处理，挖掘海量信息中的价值，洞察事件背后的观点和情绪，是做好政府和企业舆情监测工作不可忽视的问题。

百分点舆情洞察系统（Mediaforce）是一款面向政企客户的舆情监测SaaS
产品，自2014年上线至今，已累计服务客户近万家，积累了逾20
PB的全网数据，通过构建丰富的上层应用，为客户提供精准、实时、全面、多维度的洞察服务。

本文从底层数据治理、上层应用架构，以及数据个性化和智能化角度，分享了大数据平台架构、AI平台架构和微服务架构在舆情产品上的实践。

一、平台架构简介
伴随着互联网内容形态的蓬勃发展，Mediaforce 平台数据量增长迅速，在产品创新和迭代过程中，自身平台架构也在不断的演进。

互联网舆情本质上是对互联网公开信息的采集、分析、研判，并产生业务价值，是一个价值数据挖掘的过程，我们覆盖了90%以上的网络公开数据，包含但不限于以下信源：

在线新闻、报刊、贴吧、博客、论坛、微博、微信、APP客户端；

电视、广播等；

社交自媒体：抖音、快手、小红书等。

百分点科技通过对以上数据进行存储、挖掘、可视化分析等一系列处理，最终为用户呈现多终端触达、一站式的舆情监测和价值分析平台。

到目前为止，大体分为如下三个平台架构，对应职责如下：

大数据平台架构

数据共享：统一业务数据存储，结合业务实际场景对数据进行关联使用，避免数据重复存储，降低沟通成本；

服务共享：统一服务架构，避免服务孤岛，统一服务的访问入口和访问规则；

易于使用：通过平台服务和工具的形式暴露平台能力，屏蔽平台底层细节。

AI平台架构

数据层：以平台化能力应对数据收集、数据准备等繁重工作，同时结合业务，构建数据流转闭环；

深度学习平台层：实现多租户及弹性的资源分配、模型库扩展、可视化训练和调整、滚动更新等能力；

应用和工具层：借助Rest\Grpc模型开放能力，对接金融领域舆情、定制化行业标签、离线数据预测等场景。

微服务架构

拆分：按照业务垂直拆分和功能水平拆分的总原则，以及从业务侧尽量规避分布式事务等考虑；

云原生：减少微服务架构的运维成本，借助容器化技术，实现资源动态感知、扩缩容等特性。

二、大数据平台架构
百分点舆情洞察系统最初是通过自主构建IDC来支撑，IaaS层由单独的运维团队来进行维护。

大数据平台（IaaS层除外）分层如下：

舆情的数据应用场景不同于海量日志、海量商品检索等的侧重于简单标签聚合，舆情应用完全基于自然语言全文检索，同时结合内存复杂聚合计算。为了保证检索准确率，往往会配置复杂的关键词和距离限定，因此对于检索引擎的内存优化策略要求很高。可以说，数据存储和检索架构的升级，是舆情业务的核心之一。在百分点科技大数据平台架构演进历程中，大致可以分为三个阶段：业务共享数据仓库阶段、业务自建数据集市阶段、湖仓一体阶段。

共享数据仓库阶段

在业务规模初期，大部分精力集中于业务系统的迭代和开发，采用共享数据仓库的解决方案。流程如下：

可以看到，随着客户规模和数据量的增大，以及业务复杂度的提升，仅仅依靠共享的数据仓库，已经无法满足需求。产生的主要问题如下：

业务侧查询响应时长无法保证；

复杂查询以及聚合操作，加重Elasticsearch Cluster负担，甚至引起节点OOM；

冷热数据未分离。

自建数据集市阶段

随着客户量及数据量的增多，百分点科技对数据仓库进行了冷热数据隔离，并通过自主构建数据集市来满足业务的快速响应。

下面将从数据仓库层、数据集市层进行介绍。

ES Cluster从2.3.4升级到6.0.0(当时最新版本)；

数据仓库核心做了冷热数据分离，热数据使用SSD硬盘存储，且只存储近一周数据，冷数据使用HDD硬盘，存储近两年数据，互联网数据具有良好的时序性，按天拆分，在保证集群运维便利的同时，满足数据变更\删除的业务需求；

数据集市以业务最小查询单位-话题为粒度进行拆分和构建，可以认为是将上层业务需要的结果，预计算存储至数据集市层，这样业务查询只需查询自己独有的库便可以进行分析和响应，其中需要相对复杂的机制保障数据一致性，这里不做介绍。

调整后，业务查询响应延迟基本可控，并且具有良好的隔离性。但同时也面临着下述挑战：

离线数据（2年以上历史数据）以HDFS为存储介质，不支持更新、无法查询复用；

在目前数据集市层的拆分力度下，由于业务逻辑复杂性，需要借助内存计算，在以年为跨度查询周期，显得力不从心；

数据集市层实时数据的计算具有一定的延迟，需要保留热数据集群来支持实时数据的查询，架构不够优雅。

湖仓一体化阶段

随着舆情在客户群中深入使用，在保证查询低延迟的情况下，需要能支撑3~5年的长跨度数据检索。同时为应对SaaS产品矩阵的扩充，需要易用、可扩展的数据平台支撑。本次架构优化的核心目标为：

低响应延迟下，大跨度查询可扩展至3~5年（秒级）；

灵活的为其他业务应用做好平台支撑，加强ODS、DW建设；

减少ES Cluster数据冗余；

简化数据集市层计算链路，提高数据时效性。

3.1 数据集市层

对客户和线上日志进分析，得到如下结果：

（1）客户数据量级

对线上客户数据量进行采样，统计一年数据量，千万级数据量的客户群体占1%。所以我们将目标定义为千万级数据量下的，复杂聚合查询分析响应时长在3~5秒内。

（2）查询类型统计

借助数据集市，将大量的依据全文检索聚合统计分析场景转化为OLAP场景。对线上日志进行分析，二次全文检索查询流量占比不到20%。

依据上述结论，将数据集市层要解决的问题进行汇总如下：

80%查询是OLAP场景，20%查询是全文检索；

需要支持实时更新；

数据规模支持千万级别，并支持扩展；

查询响应时长在3~5秒。

通常来说，面对海量数据的低成本存储+高效检索的需求，业界通常使用HBase+ Elasticsearch的组合方案，但该方案除了开发维护复杂、数据一致性弱等常见问题，通常还要由Elasticsearch来承担OLAP，以及全文检索的功能职责。对于重OLAP查询场景，使用MPP查询引擎往往能获得较低的查询延迟，如：Clickhouse、DorisDB等。在考虑支持实时更新等多种条件下，我们将方案集中于Elasticsearch、TiDB+ Elasticsearch、DorisDB+Elasticsearch三种技术进行尝试：

Elasticsearch

ES是一款面向OLAP场景的全文检索分析引擎，下面是在Elasticsearch 7.8.0环境中的测试：

（1）集群环境

（2）测试索引

使用单shard、无副本、百万级别索引32个，十万级别索引18个。

（3）测试结论

将客户端并发数等价于索引数目，持续20轮进行压测。对业务进行抽象，选取如下测试用例：

{“size”:0,“query”:{“bool”:{“filter”:[{“bool”:{“adjust_pure_negative”:true,“boost”:1}},{“range”:{“pubTime”:{“from”:1551430186000,“to”:1615366186000,“include_lower”:true,“include_upper”:true,“boost”:1}}},{“bool”:{“adjust_pure_negative”:true,“boost”:1}}],“must_not”:[{“term”:{“mask”:{“value”:true,“boost”:1}}}],“adjust_pure_negative”:true,“boost”:1}},“track_total_hits”:2147483647,“aggregations”:{“termsAgg”:{“terms”:{“field”:“titleSimHash”,“size”:2000,“min_doc_count”:1,“shard_min_doc_count”:0,“show_term_doc_count_error”:false,“order”:[{"_count":“desc”},{"_key":“asc”}]}},“carAgg”:{“cardinality”:{“field”:“titleSimHash”,“precision_threshold”:10000}}}}

测试中发现集群相对稳定，相对于单线程，多线程下的平均延迟高于1s也较少。在Elasticsearch6.0.0上进行相同的测试，其中平均延迟延迟高于1s占80%。

TiDB+Elasticsearch

TiDB 4.0版本已经是一款HTAP混合型分析引擎，将测试数据集限定为千万级，在测试中设置：tidb_hashagg_final_concurrency=20和tidb_hashagg_partial_concurrency = 20，平均耗时稳定在 8s~9s。由于聚合后的基数较大，压力都集中在TiDB侧，未能达到去ES的OLAP的场景。更多信息请参照AskTUG：千万级数据group by性能调优[1]。随着TiDB 5.0发布，TiFlash已经不仅仅是一个列式存储引擎这么简单。TiFlash引入了MPP模式，使得整个TiFlash从单纯的存储节点升级成为一个全功能的分析引擎。

[1] https://asktug.com/t/topic/68474/1

DorisDB+Elasticsearch

Mpp引擎列式存储设计对于数据更新是极其不友好的。借助DorisDB的更新模型引擎，内部通过版本号，可以支持大规模的数据实时更新，当然在查询时需要完成多版合并。同时Doris-On-ES将Doris的分布式查询规划能力和ES(Elasticsearch)的全文检索能力相结合，提供更完善的OLAP分析场景解决方案。目前Doris On ES不支持聚合操作如sum，avg， min/max 等下推，计算方式是批量流式的从ES获取所有满足条件的文档，然后在Doris中进行计算。在测试场场景下，性能是可以满足OLAP场景。实践中发现，由于自建IDC机器较为老旧，无法支持SIMD指令，致使无法安装DorisDB。

在目前的业务场景下，百分点科技最终选择单一的Elasticsearch来作为数据集市层的存储和计算引擎。后续如果数据集市有更大的数据量以及业务低延迟的OLAP查询场景，还是会考虑结合MPP查询引擎来满足业务的扩展。

3.2 数据仓库层

在之前的很长一段时间内，Elasticsearch Cluster承担了大量数仓的职能。通过多集群进行冷热数据隔离。在本次调整中，百分点科技借助索引生命周期管理(ILM)和Hot\Warm架构来实现在一个集群中进行数据的管理。在实践中，我们将Elasticsearch率先升级到7.12.0，以满足向量化检索等更多场景。

3.3 源数据层

之前会将采集的数据存储至kafka，作为数据传输中转。但kafka一般存储的时间周期较短，且功能单一。因此需要一套统一的存储计算平台，需要满足如下要求：

全量的离线数据是通过ES-Hadoop进行按天备份，后续的变更就无法做到同步，复用性、灵活性较差；

图片、音视频等非结构化数据的接入，需要方便与上层机器学习应用深度融合；

辅助数据仓库，构建数据集市，保证实时性。

在最新的架构中，百分点科技将数据先入湖，构建ODS，辅助构建上层DW和DM。关于Data Lake，最终选取Hudi作为源数据层存储计算方案，并做了以下尝试：

Iceberg

Iceberg工程架构具有极高的抽象，可以与各种引擎无缝融合。字符串模糊匹配是一种重要场景，测试中遇到以下问题：如果某个字段存储为空字符串，在匹配中就会出现异常：java.lang.IllegalArgumentException: Truncate length should be positive[2]。另外就是查询对Stream相关支持还处于开发阶段，对于增量数据处理只能以Java Api方式实现。

[2] https://github.com/apache/iceberg/issues/2065

Hudi

Hudi显得尤为成熟，但是与 Spark 引擎绑定的较为紧密。在Hudi 0.6中对底层代码进行抽象，以适配Flink等主流计算引擎。同时其完善的增量查询机制非常适合实时数据集市的构建。另外Hudi Table并不需要提前创建，可以在写入数据时自动创建，这也是区别于Iceberg的一个点。

Hudi的引入，为底层数据平台带来了ACID能力，并且提供较好实时性。特别是为数据集市实时数据构建带来便捷，提供可扩展性。目前的简易数据架构如下：

三、AI平台架构
在海量的文本数据上，利用丰富的数据挖掘、深度学习、人工智能算法，训练在线和离线语义模型，一站式挖掘满足客户需要的舆情分析需求。在这一历程中，大致分为两个阶段：

文本分析平台：将通用文本能力服务化；

深度学习建模平台：高效、易用、低门槛的模型定制开发平台。

在上述演进中，最主要的变化在于各行各业都已经积累了较多的高价值数据，并且越来越需要定制满足自己场景的个性化模型。下面主要从这两个阶段分别展开对应的工作。

文本分析平台

在舆情分析场景中，依赖于分词、词性、新词发现、命名实体、主体分类、文本聚类、关键词提取、自动摘要、文本去重、情感分析、内容转换（简繁、拼音）、自动纠错、自动补全、文档解析等各种功能。产品架构和数据流程如下：

深度学习建模平台

随着深度迁移学习成熟和行业应用，带来最大的益处在于可以依据少量的训练数据便可以得到较好的训练结果。从下述对比中：可以看到Bert在少训练集下就能达到较好的结果，也为后续的定制化模型奠定了基础。

舆情系统本身可以看作为信息工程架构，客户可以容忍数据精准度，但是不允许相同的数据持续犯错。可学习、可持续、可定制已经变的尤为重要。这也是深度学习建模平台的由来。

下面是整体的业务架构和流程分析，具体技术细节可参照：NLP模型开发平台在舆情分析中的设计和实践。

四、微服务架构
下面对互联网架构演进之路进行总结如下，其中带颜色标记的为实践中的产物。

舆情业务应用系统从最核心几个业务功能，目前已经扩展至几十个业务模块。同时借助成熟的底层模块，快速沉淀出金融舆情、行业版等众多项目。大致经过以下三个阶段。

单体架构

在业务初期，使用SpringBoot作为单体应用开发程序，可极大加快业务推进速度，简易架构如下：

单体架构的优点在于其易开发、易测试、易部署、易扩展，但是业务耦合严重，也为业务扩展、服务治理带来了新的挑战。例如：登录服务和查询服务在一个单体应用中，因为查询服务是一个耗内存的操作，高峰时会引起FullGC，致使登录功能异常。

微服务架构

微服务可以定义如下：

⼀种架构⻛格，将单体应⽤划分成⼀组⼩的服务，服务之间相互协作，实现业务功能。每个服务运⾏在独⽴的进程中，服务间采⽤轻量级的通信机制协作（通常是HTTP/JSON）;

每个服务围绕业务能⼒进⾏构建，并且能够通过⾃动化机制独⽴地部署；

很少有集中式的服务管理，每个服务可以使⽤不同的语⾔开发，使⽤不同的存储技术；

参考：https://www.martinfowler.com/articles/microservices.html。

随着业务扩展，业务耦合严重，开发效率低下、排查问题困难等。秉承业务维度垂直拆分和功能维度水平拆分的原则，同时尽量避免分布式事务等复杂度问题。拆分后架构图如下：

微服务拆分功效：

业务逻辑层：拆分后服务模块30+；

监控体系建立：日志监控、Metrics监控、调用链监控、告警系统、健康检查；

配置中心：灵活可视化的配置管理中心；

开发效率、团队协作能力提升。

云原生架构

云原生包含了一组应用的模式，用于帮助企业快速，持续，可靠，规模化的交付业务软件。其特点如下：

容器化封装：以容器为基础，提高整体开发水平，形成代码和组件重用，简化云原生应用程序的维护，在容器中运行应用程序和进程，并作为应用程序部署的独立单元，实现高水平资源隔离；

动态管理：通过集中式的编排调度系统来动态的管理和调度；

面向微服务：明确服务间的依赖，互相解耦。

借助百分点科技内部云平台，将微服务结构容器化封装，极大的降低了部署、运维的成本，也为服务的稳定性增加了保证机制。下面主要介绍一下云平台的基础概念和应用成效。

平台基础概念：

命名空间

管理常规用户的资源访问权限的中央载体，让一组用户组织和管理他们的内容，并与其它群体区隔开来。是用户账号的唯一公共URL访问地址。

容器

Docker容器为资源分割和调度的基本单位，封装整个软件运行时的环境，为开发者和管理员设计的，用于构建、发布和运行分布式应用平台。

镜像

含有启动Docker容器所需的文件系统结构及其内容，因此是启动一个Docker容器的基础。采用分层的结构构建。

项目

通过标签标识的多个版本的镜像组成。

构建

将输入参数转换为结果对象的过程；通常用于将输入参数或源代码转换为可运行的镜像从构建镜像创建Docker容器并将它们推送到集成的容器镜像仓库（Harbor）

S2I构建：通过注入应用源代码到Docker镜像并且组建新的Docker镜像来生成可运行的镜像新镜像中融合基础镜像和构建的源代码，并可搭配docker run命令使用。S2I支持递增构建，可重复利用以前的下载依赖项和过去构建的构件等。

服务

平台部署应用的最小单位，一个服务为一个功能单元，如mysql数据库服务。是定义容器实例的逻辑集合以及访问它们的策略，一个服务至少包含一个容器实例，服务通常用于为一组相似的容器提供永久IP。在内部，服务在被访问时实行负载均衡并代理到相应的支持容器实例，可以在服务中任意添加或者删除支持容器,而一直保持服务可用。

配额

在同一个命名空间内可以创建的最大对象资源数量，以及每个容器请求的计算/内存/存储资源。

高级编排

编排模板：描述可以参数化和处理一系列对象，生成的服务、构建配置和部署配置。可以为开发人员即时创建可部署的应用。

平台资源对象层级关系：

目前平台代码构建支持三种模式：

智能构建

基于平台所提供的Builder镜像，自动下载应用源码进行编译。在基础镜像之上，自动编译代码。

Dockerfile构建

用户自己编写Dockerfile，指定代码库、Dockerfile位置及代码分支后可以构建项目镜像。

自定义的Dockerfile，可以指定自定义基础镜像以及编译环境变量、配置信息等构建出更复杂的编译或运行环境，构建灵活性相比前者更高。

Push构建

通过平台提供的push构建流程，将本地定制化镜像上传到镜像仓库，导入后的镜像可以在平台中进行部署、调试、使用。

平台Scale功能包含水平伸缩和垂直伸缩，以下是水平伸缩的例子：

平台提供容器实例监控，可以按照时间区间图形化展示容器的CPU、内存和网络的使用情况：

总结

企业SaaS一般是围绕获客、转化、留存这三个阶段展开，平台的易用性、数据的准确性和实时性等都是客户留存的核心要素。在多年的实践中，大数据架构以数据湖为ODS层，来保证对原始数据高效、灵活的处理，同时为其他业务线开放数据处理能力。AI平台架构提供一套端到端的闭环流水线，打造个性化、智能化的业务。微服务架构通过容器化，极大的降低维护成本，同时保证线上稳定性。随着SaaS产品矩阵的扩充，百分点科技在金融舆情、企业品牌监测等多个方向进行积极尝试，底层平台架构在业务的快速落地中起到了重要作用。

高考志愿月残风
因为早就铁了心要复读，高考志愿对我们来说似乎不是个问题，但是老公依然比较认真地给儿子报了学校，当然都是些可望不可即的好高校，如果录上就是天上掉馅饼，可堪记入高考录取史册的奇迹。初出成绩时，我们手里拿着厚厚的两本招生手册，虽然老公几年来成功地帮多位亲戚朋友报考了满意的学校，虽然很想在今年能为亲儿子大展拳脚，我们还是在报与不报这间纠缠了好多天。最终决定填志愿一是想再给自己一次实习填报的机会，二是让孩子
祝贺自己坚持打卡21天琴韵无声
一直清楚自己的自律性太差劲，从来都是间歇性的踌躇满志、持续性的自甘平庸。开学前小尘老师发了一个倡议：坚持写300天，直通教育行走大舞台。怪有吸引力的，但又害怕自己没办法坚持下来。最后在忐忑与怀疑中问小尘老师要了一个号跟随他们一起试试，到今天我居然也坚持了21天！人们把一个人的新习惯或理念的形成并得以巩固至少需要21天的现象，称之为21天效应。这是说，一个人的动作、或想法，如果重复21天就会变成一个
越来越不确定的生活 Sherry顾敏
曾有人说过，2019是最好的年份。那年我在西藏晃了半个月，自由而又无虑，之后再无那时的心境与无束。是疫情让世界颠覆？不是，源于世人的贪，人为制造积累出太多的垃圾，让这个世界越来越不确定。桃花树下好嗨哟因为环境的污染，孩子们越来越容易生病。一个妈妈带着3岁的孩子买糕点，“不上学吗”？“刚刚住院出来，又病了，什么都不吃，唉！只有这家的糕点还肯吃一点”。孩子们带病生长仿佛已成常态。得鼻炎的、过敏的、近视
何为私董会？瑜馨私教瑜伽張盈伽
2019.5.17星期五17-34大家好NAMASTE何为私董会？“私董会”这一组织形态起源于1957年美国割草机公司总裁罗伯特·诺斯与其他4位CEO创办的总裁圆桌小组，他为这种人脉圈内部的交流起名为TEC(决策者委员会)。TEC创办的初衷是为老板们提供一个相互切磋、智慧碰撞的平台，后逐渐发展为将一些没有竞争关系、没有利害冲突的企业总裁结合成的小组，每月定期举办会议，让他们成为彼此的「私人董事会成
路由器类型与接口详解 wespten 网络协议栈网络设备 5G 物联网网络工具开发网络智能路由器
一、路由器简介路由器是构成IP网络的核心，其最基本的作用就是连接不同类型的网络，智能选择最佳的信息传送线路。除此以外，路由器还具有访问控制功能。路由器也可以算作是一台专用计算机，可以听懂并翻译各种网络协议，就像一个会讲各种语言的人一样。1、路由器功能路由和转发：可以决定数据包从来源端到目的端所经过的路由路径（host到host之间的最佳传输路径），这个过程称为路由。将路由器输入端的数据包移送至适当
FPGA中建立时间与保持时间以及应用 Mr.zhang_FPGA FPGA verilog 建立时间保持时间 FPGA时序
FPGA中建立时间与保持时间以及应用建立时间与保持时间的概念触发器中的建立时间与保持时间寄存器级建立时间与保持时间建立时间保持时间模型相关时序参数建立时间保持时间实际应用解决时序问题的一些方法建立时间与保持时间的概念对于数字系统而言，建立时间（setuptime）与保持时间（holdtime）是基础，数字系统的稳定性绝大部分都取决与系统是否满足这两个条件，很多人都只是知道两者的概念如：建立时间：信
今天只想夸自己宝玉葫芦
今天只想夸自己：今天一早起来蒸鸡带苏州在儿体校停车时没有按次停车的车位，他开车沿着体育场绕了两圈，开始骂骂咧咧口出恶言穷凶极恶，我居然接纳了这样的他，他内在的熊熊怒火必须发泄掉，他可以这样，我允许他这样，他有资格这样；我安静的下念可以找到停车位，果然有了停一天只收10元的停车位，完美下午在洗浴中心度过，与孩子呆一起时，我感觉看孩子的眼神都能把最坚硬的钻石化掉，内心满满的爱都溢出来了图片发自App吃
伊朗冰淇淋：甜蜜与诗意的千年之恋岭南松罗家庆
藏红花冰淇淋作者：妤妤姐我难以描述自己的悲戚忧伤，只好把内心的痛苦深深隐藏。花园中虽然开放了无数花朵，我却看不到色彩，也嗅不到芳香。波斯花园当你漫步在在帕萨尔加德的旧花园里，寻觅五月蔷薇的踪影时，有人和你吟哦起这样一首小诗，你心中的小女孩是否又将苏醒，带着好奇与憧憬开启新一段浪漫之旅?(杂杂妹：主编大人好闷骚啊~)苏丹的晚会上，群臣争相作诗没错，你来到了这个盛产情歌王子的国度——伊朗。夜幕下的三十
筑基2 变态心理学 1概述胡晓会
胡晓会中原焦点，高级七期讲师八期中级九期、心理咨询师、婚姻家庭咨询师2022.8.12坚持分享第1602天变态心理与心理健康八个章节学习不要对号入座，记住自己是正常的。1.变态心理学概述2.心理正常与心理异常3.常见心理异常的症状4.常见精神障碍5.心理健康与心理不健康6.心理不健康状态的分类7.关于健康心理学8.压力与健康变态心理学概述：人的心理心理正常心理异常1.大多数人都是心理正常的。心里异
C# 开发与 Allen-Bradley PLC 的 EtherNet/IP 通讯接口威哥说编程 c#tcp/ip 开发语言
一、背景与动机Allen-Bradley是RockwellAutomation的核心自动化品牌，其PLC（ProgrammableLogicController）广泛应用于工业自动化领域。Allen-Bradley控制器支持通过EtherNet/IP（IndustrialProtocol）进行通信，这是一种基于工业以太网的开放协议。在工业信息化过程中，越来越多的系统需要将SCADA、MES或自定义
【C# in .NET】20. 探秘静态类：抽象与密封的结合体阿蒙Armon C#in .NET c#.net java
探秘静态类：抽象与密封的结合体一、静态类的底层本质：抽象与密封的结合体静态类作为C#中特殊的类型形式，其底层实现融合了抽象类与密封类的特性，形成了不可实例化、不可继承的类型约束。1.IL层面的静态类标识定义一个简单的静态类：publicstaticclassStringUtils{publicstaticboolIsNullOrEmpty(
APP开发注意事项
不仅仅是移动APP，包括面向服务的SOA架构，都需要制定一套统一、规范的接口，那么，做这样的后端接口需要注意哪些问题呢？1、跨平台性所谓跨平台是指我们的接口要能够支持不同的终端，比如android、ios、windowsphone以及桌面软件、网站等，一套接口，支持多端，就像当年Java的口号一样“WriteOnce,RunAnywhere”。当然从本质上讲，服务器端的接口跟终端是没有太大关系的，
高仿古驰酒神包在哪里买，宝藏店铺你值得拥有潮奢之家
高仿古驰酒神包在哪里买？更多详情加薇信了解：88195525作为追求时尚与品味的人士，我们经常会对一些名牌包包产生浓厚的兴趣。而古驰(GUCCI)作为一个世界级的奢侈品牌，一直以其独特的设计和高质量的制作在市场上引领潮流。其中，古驰酒神包(GucciDionysusBag)更是备受追捧，成为了很多人心目中的时尚首选。然而，正品古驰酒神包价格昂贵，对于大部分消费者来说并不实惠。于是，高仿古驰酒神包因
Jetpack Compose 中 Kotlin 协程的使用儿歌八万首 jetpack android android ui Compose kotlin 协程
本文将带你系统性地理解JetpackCompose中协程的使用场景、API设计理念、生命周期对齐、性能优化与常见误区，助你写出既响应迅速又稳定可靠的现代AndroidUI代码。1.为什么在Compose中离不开协程传统View系统就离不开异步：网络请求、数据库I/O、动画……进入声明式UI时代，异步需求不仅没减少，反而更复杂——状态驱动让数据变化更加频繁。协程凭借以下优势成为Compose首选：语
通过 Coze 实现最小规模客服系统的过程 charles666666 产品经理交互自然语言处理人工智能
数字化转型浪潮中，即使是小型企业也渴望拥有高效、智能的客服系统，以提升客户满意度和运营效率。然而，传统客服系统的高昂成本和复杂实施流程让许多小型企业望而却步。Coze的出现，为小型企业提供了低成本、快速部署的智能客服解决方案。本文将详细阐述如何通过Coze实现最小规模客服系统的全过程，从需求分析到上线运营，助力小型企业快速落地智能客服。一、需求分析：明确目标与痛点在启动项目之前，明确需求是关键。对
猫眼电影优惠券免费领取？哪里可以领猫眼电影的优惠券? 高省APP珊珊
猫眼电影优惠券可以通过多种方式免费领取，以下是一些常见的方式：【高省APP】（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。高省是公认的返利最高的软件。珊珊导师高省邀请码666123，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。猫眼
2023-10-31 江星格
如何不在意别人的看法？刚刚看到这个题目：如何不在意别人的看法啊？——这个问题对我说感触比较深！我来说一下自己对这个问题的几点看法！希望大家能给予真诚的意见！一：自卑与不足我是一个六零后的女人。在我出生的年代可以说是十分的艰苦。可是，五十年代出生的姐姐们常说我生在福中不知福。我也是只好装着没有听到TM的话。可是，在那样的年代，我上学的时候，因为是家里最小的女儿，所以，常常穿的衣服都是姐姐她们穿过的旧
Kotlin函数式接口 Kiri霧 kotlin 开发语言 android
Kotlin中的函数式接口（SAM接口）简介单一抽象方法接口（SingleAbstractMethod，简称SAM接口）是Kotlin中一个重要的概念。它增强了函数式编程的能力，使接口仅能拥有一个抽象方法。这一特性支持SAM转换，即允许使用lambda表达式来创建接口的实例，从而使代码更加简洁、可读性更强。Kotlin拥抱函数式编程理念，而SAM接口正是连接Kotlin面向对象特性与函数式范式的桥
蒙田：与人交往时，最重要的品质是沉默与谦虚国际艺术大观
沉默与谦虚是交谈中非常有用的品质与人交往方面，我经常注意到这个缺陷：我们不去认识别人，而一心标榜自己；不思努力获取新知识，而是兜售自己的货色。沉默与谦虚是交谈中非常有用的品质。当这个孩子得到知识后，要教导他谦虚谨慎，有人在他面前说话不中听，听到不要怒形于色。因为抨击一切不合自己心意的东西，这是极不礼貌的讨厌行为。让他乐于自我改正，不要自己不愿做的事都怪别人，不要跟大众的习俗背道而驰。他要观察每个人
IdeaVim 配置与使用指南 Kiri霧 java-ee intellij-idea
一、什么是IdeaVim？IdeaVim是JetBrains系列IDE（如IntelliJIDEA,WebStorm,PyCharm等）中的一个插件，让你在IDE里使用Vim的按键习惯，大大提升效率。安装方法：在IDE中打开设置(Settings)→插件(Plugins)→搜索IdeaVim→安装并重启。Vim的各种模式Vim主要有以下几种模式，每种模式有不同的快捷键：模式名称进入方式作用普通模式
在三线城市开什么店比较好？推荐5种比较好做的生意！古楼
说句实话，在三四线城市，很多人打一辈子工都赚不到二三十万，那怎么办？有什么创业项目适合三线城市发展呢？想在城市、乡镇找到切入点，可以做以下几种生意：①电商综合导购平台【高省】2022疫情对各行业影响还是很大，许多工厂企业宣布破产，服务业、餐饮业等遭遇巨大冲击，囤货性微商在走下坡路，生意越来越难做，很多人都在寻求副业，或考虑转型，然而有那么一群人最近却火了，他们就是“券商”。“券商”，顾名思义，就是
线性代数小述（三）天宫风子线性代数决策树机器学习
线性代数小述（三）byAmamiyaFuko此去经年返，安知胡不归？前言FU⭐️KO首先需要对上一篇的线性组合的概念做一个更正，然后是考虑行列式相关的内容。目录1.线性组合2.行列式-行列式运算的定义-拉普拉斯展开线性组合线性组合是对一个向量的分解。考虑一个二维空间，若某一向量与两个向量在同在该空间中，且这两个向量是线性无关的（不平行的），则必然有这个向量对于后两个向量的线性组合表示，如Av1ˇ+
HTTPS协议原理 program-learner Linux网络编程 https 网络协议
HTTPS协议原理一.前言-为何要有https协议二.加密与中间方劫持1.什么是加密2.为何要加密3.对称加密1.小例子2.好处和缺点4.非对称加密5.数据指纹/数据摘要三.站在设计者的角度提出方案1.只使用非对称加密:且只有server有密钥2.只使用非对称加密:且双方都有密钥3.非对称+对称:client一个对称,server一对非对称4.如何解决中间人攻击问题四.CA证书1.介绍2.CA证书
2022-05-17 齐家与女性经营家庭盟盟的育儿日记
关于齐家和成熟女性是如何经营家庭的！齐家这个词听着像是男人的事，其实也非常需要家庭中女性的智慧，这个对女性幸福来说非常重要，这个幸福其实是可以掌握在自己手里头首先，我们现在说齐家这个词齐家，来自于《论语》，古时候是给帝王读的，是教皇帝的，修身齐家治国平天下，这个顺序很重要，不能乱。是因为古时候的管理者，希望百姓能够自省自律，有所不为，成为不肯做坏事的好人，别人效仿他，从家族到国家，用心改变自己的态
MySQL Online DDL详解:从历史演进到原理及使用 SHENKEM mysql
本文介绍了MySQLOnlineDDL的发展历史，包括各个版本的改进，重点讲解了Copy和Inplace算法，以及OnlineDDL过程中的锁策略。还分析了DDL操作的需求、MySQL5.7和8.0的功能特点，以及使用限制和注意事项。摘要生成于C知道，由DeepSeek-R1满血版支持，前往体验>❃博主首页：「码到三十五」，同名公众号:「码到三十五」，wx号:「liwu0213」☠博主专栏：♝博主
不要经历这些事以后，才明白为什么活着康安爱努力
你是不是有些时候也不知道为什么要活着？是不是也在某一瞬间，突然感到心力交瘁，觉得这个世界好像就只剩下你一个人了似的。你躺在床上，明明一切看起来都是那么的和谐，但仍然会感到巨大的失落与无力。可我们明明经营者良好的人际关系，赚着良好的钱，但在某一刻，那股巨大的孤独感，迷茫感，仍会铺天盖地的涌上你的心头。1我相信我们所有人都曾遇到过这样一个问题——当你平时没有什么需要的时候，很容易得到帮助，可一旦真的发
buildroot+qemu+arm64虚拟环境多种方式启动linux内核左家垅的牛 linux 运维服务器
Qemu：QEMU是一款开源的硬件虚拟化软件，可以在不同的主机平台上运行虚拟机。它通过动态的二进制转换，模拟CPU，并且提供一组设备模型，使它能够运行多种未修改的客户机OS。QEMU采用全系统仿真，可以模拟完整的计算机系统，包括处理器、内存、存储和外围设备。它提供硬件仿真，允许在一个虚拟环境中运行不同体系结构的操作系统和应用程序。QEMU可以与KVM一起使用，进而接近本地速度运行虚拟机。目前，QE
蜂享家怎样才能赚佣金?蜂享家怎么赚钱? 高省APP珊珊
蜂享家是一款电商导购应用，为用户打造一个电商购物优惠平台，用户可以在这个App中领取主流商城的商品优惠券。目前，蜂享家已经逐渐构筑起了集淘宝、天猫、京东、拼多多等各大主流电商平台，饿了么、美团外卖等外卖平台，旅游、票务、出行、加油等高频生活服务全场景的线上生活商城。秉承着“以客户为中心，成就奋斗者”的价值观，蜂享家将精选好货，发挥平台导购能力，帮消费者实实在在省钱的同时，为消费者精选更优质的商品，
京东优惠券免费领取平台哪个最好用？高省APP大九
在京东购物时，优惠券是许多消费者寻求额外折扣的重要工具。为了帮助用户找到最好用的京东优惠券免费领取平台，本文将详细介绍高省APP的特点和优势。大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码111112，注册
论“人工智能生命体”站在那个高度？（之二）中國龍在廣州人工智能-智能体-具身智能人工智能
第一部分：人工智能生命体人工智能生命体，提及的是《人工智能生命体新启点》一书，原文附后，本文中以本书代表。《人工智能生命体新启点》一书，是在现今科学技术发展，从人工智能、智能体、具身智能等大环境下，形成的一种全新理念的理论指导，以此发展出具有自我意识的人工智能生命体，拥有现代科技并以生命体的形式出现，具备类人类般的思想活动，更好的体现与融入人类的社会环境；具有自我意识的智能生命体就如人类的拥有大脑
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

百分点大数据技术团队：舆情平台架构实践与演进

你可能感兴趣的:(百分点大数据技术团队：舆情平台架构实践与演进)