CSDN 程序人生

中国第一个 Apache 顶级开源项目的突围之路！

【CSDN 编者按】近些年开源大热，开源创业之风随之四起。作为近两年特别火的商业方向，开源创业者如何才能在一片红海中乘风破浪，在行业中占据一席之地？第一个由中国人主导贡献到 ASF 的顶级开源项目 Apache Kylin 做出了有效探索，本文作者 Kyligence 联合创始人兼 CTO、 Apache Kylin 联合创建者及 PMC 李扬，深入地分享了成立于 2016 年的 Kyligence 在开源创业“非功能性价值”探索之路上的思考与实践。

作者 | 李扬责编 | 何苗

出品 | 《新程序员》编辑部

如果用一个词形容目前的开源市场，想必就是“热潮”了。作为行业中的一员，我很欣喜能见证开源被热烈关注。互联网、云计算、大数据、物联网、人工智能等新技术不断发展，并与开源逐渐结合，为丰富的应用场景提供了支持。开源，作为软件行业创新引擎的地位不断增强，逐渐发展成强大的技术创新模式。如今，金融、零售、制造、电信等行业纷纷拥抱开源，开源已成为一种重要的科技创新渠道。本文将从开源项目 Apache Kylin 及其开源商业版 Kyligence 的创业和实践出发，分享经验，希望有所裨益。

开源发展，已经从蓝海变为红海

Apache Kylin 起步较早，自 2015 年毕业于 Apache 软件基金会( ASF )，成为第一个由中国人主导贡献到 ASF 的顶级开源项目，到目前全球有超过 1500 家公司正在使用 Kylin 。本质上说，它的核心是多维数据库，是一种特殊的 OLAP 引擎。我们期望通过智能化的技术与产品，让企业利用价值数据实现数字化转型，从而达成改变人类数据使用习惯的愿景。

正因身在开源以及开源商业化一线，我们能更直观地感受到开源市场的变化。随着开源项目爆发式增长，开源贡献者规模快速崛起，开源商业化公司市场也空前活跃。以纽约最大的风投公司 FirstMark 合伙人 Matt Turck 统计的 AI & DATA Landscape 为依据，如图1所示，可以看到很多垂直赛道中的开源项目已经暴增，从蓝海变成红海。

图 1 AI & DATA 全景图局部

在 Apache Kylin 专注的开源 OLAP 领域，从 2019-2021 近三年看，该领域出现的新项目已经呈指数级放量增长。我时常开玩笑，记得 2015 年 Kylin 从 Apache 软件基金会毕业后，行业里好像没有竞争对手，只有我们一家在解决这个问题。到最近不过短短几年间，美国和国内新涌现了很多不错的初创公司。

另外，从中国大环境来看，利好消息是：政策正在从战略上积极鼓励企业开源。《中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要》首次把开源纳入顶层设计，支持数字化底层技术建设，不断培育数字化发展新动能。

从《 2021 中国开源发展蓝皮书》调研情况来看，来自中国开发者、企业和科研机构的开源贡献在全球持续增加，获得越来越多的尊重和认同，中国开源的美誉度逐年提升。中国在全球开源生态中的整体地位也将同步提高，在一些优势领域将逐步占据领导地位。更重要的是，开源项目及基于开源的商业化产品逐渐在重要行业落地和使用，这不仅意味着开源已经从技术开源到产业开放，也代表着市场对开源的接受度大大提升，意义深远。我也不得不感叹，技术的精进、变革终究还是要到应用场景中去，这才是技术发展的“宿命”。

“数据是未来的石油”这句话大家肯定不陌生，用数据来驱动业务增长将是未来企业精细化运作的主要动力。但是因为数据源繁杂、技术间整合和平台间集成带来的难度，使得企业数据管理和分析的道路非常曲折。目前，开源项目 Apache Kylin 的用户主要来自海内外金融、零售、互联网、制造、通信等企业，而金融或是互联网企业一年在数据基础设施上的投入至少是千万到亿元级别。

基于数据驱动业务增长的行业需求与痛点，数据将被进一步地放量使用。当数据量暴增，企业该如何利用技术处理海量数据？IT 成本该怎么优化？IT 组织架构该如何调整以便于公司职员访问与使用？这些问题背后仍然有很多技术难题需要克服。

开源创业的“非功能性价值”探索

而今开源在技术创新、效率提升、成本降低等方面的优势进一步凸显，并成为各领域的技术底座。与此同时，我国数字化场景大爆发带来的信息技术栈需求缺口也在进一步扩大。开源作为技术创新引擎，将不断推动各领域技术发展，满足各类用户对“创新技术+敏态迭代”的需求。虽然开源讨论如火如荼，但新兴技术或者新兴领域的发展，无论技术层、市场层还是产品层，往往面临着人才短缺的问题。

对于开源发展的阻力，大家可以换个角度看。首先，人才问题也许不是人本身的问题，而是成本问题。有需求的企业需要用自己的技术人员来覆盖使用开源软件的成本，还是应该通过采购企业级开源商业软件来获得稳定可靠的服务？这是一大选择；其次，开源渗透进企业的另一大阻力是技术选择。前面我们也提到，目前的市场情况是开源项目种类繁多，且竞争激烈。毫不夸张地说，单就数据分析领域就有近二十个开源技术备选项。每个技术可能有开源版和企业版，这样一来企业进行技术选型以及结果评估往往需要花费不小的力气。以上两大选择都是我们实际接触到的“企业的纠结”。

开源以及开源商业化是市场环境中的常规路径，从创业者角度来看，我们并不焦虑，只需要将两个项目确定好边界，就能找到自己的立命之本。

以开源为基础，其技术发展的立命之本是什么？安全、可靠、稳定。

大家能够想象硬件也开源吗？其实硬件也有自己的开源市场。有没有这样一种可能：一台整车从硬件的设计到下面软件的架构，全是开源的？如果存在这种车，假如可以实现 3D 打印，你会打印出这样一台车供自己使用吗？我估计一般是不会有人这么做的。为什么？因为它不满足安全、可靠、稳定的刚需条件。回到开源的供应链条上，终端消费者会为什么付费？个人观点，他们不是为了一个功能付费。在数据分析领域，可替代功能性方案已经存在，企业用户最后都是在为系统的安全、稳定、可靠而付费，也就是为了非功能的部分而付费。

企业级的采购同样需要考虑“非功能性价值”，除了技术选型、人才支持、功能以外的“安全、稳定、可靠”价值也被看重。复杂度本身就是“安全、稳定、可靠”的敌人，在这个新高度上，能够解决非功能性问题的厂商会有更大的获利空间。

在云原生时代，数据使用与管理需求正在发生巨大的改变。对企业而言，如果平台不能“上云”，会越来越难以适应外界环境随时可能产生的剧烈变化。如何满足企业数据资产管理、固定/自助式分析、数据服务等需求就变得更加紧迫，因此让数据的使用门槛一降再降，且弹性灵活的云原生架构变得炙手可热。那么，开源创业企业如何满足这一类价值需求？我们将以一家云上企业的服务经验为例，分析其场景和痛点问题，希望能给部分 SaaS 企业以参考价值。

该企业是一家建站 SaaS 服务大型供应商，用户数超百万。这是一个典型的网站流量分析场景，场景业务模型相对稳定，但是它的技术挑战比较大。如图 2 所示，该企业早在 2017 年开始用 Apache Kylin 建设名为 Analytics Platform 的工具，其中的能力包括点击流分析、网页的 PV、UV、访问设备、来源等这些经典的客户流量，网站行为包括留存的分析场景和模型。由于全球客户数量众多，而 C 端用户对于查询响应速度的容忍度极低，绝大多数查询需要在一两秒内返回，这也是 To-C SaaS 供应商在提供数据服务时面临的共性挑战。

图 2 SaaS 企业痛点和诉求分析图

此外，在用户完成建站后，后台的数据查询报表服务 Analytics Platform 会成为一个提升用户留存的重要触点。由于用户以非技术人群为主，需要的是简单易用、跟产品结合度高的分析工具，而第三方分析工具往往较为复杂、学习成本高，因此用户对平台自带的 Analytics Platform 依赖度较高。提供这样的分析服务的运维难度也很大，为了服务不中断，需要持续 7×24 小时维护。为保证用户的满意度和留存率，平台必须确保数据服务的高稳定性。开源 Kylin 的工具和服务在可靠性方面相对而言会更依赖企业本身的技术能力，需要企业不断优化总体成本(TCO)。这就要求企业既要考虑云上的资源成本，又要投入大数据技术人员的成本，也就是在传统的烟囱式建设下需要很多的数据工程师。

经 Kyligence 服务团队评估与测试，企业决定迁移到 Kyligence Cloud 平台。其非功能性价值优势如图 3 所示。

图 3 场景架构图前后对比

释放 IT 生产力。可通过 SQL 的查询来自动优化业务模型。在模型使用过程的任意时间段，均可以人工灵活调整模型的设计，如增减关系表或分析维度、指标等。
成本优化。传统的部署方式即云上的 Hadoop+Kylin，部署后总体运营成本缩减主要来源是 Hadoop 集群优化，以云原生架构替代 Hadoop 的传统大数据层，减少了很多硬件成本和大量的运维成本。
有效支撑高并发。Kyligence Cloud 背后的多维模型下的预计算能力可提供稳定支撑。当查询计算都预先完成，在线服务时的计算量就能够保持稳定，并且与原始的数据量几乎无关。

综上来看，赋予企业业务数字模型的能力，为企业实现自动化的数据服务和管理，是满足其功能性价值需求以外，开源创业企业需要格外关注的非功能性价值点。

找准定位是关键

开源技术发展要突破重重技术阻力，而开源创业则需要树立能力边界，找准定位。

找准定位分为两种情况，一是找准自身的优势，二是找准服务目标/市场。前面我们曾谈到人才问题，其实潜在客户分成两大类，一种是科技型行业，像互联网、汽车等。这类行业有自己的技术主心骨，不太会向外部采购技术。其企业形象就是技术型的公司，除非十分必要，否则会尽量避免技术采购。另外一种是传统行业，其定位是解决行业问题，如金融、能源、零售等。它的价值是业务价值，所以技术对它来说是一种支撑，是一种基础设施，只要技术能够真正解决安全、稳定、可靠的问题，它愿意为此付费。因此创业需要树立最有价值的非功能性的部分，也就是企业需要找准定位，找到这部分增值优势。

从诞生以来，Kylin 一直都有关系型数据库的能力，也常常与其他关系型 OLAP 引擎对比，但它真正与众不同的是多维模型和多维数据库能力。在 2022 年，我们从Kylin 能力与优势、开源与开源商业版定位与目标、行业趋势与需求的角度进行了一次深刻的梳理。如图 4 所示，考虑到 Kylin 的本质和未来广泛的业务用途(不仅是技术用途)，团队明确定位 Kylin 5 是一个集统一、灵活、高性能、可扩展、云原生等特点于一身的大数据分析平台，用户可以在此完成众多数据分析，对接、支持、替换多种数据源，查询接口与计算引擎等工作。Kylin 也将成为企业海量数据分析和指标管理的坚实可靠底座，让普通人看得懂和用得起大数据，最终实现数据民主化。

图 4 橙色区域为 Apache Kylin 关注重点(图片来源：Apache Kylin)

除了产品和技术定位之外，创业过程中客户服务也非常重要。开源商业版Kyligence 要求“稳定第一、安全第零”。每当一个新安全漏洞出现，公司都会响起一级的红色警报，整个产研侧第一时间调动所有的力量解决问题，并告知客户此安全漏洞是否与客户现在的生产环境存在关系。若没直接影响，我们仍会进行多方面的复查和方案准备，防患于未然。如有影响，我们会即时响应并解决。

总结来看，开源创业需要多思考“企业的核心价值是什么？帮客户解决的是什么问题？”最常见的误区是认为自己的核心价值是能为客户提供一个现在没有的技术。这个认知可能是对的，但它一定很短暂，在开源充分的协作和信息互通之下，技术会飞快进步，任何一项新技术都可能快速被赶上。或许大家可以深度思考一下自己

在整个开源软件生态里的价值，能够吸引用户付费的价值通常不是一个功能点，而常常是一个非功能性的部分，找到这个非功能性价值，你的开源创业或许会变得轻松一点。

—————— 推荐阅读 ——————

《新程序员·005：开源深度指南&新金融背后的科技力量》特别策划了“开源深度指南”和“新金融背后的科技力量”两大专题。邀请到当今开源世界的先锋人物，包括Python之父Guido van Rossum，MySQL之父Michael "Monty" Widenius，Apache之父、OpenSSF开源安全基金会总经理Brian Behlendorf，MongoDB CTO Mark Porter、凝思董事长宫敏、Linux内核守护者吴峰光等，更有国内外开源基金会、知名企业代表，从开源安全合规、企业内部开源、开源技术创新、开源行业落地等多方面，为开源背后的开发者、企业、开源组织及开源社区提供更清晰的开源生态建设与升级版开源发展全景式图鉴。

而在金融专题中，来自中国工商银行、邮政储蓄、中信银行、广发银行、中国人民银行、平安科技、微众银行、蚂蚁集团等十数家传统金融机构和头部金融科技公司的技术专家为我们带来了关于各类新一代颠覆性技术的深入讨论和案例分析。深入解答开发者应该如何更好融入金融产业，以及金融科技的人才培养之道，真正做好金融科技的技术创新和数字化转型。

欢迎大家扫描订阅《新程序员》

《2022-2023 中国开发者大调查》重磅启动，欢迎扫描下方二维码，参与问卷调研，更有 iPad 等精美大礼等你拿！

☞年终反思潮！李彦宏：“马化腾说的问题，百度也都有……”
☞以防作弊，ChatGPT 遭教育部“拉黑”：师生禁用！
☞中国开源已成国际“第二梯队”佼佼者

融合网络实训室初步建设方案设想武汉唯众智创网络融合网络实训室融合网络融合网络实验室网络融合实训室网络融合实验室
一、引言在数字化浪潮席卷全球的当下，网络技术已然成为推动社会发展和经济增长的关键力量。从日常的生活购物到企业的运营管理，从便捷的社交沟通到前沿的科研探索，网络技术无处不在，深刻地改变着人们的生活与工作方式。随着5G、物联网、云计算、大数据等新兴技术的迅猛发展，网络技术领域对于专业人才的需求呈现出爆发式增长。据权威机构预测，未来几年，网络技术相关岗位的人才缺口将持续扩大。这些岗位不仅要求从业者具备扎
【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
CVE-2017-5645(使用 docker 搭建) JM丫网络安全
介绍:是一个与ApacheLog4j2相关的安全漏洞,属于远程代码执行,它可能允许攻击者通过构造恶意的日志信息在目标系统上执行任意代码Log4j2介绍Log4j2是Apache的一个日志记录工具,属于Java应用的日志框架,它是Log4j的升级版,性能更好,功能更多.它被广泛的适用于Java应用程序中,帮助开发者记录程序运行的时候的日子信息,是Java生态系统中最重要的一个日志框架之一漏洞编号:C
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
Python 赋能经济趋势与股票研究：数据驱动的投资洞察 Small踢倒coffee_氕氘氚笔记经验分享
在当今数据爆炸的时代，Python凭借其强大的数据处理能力和丰富的开源库，已成为经济趋势分析和股票研究的利器。本文将探讨如何利用Python进行以下方面的研究：**一、数据获取与清洗*****数据来源:*****财经数据API:**Tushare、AKShare、YahooFinance、AlphaVantage等提供丰富的股票、基金、宏观经济等数据。***网络爬虫:**使用BeautifulSo
GitHub一周热门ai项目 2025.3.17 BillyXie23 AI探索 ai 人工智能
项目1：Significant-Gravitas/AutoGPT地址:significant-gravitas.github.com/AutoGPT描述:AutoGPT致力于为所有人提供可访问的AI工具，让用户专注于重要事务。Stars:173,449推荐理由:适合想要探索自动化AI应用的开发者，支持自定义扩展，开源生态强大，适合构建智能助手、自动化流程等场景。项目2：AUTOMATIC1111/
嵌入式SDIO 总线面试题及参考答案大模型大数据攻城狮 fpga开发嵌入式面经 SPI USB接口 SD总线 SDIO总线牛客网
目录SDIO总线与SD总线的核心区别是什么？(附框架图）简述SDIO总线物理接口的组成及其功能（CLK、CMD、DAT0-DAT3）。SDIO总线支持的最大数据传输位宽是多少？如何配置？解释SDIO总线中的主从模式架构及通信流程。SDIO卡的功能类型有哪些（如Wi-Fi、蓝牙、GPS）？SDIO总线时钟信号（CLK）的作用及典型频率范围SDIO协议中的OCR寄存器作用是什么？如何通过CMD5获取卡
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
开源Nextcloud+Onlyoffice实现多人协同在线编辑功能(基本配置) 运维归一多人共享编辑私人网盘 nextcloud onlyoffice
系统软件版本CentOS7NextCloud21本文只介绍基本安装，不适用于企业级一、安装Nextcloud1、容器方式安装dockerrun-d--namenextcloud-p8000:80-v/data/nextcloud:/var/www
Ubuntu安装开发者平台Backstage xuhss_com 计算机计算机
Python微信订餐小程序课程视频https://edu.csdn.net/course/detail/36074Python实战量化交易理财系统https://edu.csdn.net/course/detail/35475Ubuntu安装开发者平台Backstage什么是Backstage?Backstage是一个构建开发者门户的开源平台。通过支持一个集中的软件分类，Backstage可以保存
纳米尺度仿真软件：Quantum Espresso_（20）.机器学习在QuantumEspresso中的应用 kkchenjj 分子动力学2 机器学习人工智能模拟仿真仿真模拟分子动力学
机器学习在QuantumEspresso中的应用在现代材料科学和纳米技术的研究中，机器学习（ML）技术已经成为一种强大的工具，用于加速和优化量子力学计算。QuantumEspresso是一个广泛使用的开源软件包，用于进行第一性原理计算，特别是在纳米尺度材料的模拟中。本节将介绍如何将机器学习技术应用于QuantumEspresso，以提高计算效率、预测材料性质和优化结构。1.机器学习与第一性原理计算
如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践网罗开发实战实战源码 devops 运维
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Android开源库——RxJava和RxAndroid 松仔log #Android开源库 android 开源 rxjava
RxJava和RxAndroid是什么？RxJava是基于JVM的响应式扩展，用于编写异步代码RxAndroid是关于Android的RxJava绑定RxJava和RxAndroid使用依赖implementation'io.reactivex.rxjava3:rxjava:3.1.0'implementation'io.reactivex.rxjava3:rxandroid:3.0.2'使用过程
FireRedASR：精准识别普通话、方言和歌曲歌词！小红书开源工业级自动语音识别模型蚝油菜花每日 AI 项目与应用实例语音识别人工智能人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发感兴趣，我会每日分享大模型与AI领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！微信公众号｜搜一搜：蚝油菜花大家好，我是蚝油菜花，今天跟大家分享一下FireRedASR这个小红书开源的工业级自动语音识别模型。快速阅读FireRedASR是小红书开源的工业级自动语音识别模型，支持普通话、中文方言和英语。该模型在普通话ASR基准测试
Feign性能优化以及最佳实践南川北渔 SpringCloud 性能优化 okhttp
1.Feign性能优化Feign底层发起http请求，依赖于其它的框架。其底层客户端实现包括：•URLConnection：默认实现，不支持连接池•ApacheHttpClient：支持连接池•OKHttp：支持连接池优化1：因此提高Feign的性能主要手段就是使用**连接池**代替默认的URLConnection。优化2：日志的级别，根据项目测试，确定最大连接数和单个路径的最大连接数，日志尽量用
推荐开源项目：Free Templates for AWS CloudFormation 褚知茉Jade
推荐开源项目：FreeTemplatesforAWSCloudFormationaws-cf-templateswiddix/aws-cf-templates:是一个包含各种AWSCloudFormation模板的存储库。适合查找和学习AWSCloudFormation模板的示例，以及用于构建自己的基础设施。特点是包含了许多AWS服务和功能的模板示例，可以快速地了解如何使用CloudFormati
展望 AIGC 前景：通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地 accurater AIGC 人工智能神经网络深度学习
喜欢可以到主页订阅专栏引言人工智能生成内容（AIGC）技术正在重塑内容创作、影视制作、广告设计等行业的底层逻辑。作为该领域的革命性技术代表，通义万相2.1凭借其开源特性、多模态生成能力和技术突破，成为全球视频生成模型的标杆。而蓝耘智算平台则通过高性能算力支持与分布式架构优化，为AIGC技术的规模化应用提供了基础设施保障。两者的协同不仅推动了AI生产力的跃迁，更开启了从技术研发到商业落地的全链条创新
kafka生成者发送消息失败报错：RecordTooLargeException 青椒1013 kafka 分布式
kafka生成者发送消息典型案例生产者发送消息失败：Failedtosend;nestedexceptionisorg.apache.kafka.common.errors.RecordTooLargeException:Themessageis1053512byteswhenserializedwhichislargerthanthemaximumrequestsizeyouhaveconfig
K8S学习之基础二十八：k8s中的configMap 云上艺旅 K8S学习 kubernetes 学习容器云原生
k8s中的configMapconfigMap是k8s的资源对象，简称cm，用于保存非机密性的配置，数据可以用key/value键值对形式保存，也可以通过文件形式保存在部署服务的时候，每个服务都有自己的配置文件，如果一台服务器上部署多个服务：nginx、tomcat、apache等，那么这些配置都存在这个节点上，假如一台服务器不能满足线上高并发的要求，需要对服务器扩容，扩容之后的服务器还是需要部署
Dubbo、SpringCloud框架学习种豆走天下 dubbo spring cloud 学习
学习Dubbo和SpringCloud框架是微服务架构的一个重要部分。这两个框架在分布式系统中起着重要的作用，分别是阿里巴巴和Spring团队开发的。下面我将为你提供一些基础知识和学习路线，帮助你更好地理解和掌握这两个框架。1.Dubbo框架学习1.1什么是DubboDubbo是阿里巴巴开源的一款高性能的微服务框架。它提供了RPC（远程过程调用）、服务注册与发现、负载均衡、容错、监控等功能。Dub
python提取excel数据批量生成固定格式的word文件的问题鱼弦【HOT】技术热谈 excel word
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）使用Python从Excel中提取数据并生成固定格式的Word文档1.介绍本项目旨在介绍如何使用Python从Excel中提取数据并生成固定格式的Word文档
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？北京华人开创公司北斗卫星授时 NTP时间同步 GPS对时装置 NTP 时间同步服务器网络时间服务器 NTP时间服务器网络系统时钟同步
京准电钟分享：医院网络内NTP时间同步服务器作用是什么？京准电钟分享：医院网络内NTP时间同步服务器作用是什么？时间同步技术必定将是整个大数据处理系统的重要支撑和保障。时间同步技术使数据产生与处理系统的所有节点具有全局的、统一的标准时间，从而使系统中的所有各种消息、事件、节点、数据等具备正确的逻辑性、协调性以及可追溯性。大数据产生与处理系统是各种计算设备集群的，计算设备将统一、同步的标准时间用于记
MindSpore：华为全场景AI框架的技术全景与生态实践彩旗工作室人工智能人工智能
一、框架概述MindSpore（昇思）是华为自主研发的全场景AI计算框架，于2020年3月开源，旨在实现易开发、高效执行、灵活部署三大核心目标。作为华为昇腾AI生态的基石，MindSpore支持端、边、云全场景覆盖，并深度融合昇腾处理器的算力特性，提供从模型开发、训练到推理部署的端到端能力。截至2025年，其月度开发者访问量已突破12万，成为国内开源社区最活跃的AI框架之一。二、架构设计MindS
DataEase：一款国产开源数据可视化分析工具不剪发的Tony老师编程技能 BI 数据分析 DataEase
DataEase是由飞致云开发的一款基于Web的数据可视化BI工具，支持丰富的数据源连接，能够通过拖拉拽方式快速制作图表，帮助用户快速分析业务数据并洞察其趋势，为企业的业务改进与优化提供支持。DataEase的优势在于：开源开放：零门槛，线上快速获取和安装，按月迭代；简单易用：极易上手，通过鼠标点击和拖拽即可完成分析；全场景支持：跨平台安装和多样化嵌入支持；安全分享：支持多种数据分享方式，确保数据
Python常用国内镜像源（清华、豆瓣、阿里云、中科大）老马达 #深度学习基础 python
使用Python最便捷的就是下载使用各种“包”，然而往往长时间不用就容易忘记，在这里将网上一些资源收集整理，一是方便自己日后使用，二是与诸君共享。一、代码清华大学开源软件镜像站：https://pypi.tuna.tsinghua.edu.cn/simple阿里云开源镜像站：https://mirrors.aliyun.com/pypi/simple/豆瓣：https://pypi.douban.
探索高效Arduino编程：FRP与Haskell的完美结合管吟敏Dwight
探索高效Arduino编程：FRP与Haskell的完美结合frp-arduinoArduinoprogrammingwithoutthehassleofC.项目地址:https://gitcode.com/gh_mirrors/fr/frp-arduino在众多开源项目中，有一个项目以其独特的技术栈和创新的理念脱颖而出，它就是基于Haskell的FRP（FunctionalReactivePro
Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)_anaconda配置python环境全栈工程师_oEe python 开发语言
2什么是Anaconda？Anaconda是一个开源的跨平台Python发行版本，支持WindowsmacOSLinux操作系统。Anaconda中包含了conda等180多个科学包及其依赖项。其中conda则是一个开源的软件包管理系统和环境管理系统，用于安装多个版本的软件包及其依赖关系，并在它们之间轻松切换。3Anaconda的安装进入Anaconda下载界面选择相应的操作系统，本文主要介绍在W
204页数字化转型：集团企业信息化规划方案公众号：智慧方案文库精选解决方案（附下载）大数据 database
建立统一共享的信息平台，集团总部能实时监控下属单位的库存、产量、成本、资金流等关键信息，有效利用大数据技术平台为管理层提供全面、及时、准确的决策信息支持。n推动生产、销售、新业务领域的自动化、数字化、网络化、信息化、集成化，为今后打造智能制造、智慧农业奠定坚实基础；n推进IT基础设施建设与提升，采用全新的架构设计理念，建成组件化、集中化、服务化、协同化的统一云平台，提供高质量、可重用的平台服务，营
如何在github上参与开源项目这个懒人 github 开源软件
1.创建GitHub账号如果你还没有GitHub账号，首先需要注册一个：访问GitHub官网。点击右上角的“Signup”按钮，填写注册信息并完成注册。2.找到感兴趣的项目GitHub上有成千上万的开源项目，你可以通过以下方式找到感兴趣的项目：搜索项目：在GitHub首页的搜索框中输入关键词，例如“机器学习”、“Web开发”等。使用高级搜索功能，通过语言、标签等过滤条件找到合适的项目。浏览Tren
树莓派搭php,Raspberry Pi 树莓派搭LAMP服务器平平无奇的美女树莓派搭php
目录：为什么要用树莓派?DebianLinux安全性操作系统性能优化配置网络开启sshMakingtheserveravailableontheInternetDNS安装apache安全MySQL安装PHP配置完成本文将会介绍如何把树莓派配置为一台LAMP服务器.这和把XUbuntu配成LAMP服务器有些相似,但是针对树莓派有些需要特殊处理的地方.下面是LAMP服务器的最通用配置:Linux–操作
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

中国第一个 Apache 顶级开源项目的突围之路！

你可能感兴趣的:(apache,开源,大数据)