CrisAppleYan

从物理转AI、战数据库，95后程序员的职业选择

【CSDN 编者按】这是一位95后程序员的自我思考之旅，关于为何放弃难得的保研与出国机会、为何离开看似最佳选择的大厂加入前途未知的创业公司、为何从如火如荼的AI领域转入数据库领域的故事。《新程序员004》带你走进刘继聪的程序人生。希望能给职业成长路上有些许迷茫与困惑的年轻程序员们一点启发。

作者 | 刘继聪

出品 | 《新程序员》编辑部

我叫刘继聪，是复旦大学2015级的学生，最初在自然科学试验班，分流进入物理系，然后转专业进入计算机系，也因转专业政策降了一级，于2020年毕业。我放弃了保研和出国的机会，进入阿里巴巴一年后，加入涛思数据。

刘继聪

在我短短三年的职业生涯中，先后辗转字节跳动（实习）、某创业公司（实习）、阿里巴巴、涛思数据。研究方向从NLP（自然语言处理）、ML（机器学习）转为DB（数据库）。本文是我对过去三年职业方向选择的回顾与复盘，希望你读过我曾经历的迷茫与困惑后，不会走上同样的弯路。

本文已收录《新程序员001-004》

菜鸟起航——从物理系转入计算机系

一个刚刚参加完高考的学生，不会很清楚大学设立的专业是做什么的，进入大学后可能会很难接受所选专业与预期的差距。因此，大二时我选择从物理系转入计算机系。

和计算机结缘，源于物理系的一个项目——实验室设备管理系统。当时，我负责Web与服务器相关的功能，因为无人指导，只能在网上找教程自学。我清晰地记得，当我用“世界上最好的语言”PHP写出第一版程序——一个LAMP架构的CRUD系统时的感受。随着项目的迭代，系统不断重构，前端后续换成了JavaScript，后端则换成了基于Python的Django。

与此同时，我选修了物理系的C++课程，这门课主要讲C++如何应用于计算和模拟方面。我人生中第一个较大的C++项目就是那门课的期末作业：用经典的蒙特卡洛方法，做伊辛模型（Ising model）的模拟。我做了一个命令行程序，只要输入不同的参数，就能够生成对应的模拟结果，并用OpenMP做并行的加速优化。后来我才发现由于数据依赖，我写的并行程序比串行程序慢几倍。

我觉得写代码非常有意思，或许比在物理实验室修设备更有趣，于是，顶着降级的代价，我转入了计算机系。很快我发现，即使我自认为已经写过很多代码，但也一度被各路大神虐得体无完肤。

我所在的拔尖班大部分同学都在ACM队，而数据结构课的老师是复旦大学ACM队教练。整个课程体系非常竞赛化，每周都会用OJ（在线判题系统）测试，OJ类似于LeetCode，但区别在于，它只显示答案错了，却不告知产生错误的输入数据。因此，调试就完全靠猜。开始时，我在测试中一分都拿不到，每周光是完成作业就几乎花掉我所有时间。为了获得更好的测试成绩，有很多次，我都坐在通宵自习室写代码，直到天亮。渐渐地，我能够在每周的OJ测试中拿到满分，期末拿到A。在刚转入计算机系最痛苦的第一学年，我的绩点便拿到全系第一。

后来，我在复旦获得各种各样的奖项：一等、二等、三175等奖学金，以及数模竞赛和物理学术竞赛的国家一等奖和上海市一等奖，还有泛海学者、优秀学生等荣誉（见图1）。从自我怀疑、焦虑不安变得坚定、自信。如今想来，我认为那门数据结构课程是一个台阶，拼尽全力再上一层，才能看到别样风景。也正是这段竭尽全力刷算法题的经历，使我在几乎零准备的情况下进入字节跳动实习，并拿到了各个互联网大厂的秋招Offer。

图1 在复旦大学所获奖项与荣誉

在计算机系的选修课中，我接触到了更广阔的计算机世界与更深入的知识，也做了很多有趣的项目。

比如，数据库课程的期末项目与PostgreSQL有关，要求利用PostgreSQL的框架，实现两个UDF函数，计算字符串的Levenshetein Distance和Jaccard Distance，并且尽可能优化执行效率。通常，优化无非是降低算法复杂度、常数优化。助教提醒我们把PostgreSQL的嵌套循环连接改成块嵌套循环连接，显然这是附加题，且难度较大，很少有同学去做。临近期末季，即使项目完成得再好，也不会比其他人的成绩好多少，而将时间完全投入复习，争取考试拿高分才是更有性价比的选择。不过，在我看来，做项目比复习有意思。在期末考试前的那个周末，我将全部时间投入项目中，看着评测的执行时间从十几秒优化到一秒内，过程中的收获，远比期末的成绩A更重要。

此外，我还选修了分布式系统、数据挖掘、密码学原理，甚至是这辈子都可能不会再用到的信息安全原理、计算理论基础等课程。同时，我和同学组队做了很多有趣的项目，部署Hadoop和Hive、分析不同任务中的性能瓶颈、使用Spark进行分布式计算等等。很多项目，如LZMA压缩算法、Hive的性能分析实验、SVM的实现与收敛分析等，都让我觉得分外有趣。

职业选择——从AI到DB

除了上课，计算机学生的另一条主线是科研与实习。

进入计算机系的拔尖班后，要求选导师、进实验室，由于当时的主流是AI，复旦大学的NLP实验室很强，于是我就加入了NLP实验室。在实验室异常拥挤，本科生一座难求的情况下，稀里糊涂过了一年。当时我想去校外看看工业界都在做什么。

大三时我在字节跳动的AI Lab实习。适逢BERT以横扫六合之势，刷新了NLP众多Task的SOTA（State Of The Art，最高水平），我们基于BERT做中文错别字检测工作，该项目后来发表于ACL会议。

改模型的工作不够有趣，在进入大四前那个暑假，我进入香港科技大学交流，跟着导师研究GAN（Generative Adversarial Networks，生成对抗网络）。虽然我在AI领域学习的导师都是业界、学术界的知名专家，但我却没能产出亮眼的成果，以至于我现在都不敢提他们的名字。

机缘巧合下，一位做数据库的同学引领我接触到另一个领域——Data Infra（数据基础设施）。作为TiDB的贡献者，他也带着我进入TiDB社区做贡献。彼时，我开始系统性地学习分布式系统和数据库，成为开源社区的贡献者，并萌生了去做数据库，更准确地说，去做Data Infra的想法。

临近毕业季，摆在我面前的路有三条：保研升学、参加工作、出国深造。由于保研外校需要参加夏令营（而当时我正在香港科技大学交流），本校又没有特别合适的导师，我便放弃保研，去追秋招的末班车。出国留学是我给自己的后路，因为我有科研经历，能拿到推荐信，英语也不成问题。但出乎我意料的是，秋招非常顺利，我拿到了所有面试公司的Offer，其中既有阿里巴巴、腾讯这类大型企业，也有PingCAP这类创业公司。

在某互联网大厂的终面中，我遇到了一位同样复旦毕业、工作十多年的学长。当我透露出想做数据库的意向时，他反问我：“年轻人都想去做些有技术挑战的事情，我当年也是。但去创业公司做数据库，你真的想好了吗？未来好几年，你可能都比在互联网大厂做业务的同学薪资低，同时还要承担更多不确定的风险，你能接受吗？”

最终，我选择了阿里云，从事基础架构的工作。

秋招结束后，距离毕业和正式入职还有好几个月的时间，我了解到一位学长在某创业公司做技术负责人，便去做了实习生。在那里，我第一次用Go写微服务，第一次接触生产环境中的真正运行的Kubernetes，第一次用C++写TensorFlow……这段经历，也让我对创业公司留下好感，至少不输互联网大厂。

疫情在那个冬天爆发，无法返校，毕业时也只和部分同学匆匆相聚又相别。上海到杭州不过49分钟动车车程，恰如从学生到职场人的转变，快得令人猝不及防。下一站，杭州阿里。

第一份正式工作——阿里巴巴

或许是得益于我之前还算丰富的实习经历，又或许是我在学生时代做了很多有挑战的课程项目，使我很快适应了新的环境，上手了新的工作内容。在入职首月，就解决了一个困扰组内技术专家半年之久的问题。

背景是这样的，当时我们的监控系统探针直接安装在客户的ECS（阿里云服务器）上，客户可能会购买很多ECS，组成集群。我们需要抓取集群内的网络拓扑关系如TCP连接，然后绘制成可视化的拓扑图。该过程相比一般的分布式微服务追踪，难点在于：

不对客户的技术栈做假设，Java、Python、PHP都有可能；
要做无侵入式，不希望用户改代码；
要适配Kubernetes、非Kubernetes及各种Linux内核版本。

彼时已经实现的技术方案有根本缺陷，是通过轮询/proc目录下的TCP文件来做的，但问题是，采用轮询方式只能抓取此刻正存在的连接，如果连接是不断发起并立刻释放，那么，轮询方式无法保证抓取全量数据。解决该问题最好的方法是用eBPF，而eBPF是相对新的技术，只有在较新版本的Linux内核中才能得到良好支持。据当时的统计数据，绝大多数客户的技术环境都不能良好支持eBPF。

当我加入后，了解到这个问题已经困扰大家许久，我花了一周业余时间做调研，发现有一个内核模块—auditd，可以较好地解决这个问题。

auditd是一个比较轻量级的内核Log模块，能够在很旧的内核版本中运行，可以对所有的监控系统进行调用，并打出Log。那几天，我的业余时间都在做新方案的Demo。如我所料，它确实可以实现我们要的功能。后来，我又花了几周时间调试，真正将Demo转变成一个生产环境中可用的产品，并将其上线。正因此，我在转正时得到了极好的评价：“确实超出预期了，没想过让他做这件事”。

此外，我每天晚上都会花费大量时间阅读组里的代码，入职第三个月时，我已经可以画出组里系统的架构图，给入职的新人讲解各个模块的划分及其相互关系。入职第六个月，我已经阅读了权限范围内的几乎所有代码。后续随着组织架构的变动，我开始成为一些项目的Owner。

当然，我也遇到过一些不大不小的挑战。比如：对于Java Agent，为了在premain模式下实现字段和方法的添加与删除，我用ByteBuddy写了一套注入工具替换原本的JVM-Sandbox。与此同时，我开始对软件工程和云有了更深的认知，也对基础架构的理解更加深刻——同样被称作基础架构，但工作内容可能天差地别。

如果把云上的众多服务以平台侧和管控侧作划分：平台侧相当于提供云上数据库、消息队列等服务，部署形式对用户可以完全透明，用户可仅以API的方式调用；管控侧的典型特点是侵入性，例如探针，需要将服务安装到用户的环境中。我所在的工作组，工作内容便属于后者，管控侧的麻烦在于适配用户各种各样复杂的环境，其自身的核心能力、技术难度与挑战都明显弱于平台侧。因此，我发现自己进步的速度也渐趋缓慢，组里业务的发展状况也不如人意。

岁末、春节，疫情仍在持续，在那个冬天，我没能回家。

杭州开放了很多免费娱乐，给这个冬日带来了一丝暖意，可我无心玩乐。尽管在这份工作中取得了不错的个人成绩，但我确信一定会离开这里，这一次，我必须确定目标、规划未来。

春节后，我开始和公司内部的不同团队接触，结果却让我失望。很多我以为做着内核研发的部门实际上只做管控和写控制台；还有一些内核部门，工作范围太小；至于其余部门，则并不欢迎校招新人转岗。与此同时，我看到Data Infra的环境正在悄然改变。一些令人振奋的声音传到了我的耳朵里：

“所有人都看好DoorDash这些明星Pre-IPO，而Snowflake这类公司当时招人都挺困难，但那些进去的人后来发现他们的收益远远超过了其他人……”
“Snowflake的发行价已经上调了，上市当天就暴涨了超过100%……”
“Snowflake的数据确实好，它的NRR是173%，也就是说假设一个用户去年在Snowflake上花费了1美元，那么今年他将平均花费1.73美元……”
“Confluent上市、Databricks大额融资……”

这时，我才发现：去创业公司做数据库，已经不再是一件需要靠情怀去支撑的事。随着这个行业内热钱的涌入，有前途的创业公司会获得大额融资，更关键的是，对于这类技术公司，人才是核心的投入与资产，因此，他们愿意花钱，也有充足的资金和大厂抢人。确定大方向后，我又花了一些时间做调研，以找到更具体的目标。

期间，我也在积极地准备面试。一方面，我开始系统性地研究基于LSM Tree的存储引擎，完整阅读LevelDB的代码，阅读部分RocksDB的源码，并对比、分析MergeTree、WiredTiger等存储引擎；另一方面，研究Lock Free与Wait Free等算法，学习Hazard Pointer、RCU等技术，阅读Folly中MPMCQueue的实现。我将学习内容以及过往在数据库领域的经历都写入简历，作为面试的敲门砖。

最终，我敲定首选目标——做时序数据库TDengine的涛思数据。

首先，TDengine是开源产品，我已经多次看到TDengine登上GitHub Trending榜，我能够从代码及其运行直接判断它是否有真材实料；其次，通用OLAP数据库虽然被炒得火热，但竞争也非常激烈，或许不如从细分赛道入手，而在细分赛道中，时序数据库与图数据库的增长最为迅速，我相信IoT设备会持续不断地增长，产出越来越多的数据，我看好它的前景；再次，涛思数据的招聘页上醒目地写着“超越BAT的薪资”，我认同这样的人才观，愿景与待遇缺一不可，如此才能招聘到最优秀的人才；最后，面试本质是双向选择的过程，我需要充分利用面试的机会了解未来TDengine还要做哪些事、有哪些挑战，如果这个产品被认为已趋成熟、只能做些小修小改，那不是我想要的。

新的征程——涛思数据

从杭州搬到北京，我与涛思数据的故事从2021年7月拉开帷幕。数据库内核的研发工作我很快上手，并在转正后的首次季度总结中拿到了“最佳新人奖”（见图2）。

图2 涛思数据“最佳新人奖”

现在，我在涛思数据负责流式计算引擎的研发。TDengine 2.0中提供了连续查询的能力，它本质是一个时间驱动的批处理，无法处理乱序数据的问题，且性能消耗很大。我的目标是为现有的TDengine实现一个真正的流式计算引擎，挑战之大远远超乎此前所有的工作与项目。

我一边系统性地学习流式计算中的Exactly Once Message Processing、分布式快照等容错理论，一边研究Kafka、Flink的源码与实现机制，并跟踪SIGMOD、VLDB、ICDE等大会中相关研究的最新进展，了解Railgun、Hazalcast Jet、Ray Streaming等新引擎的设计，同时关注着Decodable等流式ETL工具和Materialize、KsqlDB这类流式数据库的产品形态与定义。我必须关注前沿工作与数据库领域中的新玩家，因为我不希望做一个在设计之初就落后于时代的产品。

若想TDengine成为流式计算的源，我需要将其改造成一个可重放、可确认的源，类似于Kafka的消息队列，能够高效定位指定的记录、并确认消费记录位点，这比起用Raft Learner异步复制出Change Log的方案要复杂、完善得多。接着，我会改造现有的查询引擎，使其能够在隔离的资源环境中持续运行，并持续接收上游源发送出的数据进行实时增量计算，变成一个流式计算引擎。以一套执行引擎来融合OLAP的查询与流式计算，我会用代码来践行我的想法，也期待焕然一新的流式计算引擎面世。

未完的故事

正如我刚起步的职业生涯，我的故事也才刚刚开始，远未完结，本文或许是一个阶段性的总结。

在我的成长过程中，在我迷茫与挫折时，得到了很多人的帮助。他们有的帮我找到了新方向与道路，有的让我有勇气和决心接受新挑战。因此，我也愿意分享我的经历。不管是在AI领域的曲折，还是在工程领域的相对顺利，以及在我面对选择时的思考与决策，都希望能给你一些启示与帮助。

比起盲目的闷头苦干，我更相信正确的选择对人生和职业有更大的影响。本文复盘了我职业生涯中几个至关重要的选择：从物理系转入计算机系；从研究AI转做Data Infra；从放弃保研与出国到加入阿里巴巴，再到离开阿里巴巴加入涛思数据。

得益于那些充满挑战的课程与项目，为我打下了坚实的技术基础与算法功底，使我有了选择的权利，让我能够快速进入想去的领域。而花费大量时间在多个不同领域中探索，也让我有所得、有所失。我赞同图灵奖得主John Hopcroft的观点：“我不认为本科生做研究是一种好的经历。我不鼓励他们这样做，除非他们想要继续深造，去大学攻读博士学位，那么他们最好发表过论文。但这是不幸的。”

借用强化学习理论，这是一个exploration（探究）与exploitation（利用）的dilemma（两难困境）：如果你想利用本科短短几年的时间在某个方向做出好的研究，那么你就要牺牲exploitation，提前开始exploration的过程，而过早的exploration可能陷入局部最优无法逃脱，当某天你意识到这一点，想要调整参数，那时想逃出这样的局部最优又会带来极高的沉没成本。

某种程度上，我庆幸自己没有在物理或AI这些路上走到尽头才想起转身，而是找到了更适合我的方向，让我能做更喜欢的工作。另外，虽然学习、科研与实习是主线，但我也“浪费”了很多时间来享受大学生活中“自由而无用”的快乐。在陷入死胡同时，是很难靠自我力量走出来的，而我有一帮很好的朋友，他们在我迷茫与困惑时让我看到新的方向、给我帮助与力量，这是我大学生活中绝不后悔的一部分。

以上，就是献给和我一样迷茫、困惑的年轻人们的肺腑之言。

作者介绍：

刘继聪，TDengine研发工程师，毕业于复旦大学，曾就职于阿里云。目前正在为TDengine 3.0设计并实现全新的分布式消息队列与流式计算引擎。

END

《新程序员001-004》全面上市，对话世界级大师，报道中国IT行业创新创造

— 推荐阅读 —

☞字节迎来新 CFO，或重启上市；马斯克以 440 亿美元收购 Twitter；FFmpeg 支持 JPEG-XL|极客头条
☞基础能力、分布式能力、系统应用…OpenHarmony 3.1 Release 版本带来全方位升级
☞50 岁的 C 语言，掌控 Windows、Linux、macOS 等操作系统半边天！

—点这里↓↓↓记得关注标星哦~—

一键三连「分享」「点赞」「在看」

成就一亿技术人

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Tomcat：Java Web应用的幕后英雄互联网动态分析 tomcat
在当今数字化浪潮中，Java作为一门成熟且广泛应用的编程语言，支撑着无数企业级应用和互联网服务的稳定运行。而在JavaWeb开发领域，Tomcat无疑是一个举足轻重的存在，它宛如一位默默耕耘的幕后英雄，为众多Web应用提供了可靠的运行环境。Tomcat的起源与发展Tomcat的故事始于1999年，当时SunMicrosystems（后被Oracle收购）与Apache软件基金会合作，旨在为Java
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

从物理转AI、战数据库，95后程序员的职业选择

你可能感兴趣的:(数据库,分布式,大数据,编程语言,人工智能)