CDA·数据分析师

AI人工智能的下一个拐点：图神经网络迎来快速爆发期

作者 | 刘忠雨
来源 | AI 前线（ID：ai-front）

图神经网络（GNN，Graph Neural Networks）是 2019 年 AI 领域最热门的话题之一。图神经网络是用于图结构数据的深度学习架构，将端到端学习与归纳推理相结合，业界普遍认为其有望解决深度学习无法处理的因果推理、可解释性等一系列瓶颈问题，是未来 3 到 5 年的重点方向。2019 年图神经网络有哪些研究成果值得关注？2020 年它又将朝什么方向发展？让我们一起来一探究竟。

1 GNN：从尝鲜进入快速爆发期

2019年以来，图神经网络技术（Graph Neural Network， GNN）得到了学术界极大的关注与响应。各大学术会议纷纷推出 GNN 相关的 workshop，在投中的论文中，以 Graph Network 为关键词的论文数量也呈现井喷之势，下图给出了近三年，上述关键词在各学术会议上的增长趋势：

GNN 在经历过 2017-2018 年两年的孕育期与尝试期之后，在 2018 年末至今的一年多时间里，迎来了快速爆发期。从理论研究到应用实践，可谓是遍地开花，让人应接不暇。在理论研究上，GNN 的原理解释、变体模型以及对各种图数据的拓展适配等工作成为了主流。而在应用实践上，GNN 更是展现出了前所未有的渗透性，从视觉推理到开放性的阅读理解问题，从药物分子的研发到 5G 芯片的设计，从交通流量预测到 3D 点云数据的学习，我们看到了 GNN 极其广阔的应用前景。本文将对近一年各大顶级会议（如 ICML、NIPS、CVPR、ACL、KDD 等）上的 GNN 相关论文进行梳理，重点从理论研究和应用实践两方面解读过去一年 GNN 的进展。由于时间和篇幅有限，本文并没有对每一个方向都进行全面的总结与概括，感兴趣的读者可以根据文中给出的论文链接自行查漏补缺。

2 GNN 的原理、变体及拓展

GNN 作为一个新兴的技术方向，其原理解读以及各类变体与拓展构成了理论研究的热点，这些论文很好地回答了 GNN 的优缺点以及相关的适应性改造问题。

2.1 GNN 原理解读

当前 GNN 研究的第一个热点在于其相关能力的理论化研究。在 “How Powerful are Graph Neural Networks?” 和 “On the equivalence between graph isomorphism testing and function approximation with GNNs” 中，都对 GNN 在图同构问题上的表现进行了探讨。图同构问题是辨别给定的两个图是否一致，同构图如下图所示。这个问题考验了算法对图数据结构的辨别能力，这两篇文章都证明了 GNN 模型具有出色的结构学习能力。图中天然包含了关系，因此许多 GNN 相关的工作就建立在对给定系统进行推理学习的研究上，在这些研究中，“Can graph neural networks help logic reasoning? ” 和 “The Logical Expressiveness of Graph Neural Networks” 论证了 GNN 在逻辑推理上的优秀表现。“All We Have is Low-Pass Filters ” 从低通滤波的层面解释了 GNN 的有效性。这些原理解读，有助于我们对 GNN 的特色专长建立一种更加清晰的认识。

2.2 GNN 的各类变体

GNN 模型的相关变体研究是领域内的另一个热点，这些变体在一些方面提升了 GNN 的能力表现。我们知道 GCN 模型来源于图信号上的傅里叶变换，“Graph Wavelet Neural Network” 引入了图信号上的小波变换来改造 GCN 模型，将卷积计算变换到空域局部邻域内。将数据表征从欧式空间转化到双曲空间，不仅能获得更好地层次化表示，同时能大大节约空间维度，“Hyperbolic Graph Convolutional Neural Networks”和 “Hyperbolic Attention Networks” 同时将 GNN 拓展到了双曲空间上去。

在 “MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing” 和 “Diffusion Improves Graph Learning”中，同时将原始 GCN 中的邻居定义由一阶拓展到高阶，强化了模型低通滤波的特性。

2.3 GNN 在各类图数据及任务上的拓展

图数据是一个种类繁多的数据家族，模型对这些不同类型的数据如何适配，是 GNN 发展的另一重要方向。下表给出了相应的概括：

在图数据相关的任务上，图的分类是一个重要而又未完全解决好的问题，其难处在于如何在图数据上实现层次化的池化操作从而获得图的全局表示，“Graph Convolutional Networks with EigenPooling”中给出了一种新的操作思路。

3 GNN 相关应用

近几年，以深度学习为代表的人工智能技术给产业界带来了新的变革。该技术在视觉、语音、文本三大领域取得了极大的应用成果，这种成功，离不开深度学习技术对这三类数据定制化的模型设计工作。脱离于这三类数据之外，图数据是一种更加广泛的数据表示方式，夸张地说，没有任何一个场景中的数据彼此之间是孤立存在的，这些数据之间的关系都可以以图的形式进行表达。下图给出了一些图数据的使用场景：

如何将图数据的学习与深度学习技术进行深度结合成为了一个迫切且紧要的需求。在这样的背景之下，图神经网络技术的兴起恰似一股东风，第一次使得我们看到了深度学习应用到图数据之上的曙光。实际上，在最近一年，GNN 的应用场景不断延伸，覆盖了计算机视觉、3D 视觉、自然语言处理、科研、知识图谱、推荐、反欺诈等场景，下面我们将逐项概括。

3.1 计算机视觉

在前几年跨越了视觉识别的大门之后，推理相关的视觉任务已经成为了了各大 CV 顶会的主要关注点，如：视觉问答、视觉推理、语义图合成、human-object interaction 等，甚至如视觉的基础任务，目标检测也需要用到推理来提升性能。在这些任务中，已经大量出现应用 GNN 的相关工作。下面我们以最常见的视觉问答任务举例说明，在“Relation-Aware Graph Attention Network for Visual Question Answering”一文中，给出了将 GNN 与视觉模型结合的示意图：

在上图中，视觉模型的作用是提取给定图像中的语义区域，这些语义区域与问题一并当做图中的节点，送到一个 GNN 模型中进行推理学习，这样的一种建模方式，可以更加有效地在视觉问答中对问题进行自适应地推理。

另外一个有意思的场景是少样本或零样本学习，由于这类场景下样本十分缺乏，如何充分挖掘样本之间的潜在关联信息（比如标签语义关联、潜层表达关联）就成为了一个至关重要的考量因素，引入 GNN 成为了一个非常自然的动作，相关工作有“Rethinking Knowledge Graph Propagation for Zero-Shot Learning”、“Edge-labeling Graph Neural Network for Few-shot Learning”。

3.2 3D 视觉

3D 视觉是计算机视觉的又一重要发展方向，世界是 3D 的，如何让计算机理解 3D 世界，具有极其重要的现实价值。3D 视觉中，点云数据是一种十分常见的数据表示方法。

点云数据通常由一组坐标点（x,y,z）表示，这种数据由于映射了现实世界中物体的特征，因此存在一种内在的表征物体语义的流行结构，这种结构的学习也是 GNN 所擅长的。需要说明一点的是，在 3D 视觉中流行的是几何学习 Geometry Learning，当下，几何学习与 GNN 在一些场景如点云分割、点云识别等正在深度融合，相关论文有 “Graph Attention Convolution for Point Cloud Segmentation”、“Semantic Graph Convolutional Networks for 3D Human Pose Regression”。

3.3 自然语言处理

GNN 与 NLP 的结合，关键点也在于 GNN 优秀的推理能力。GNN 在一些场景如：阅读理解、实体识别与关系抽取、依存句法分析中都有应用。下面我们以多跳阅读（Multi-hop reading）为例，多跳阅读是说在阅读理解的过程中，往往需要在多篇文档之间进行多级跳跃式的关联与推理，才能找到正确答案，相比较以前的单文档问答数据集，这是一个更具有开放性与挑战性的推理任务。下图给出了多跳阅读的样例：

在“Cognitive Graph for Multi-Hop Reading Comprehension at Scale”一文中，作者基于 BERT 和 GNN 的实现可有效处理 HotPotQA 数据集中有关多跳阅读问题的数百万份文档，在排行榜上的联合 F1 得分为 34.9，而第二名的得分只有 23.6。

3.4 科研场景

如果我们把原子看做图中的节点、化学键看做边，那么分子就可以表征为一张图。这种以图来表示分子的方法，可以将 GNN 结合到很多实际的科研场景中，如蛋白质相互作用点预测、化学反应产物预测等，这些场景有利于将深度学习的快速拟合能力带入进药物研发、材料研发等行业中去，提升研发效率。

在“Circuit-GNN: Graph Neural Networks for Distributed Circuit Design”一文中，作者将 GNN 结合进高频电路设计（如 5G 芯片等）场景，大大提升了电路电磁特性仿真计算的效率。下图给出了系统示意图：

3.5 知识图谱

由于知识图谱本身就是一种图数据，因此知识图谱 +GNN 的组合自然就成了解决各类知识图谱问题的新手段。关系补全或预测问题是知识图谱的一大基础任务，通过关系的推理补全可以大大提升知识图谱的应用质量，下图给出了关系补全的一个实例：

在论文“Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs”中，作者选择用 GNN 对知识图谱进行建模，相比之前基于单独三元组关系的推理，基于 GNN 的方法可以更好地捕捉三元组邻域复杂而隐含的模式信息，这种优势对完成关系补全任务具有十分重要的作用。

实体对齐是知识图谱的另一类任务，给定多个知识图谱，需要首先确定各自图谱中的哪些实体描述的是同一个对象，完成这项工作才能正确地将它们合成一个大的知识图谱。论文“Multi-Channel Graph Neural Network for Entity Alignment”提出了一种基于 GNN 的实体对齐方案，实验表明，在多个数据集上，该方案均取得了最好的效果。

近几年，知识图谱在工业界声势日隆，在这种语境下，我们也称知识图谱为业务图谱，在论文“Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks”中，作者成功运用 GNN 技术对电影业务图谱进行建模，在电影流行度预测上效果表现十分出色。

另外，知识图谱与推荐系统结合也成了近期一个比较热门的方向，这部分可参考下一节推荐系统中的讲解。

3.6 推荐系统

推荐是各大互联网公司十分重要的营收手段，因此一直以来备受工业界与学术界双重关注。过去这几年，推荐系统由早期的协同过滤算法发展到 MF 模型、再到之后的 Wide&Deep，以及基于 Network Embedding 的方法，可以明显地看到基于神经网络的方法正在逐渐占据主要位置，而 GNN 的出现，又一次大大加速了这个技术趋势。

以电商平台的推荐为例，推荐系统的核心数据在于用户 - 商品交互的二部图，而基于神经网络的多数方法将二部图中的实体映射到一个合适的向量空间中去，使得在图上距离越近的两个实体在向量空间中的距离也越近，如下图所示：

GNN 本身是一种深度模型，与推荐系统结合之后，多层 GNN 模型可以更好地捕捉用户与商品之间的高阶协同关系，论文“Neural Graph Collaborative Filtering”中，作者论证了多层 GNN 所带来的“Deep”与“High order”效益对推荐质量的有效提升。

除了推荐系统算法模型本身的研究，另一种思路在于如何使推荐系统有效融合进额外的信息，如用户端社交网络的信息、商品端商品知识图谱的信息。这类信息中通常也蕴含了极强的关系，因此可以非常自然地与用户 - 商品二部图合在一起构成一个更大的异构图。下图给出了与电影知识图谱的结合示意图：

有了这样的图数据抽象之后，引进 GNN 进行推荐建模也就成了一种自然的选择，相关论文有 KGAT:“ Knowledge Graph Attention Network for Recommendation”、“Metapath-guided Heterogeneous Graph Neural Network for Intent Recommendation”、“Session-based Social Recommendation via Dynamic Graph Attention Networks”等。

另外一个十分重要的、也与推荐系统息息相关相关的业务场景是广告点击率（CTR）预测。该场景下的样本通常是由多领域的特征数据构成，比如用户域、设备域、广告域等等，如何建模这些数据域之间的特征交互，成为了该任务的核心。最近基于神经网络的方法都是直接将各个域之间的特征拼接起来然后送到上层的网络模型中，以期得到这些域之间的高阶交互，这种简单的非结构化的拼接方式，会大大限制模型的学习能力。在“Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Prediction”一文中，作者将各个域之间以图的形式连接起来（下图中的 Feature graph），然后用 GNN 建模各个特征域之间高阶复杂的交互关系，相比之前的模型取得了最好效果。

3.7 反欺诈

反欺诈业务是各大公司保证运营业务与营销业务正常开展的前提，通常我们所面临的欺诈问题包括：垃圾评论、排名欺诈、交易欺诈、薅羊毛、账户盗用等。这些欺诈现象的背后往往是黑产团伙协同作案，大大提高了反欺诈业务的打击成本。

关系数据的挖掘是绝大部分反欺诈业务开展最重要的技术视角，不论是基于欺诈风险传播的关联分析还是基于黑产团伙模式的结构化挖掘，图都是反欺诈业务人员的首选工具。在这样的背景下，GNN 也变得极有发挥空间。例如，论文“Heterogeneous Graph Neural Networks for Malicious Account Detection”中运用 GNN 对支付宝欺诈用户进行识别检测，“Spam Review Detection with Graph Convolutional Networks”中运用 GNN 对咸鱼上的评论进行欺诈识别。

4 GNN 开源项目总结

在 2019 年，图领域出现了不少新的开源项目，一些已有的开源项目也有较大的改善。

1 月，阿里妈妈开源了国内首个支持工业级图深度学习的框架 Euler，内置很多实用的图算法。

3 月，德国多特蒙德工业大学的学者们提出了 Pytorch Geometric ，实现了诸多 GNN 的变体模型，上线之后获得了大佬 Yann LeCun 的推荐。

5 月，著名图学习框架 DGL 发布 v0.3 版本（目前已经更新至 0.4.1 版本，也补齐了很多 GNN 的变体模型），0.3 版本在性能上有了非常显著的提升，相比 0.2 版本训练速度提高了 19 倍，同时支持亿级规模的图神经网络训练。

12 月，斯坦福大学的 Jure Leskovec 教授在 NeurlPS 2019 大会演讲中宣布开源 Open Graph Benchmark，通过这一数据集可以更好地评估模型性能等方面的指标。

同月，清华大学知识工程研究室（KEG）推出了大规模图表示学习工具包 CogDL，可以让研究者和开发者更加方便地训练和对比用于节点分类、链路预测以及其他图任务的基准或定制模型。

5 展望

展望来年，最可以确定的一点是 GNN 依然会保持如今快速发展的态势。从理论研究上看，不断解构 GNN 相关的原理、特色与不足，进而提出相应地改进与拓展，是非常值得我们关注的部分。另外，关于一直以来研究 GNN 所用的标准数据集，如 Cora、PubMed，这些数据集场景单一、异构性不足，难以对复杂的 GNN 模型进行准确评价，针对这一问题，近期斯坦福大学等开源的 OGB 标准数据集有望大大改善这个现状，在新的评价体系下，哪些工作能够脱颖而出，且让我们拭目以待。

在应用场景上，相信 GNN 能够带给我们更加亮眼的工作，除了在视觉推理、点云学习、关系推理、科研、知识图谱、推荐、反欺诈等领域有广泛应用外，在其他的一些场景，如交通流量预测、医疗影像、组合优化等，也出现了一些 GNN 相关的工作。大体上看，如何准确有效地将图数据与 GNN 二者有机结合到相关场景，是应用上需要着重考虑的事情，相信来年，会出现更多这样的工作来拓展 GNN 的应用边界。

学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
这个世界为何对女性这么苛刻遇见知见
图片发自App当今社会的女性，简直用金刚侠来形容都不为过。虽然早已过了男尊女卑的时代，但是这个世界并没有平等的对待女性。新时代的女性标准：上得了厅堂，下得了厨房，杀得了木马，翻得了围墙，开得起好车，买得起新房，斗得过二奶，打得过流氓，生得了孩子，养得了家庭。这个社会对女性有太多的不公平，既要求女性经济独立，又要求女性贤良淑德。所有的女性的在成长过程中没有任何一项是因为你是女性而给你开绿灯的。图片发
学霸父母学渣娃，这孩子真是亲生的？太扎心了！东北SK皇家成长中心
现在的社会，每个家庭基本都把孩子的教育放在第一位，哪怕父母平时上班再苦再累也不敢在孩子的教育上有丝毫的马虎，平时对孩子的照顾真的是无微不至，每天早起送孩子上学，晚上回家辅导孩子写作业，有的父母的文化程度非常高，但是每每到了辅导孩子写作业这个时候，父母们内心都有这样一种想法，这个孩子真的是我亲生的吗？真想一巴掌拍死他，我上辈子是做了什么孽生出这么一个智障的孩子，家里每每就要上演全武行，看看这些孩子到
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
提高教师信息素养，提高道德与法治课教学效益长白159宋彦红
提高教师信息素养，提高道德与法治课教学效益随着经济和社会的发展，信息技术已经运用到课堂教学中，为课堂教学展示了一个崭新的天地。的确，信息技术形象、生动、直观性强，能够将课本中的一些抽想的概念直接展示在学生面前，从而调动学生的眼、耳、脑，让他们兴奋起来，变被动学习为主动学习，充分发挥教师的教育引导作用，创造一个可以使学生积极参与的场景。在制作、使用信息技术的实践过程中，本文拟就教师提升信息素养的必要
越努力，越幸运！ Trulyjane
只有坚持，才可以做到～～记得以前在一本书上看过这句话:再深厚的夫妻感情，如果一方前进，而另一方保持色初心，止步不前，怎么也经不起岁月的考验，将会渐行渐远！当前是个务实的社会，很多的浪漫，没有面包的爱情经不起考验，所有的风花雪月都需要看似很俗却又不得不需要的东西～金钱。所以，无论你是什么身份，多去想想怎么赚钱，让自己无论说话还是做事可以随心，做自己想做的事，并且拥有话语权。越努力，越幸运！！
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
黄景瑜工作人员怒怼营销号！肖战事件就是他的前车之鉴板凳吃瓜小分队
无论社会怎样浮躁，我们自己也不可以浮躁。战胜浮躁的关键是明白自己真正的需要，保持一颗平常心，不要盲目攀比，不要羡慕别人，更不要唯利是图。一辈子很短，我们不能总是望着别人的精彩，羡慕着别人的人生，而忘记了经营自己生活，要知道，通过努力，你也能成为让人仰望的明星。如今，随着娱乐产业越来越成熟，每年的新星也是扎堆冒出。在我看来，与前几年不同的是，如今的新生代质量明显好过从前。“更专业了，更有礼貌了”也是
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
2021-11-18 安安303
刘红雅中原焦点团队分享第135天筑基第4课社会心理学接上一课，心理现象。需要和动机所有的动机行为受需要的影响，现在的孩子很多方面不需要，是因为得到的太多需要使机体内部不平衡的状态，现在很多需要满足的过多，是“厌”，孩子要越用越有用，没有用到自己，自己没有价值感成就感，他就不需要开发自己的潜力。对自己和孩子的生活留白不断的学习成长，实现自己。所有有情绪的地方是触动了需求，需求没有被满足，当一个人知道
一个纯真姑娘被现实社会磨灭了热情幽律
每个初入社会的人，都是满怀憧憬，热情对待这个社会，可往往都是被回馈以欺骗，恐吓，磨灭了热情。我的一个朋友，小吴，来自安徽的姑娘，初出校门，来到这座南方经济发达的城市，善良单纯，待人对事充满了朝气与热情。当时小吴所在的房产中介公司有一位女客户，是退休教师，谈吐方面能感觉得到很有素质，和她先生想要买房，小吴接待的。了解情况后，客户感觉经济方面还是有点压力的，所以委托小吴先帮她卖自己的旧房，周转开来再买
儿子开学报道第一天：我和公公一起送他去学校文又又
儿子今天是开学报道的的时光，儿子对于是谁送他去学校非常在意，他也想着自己一个人去学校，不要家长送，我们告诉他，可以等到他再大一点的话，就让他自己去学校。我还是一如既往的早起，5点闹钟响起，我的头还昏昏的，就窝在被子里看手机。看爆款文，看热点内容。还看了一会《明朝那些事》，看着看着，就觉得眼皮打架想要睡觉。可是我的潜意识还是提醒自己，起床吧，今天要6点钟起床，说好要叫儿子早起，今天他是8点钟要到学校
圣诞节后的人气又回来了？好丽友、特斯拉们的生意却不好做| 每周热点汇总饭Sir看天下
新的一年来了大家好，今天是2022年12月26日，星期一，农历十二月初四。这个月，相信我们很多人都遇到了身体不适的情况，饭Sir上周也因为发烧不得不停更了一周，这几天才刚刚恢复，好在这一切最后都能过去。疫情之外，一些好消息也逐渐到来，例如北京等多座大城市在年底的圣诞节期间又恢复了生机，一些迹象也在预示着久违的热闹春节要回来了。但另一方面，明年不确定的经济形势又带来一些不利的消息，不禁让人有些担心。
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
坚持“三步走”，推动我国人权事业发展 Ariel_Yogurt
6月16日出版的第12期《求是》杂志将发表中共中央总书记、国家主席、中央军委主席习近平的重要文章《坚定不移走中国人权发展道路，更好推动我国人权事业发展》。尊重和保障人权，是中国共产党人的不懈追求。努力夯实理论基础。推动人权事业发展的第一步是理解人权。作为青年干部，要想在人权事业全民发展的新浪潮中站稳脚步，就应该积极接受人权理论学习，坚持以人民为中心的人权思想，深刻认识党的领导是中国特色社会主义人权
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
线上到线下：相亲交友系统如何打造全方位恋爱体验 h17711347205 人工智能大数据
在数字化时代，相亲交友系统正逐渐成为单身人士寻找伴侣的重要渠道。我们的目标是打造一个全方位的恋爱体验，将线上的便捷性与线下的真实互动相结合，为用户提供一个无缝衔接的交友平台。以下是如何从运营角度出发，实现这一目标的详细策略。线上到线下：相亲交友系统如何打造全方位恋爱体验在快节奏的现代社会，相亲交友系统为单身人士提供了一个便捷的相识途径17711347205。然而，真正的恋爱体验往往需要线下的真实互
日常想打苏大强那个是小呆呀
在没有看都挺好之前，我朋友一直都在给我安利这部剧，没看不知道，这一看不得了，这一看，每一集我都想冲进手机里，揍苏大强！我之前觉得老二很废材，啃老，对家里人不尊重，后来看了十多集之后，我觉得老二一家其实挺不错的。就拿啃老来说，确实老二一家不对，买房娶媳妇全靠家里人卖房。但是放到当今社会，大多数年轻人都是这样的，钱不够回家找爸妈，工资不够用回家找爸妈。老二还是回家找爸妈给钱的，我们有时候更省事，直接一
游武汉城区历史最悠久宿舍：建在龟山脚下绿林中，另一片世外桃源喵星人日志
城市的拓展，往往伴随着老城区的拆迁改造而进行，这个过程代表着新旧建筑的更替，在武汉城区，这样的改造现象非常普遍。但在最近几年，随着社会整体对文物等老建筑的保护意识提升，类似的旧城改造速度早已放缓许多，这也让我们有更多机会一览城市老建筑的风采。比如在武汉汉阳区内就有一处历史最悠久的单位宿舍，它建在龟山脚下的绿林之中，背靠龟山南路和汉阳大道，闹中取静，年代久远，堪称另一片世外桃源，它的名字叫做大桥宿舍
2022-04-10 凤凰语言艺术吴老师
读刘院日更《再读稻盛和夫：习惯于用自己的承诺，倒逼自己成功》有感过去讲做人做事要“不言实行”，换言之，比起豪言壮语，默不作声、埋头实干才是美德。现如今社会，闷头干有时候也会失去动力。因为闷头干没有外界的监督，制定的计划只有自己知道，即使没有百分百完成，别人也不知道，久之就养成了得过且过的心态。就像当初自己花了不少钱报名学习日语一样，当时只是闷头学，没有开公失去了众人的监督，以致于后来因为工作和日常
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
【读书清单】《魔鬼心理学：你确定你是个正常人？》（三）小碗月牙
01心理学家发现，多数社交恐惧症患者都害怕与人聊天，平时他们会尽可能减少说话的内容和频率，而这样就剥夺了沟通的锻炼机会。02真正挽救社交恐惧症患者的方法，绝对不是逃跑，绝对不是回避，而是诚实地接纳和面对这一切。03对于自闭症患儿来说，他们对于社会是缺乏反应能力的，所做出的反应通常不是抗拒就是简单的模仿。04在引导和帮助患者融入社会的时候，一定要注意保持耐性，要懂得尊重和维持他们原有的生活模式，不能
作业二十八：《佐贺的超级阿嬷》解读三：生活很难，但也要笑着活下去。维伊的屋子
晚上别提伤心事，难过的事情留到白天再说，也就不算什么了。——《佐贺的超级阿嬷》当今社会，竟争非常激烈，很多人难免会有这样的情绪：消极、悲观、失望、抱怨、挫败感……如果带这些情绪生活，日子就难熬今天我们学习超级阿嬷是如何把日子过的有滋有味，如何在平淡生活的鸡毛蒜皮里发现快乐？昭广用阿嬷的故事把答案告诉了我们，永远不要忘记发现生活的美好香乐趣。图片发自App一、不是每个人都能顺顺利利的度过一生，也不会
如何培养孩子的独立性孙瑞华
最近好多小宝（2周岁以内）的妈妈反馈说孩子黏人，每次离开的时候哭的好伤心，不知道该如何处理，自己也非常的煎熬！很多父母认为孩子粘人就是不独立，于是用各种办法“逼”着孩子与自己分离。但其实小宝宝粘人是非常正常的。依恋是指婴儿与抚养着（一般指母亲）之间产生的特殊的情感关系，也是婴儿情感社会化的重要标志。依恋是婴幼儿与成人最早建立的关系之一，也相当于最早的人际关系，依恋关系的好坏会影响儿童的个性发展及影
上班族副业做什么可以月入2万？（男生女生都合适）氧惠好物
互联网的兴起，让社会掀起了一波“副业潮”，身边的人都在悄咪咪开启了副业，靠副业实现了双份收入，日子过得风生水起。我自己也是靠副业实现月入过万，并且成功逆袭转行的。我觉得在这个时代里，对于不满足自身岗位，想要寻求更大发展的人来说，选择一门可持续发展的副业作为努力的方向，为将来升级做铺垫，是非常有必要的。那对于我们普通人来说，该做些什么副业才有发展呢？下面小郁儿结合自己及身边人的经历，总结了5个能让你
你在更新什么？余衿笙
我在想，为什么现在好多了解到的东西更新得那么快？两三天前听到的流行歌，过几天就忘了，因为有新的流行歌代替;对上一个小鲜肉的了解还停留在他的名字和作品上，新的面孔就又出现了，人气不断高涨。好像我所了解的东西不去“更新”，不追上社会变化的步伐，就显得自己多落伍，随时会遭人鄙夷似的。但事实上，其实大可不必如此。一方面，我想，环境对个人的影响是确实存在的，时间久了必定会有随之变化的端倪。快节奏的生活，不断
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_