喜欢打酱油的老鸟

构建生产机器学习系统的一些考虑

2020-02-02 08:30:00

作者：Marifel

编译：ronghuaiyang

导读

这篇文章介绍了为生产系统构建机器学习过程的很多方面的内容，都是从实践中总结出来的。

随着数据和计算能力的崛起，“机器学习”(ML)和“深度学习”(deep learning)这两个术语已经热议了好几年。虽然追随ML的潮流似乎很酷，但公司的第一步是评估业务是否真的能从中受益 —— 这是一个独立的职位。既然你的公司已经决定ML是一个必要的下一步，那么作为一个ML工程师，现在是时候考虑为生产系统构建ML过程的真正内容了。希望这篇文章能帮助你理解这些问题。

在这篇文章中，只要提到“初创”这个词，就意味着软件“产品”公司，除非特别提到软件“服务”公司。软件产品公司专注于构建自己的软件产品，而软件服务公司(如代理或咨询公司)则为客户构建软件。虽然这篇文章是为早期软件产品初创公司的ML工程师写的，但其中的一些考虑可能仍然适用于其他阶段或公司类型。

找到合适的工具

有多个机器学习软件可供选择，从开源工具如PyTorch， TensorFlow以及scikit-learn到管理机器学习服务的平台如，Google AI平台，亚马逊SageMaker和Azure机器学习平台。仅使用PyTorch和TensorFlow，就有许多像Hugging Face的transformer这样的开源库，它们提供了现成的模型作为起点。此外，ML在不同领域的研究论文每年都会发表，其中一些提供了开源代码。Papers With Code：https://paperswithcode.com/是查找带代码的论文的好资源。

在选择合适的工具时要考虑的关键因素有：

文档的质量
工具的开发状态(maintained vs. halted or deprecated，问题的严重程度，等等)
围绕该工具的其他工具的生态系统
开发人员社区对这个工具的参与是否积极
你对该工具的熟悉程度
使用该工具的团队规模
与工具有关的货币成本

就我个人而言，我觉得如果你是一家处于早期阶段的初创公司，你不需要权衡和找出所有这些因素。你总是可以从一个强大的候选工具开始，然后从那里开始。此外，如果你认为收益大于成本，则可以从一开始就使用托管ML服务。

何时开始做机器学习 vs. 机器学习周围的操作

在第一次开始时，最好从一个简单的基线模型开始。从更简单的模型开始可以帮助你调试pipeline中的问题，并帮助你确定更耗时的解决方案是否值得。那么如何建立一个简单的基线模型呢？

首先，“简单”是相对的。在某些情况下，简单实际上意味着一个简单的模型，例如硬编码一些启发式。而在其他情况下，模型本身可能很复杂，但是很容易应用。一些最广泛使用的数据集拥有最先进的模型，这些模型是开源的，列在研究论文或排行榜等地方，斯坦福问答数据集(SQuAD)就有这样一个排行榜。一种方法是查看一些顶级的解决方案，看看你是否能找到附加到相关研究论文的代码。

在早期启动阶段，你可能没有时间立即构建ML流程。通常情况下，你需要专注于让你的投资者和客户很容易就能看到的东西运行起来。调优过程很少出现在他们的脑海中。所以不要担心你最初的部署是否完美，只需要有一个工作成果 —— 一个看得见的最终产品。在基本产品构建之后，你可以更多地担心ML周围的流程，因为通常需要更多的停机时间来对ML流程进行小的、渐进的改进。

相反，如果你是一个代理商，出错的空间就更小，因为你要将完成的产品交付给不同的客户，并试图事先修复所有的bug。在交付一个或一组客户端产品之后，你将转移到下一个客户端合同上，并且通常没有足够的精力来进行进一步的改进。尽管如此，你还是要迅速行动。为了进展得更快，最好有更精细的ML过程。因此，对于代理商模型，从长远来看，也许在优化和自动化上预先花费更多的时间可以节省时间。

实验管理中的考虑

在ML中管理实验不是一件小事，当你在运行尽可能多的实验时，你的项目工作区很容易变得混乱。然而，在初创阶段，你没有几个月的时间来做数百个实验。你只需要推动一些更好的东西，然后尽快更新。不管怎样，进行某种实验管理总比什么都不做要好。以下是管理ML实验时需要考虑的一些事项。

模型版本

在Toucan AI，我们使用GitHub来存储我们代码的版本。GitHub很棒，但它不是用来对大型数据文件进行版本控制的。尽管存储库可以达到100GB，但GitHub建议将存储库的大小保持在1GB以下，此外，单个文件不能超过100MB。

你可以使用其他云存储选项，如谷歌云存储或Amazon S3。使用云提供商的命令行工具或web用户界面，只需创建一个bucket(文件夹)，允许对其对象(文件或文件夹)进行版本控制。但是，如果希望将云存储中的文件与GitHub上的项目存储库同步，则需要额外的手工工作。

因此，我们选择了最自然的集成，它结合了Git平台和其他云存储选项的最佳特性：数据版本控制(DVC)，被标记为“机器学习项目的开源版本控制系统”。DVC是一个命令行工具，它的子命令与Git子命令非常相似。在Git平台和云存储设置完成后，你可以运行DVC的‘add’和‘push’命令来设置版本，并在云存储中存储文件或文件夹。同时，可以通过DVC文件引用在Git项目存储库中跟踪大型数据文件。DVC的一个优点是只需要一些额外的类Git命令，这与现有的Git工作流没有太大的区别。

实验文档化

如果你正在进行超参数调优，则很容易忽略在指定日期为某个模型运行的特定设置。你可能还需要回顾你为准备或预处理上述模型所需的数据集所做的工作。你的Jupyter Notebooks有描述性的文件名，但是它仍然需要相当多的时间来处理首先发生的事情，或者如果你将预处理A或B应用于实验7。

一种解决方案是，在创建新的Notebook时，将Notebooks编号作为文件名的一部分(我喜欢使用“01_”步骤)，以后可以重新编号。对你的Notebooks编号有一个明确的命名约定对你的同事(以及未来的你)了解你是如何进行实验的非常有帮助。除了在实验中为Notebooks编号外，我们还使用开源平台MLflow来提供查看实验超参数和度量结果的web界面。

此外，在记录实验时，力求逻辑结构和简洁。充分利用文件夹结构和名称来组织你的Notebooks和训练脚本。假设当读者查看你的Notebook时，他们会从头到尾地阅读，所以要删除你临时插入的任何“草稿”单元格。根据经验，将Notebook上的试验限制在一个模型和一个数据集上，如果当前的笔记本太长，则创建一个新的笔记本。尽量让你最后的笔记本版本不包含训练或推理代码，这些应该放在可以在Notebook中调用的独立脚本中。最后，当使用像MLflow这样的软件生成实验记录时，尝试将运行实验的笔记本自动引用到生成的实验输出文件中。

测试框架

更好的度量结果并不总是与真实样本中改进的推理性能相关。此外，在生产ML系统中，ML模型并不是独立操作的：例如，你可能将启发式、预处理和缓存作为pipeline的一部分。因此，当尝试改进你已经拥有的ML模型时，你会意识到，生成适合真实世界的推理样本需要大量的时间。你需要深入研究更大的生产代码，以发现你试图改进的模型实际上在什么地方被调用。然后，你不希望只检查模型本身的输入和输出，还要检查整个ML系统的pipeline。你的“更好”模型如何影响整个系统，它是更好还是更坏？

为了将重点放在模型改进上，而不是提出推理样本或担心破坏生产pipeline中的某些东西，我们需要有一个自动化的系统或端到端测试框架。

在Toucan AI，由于我们的主要产品是AI销售代理，测试覆盖主要逻辑分支的样本对话就足够了，同时也提供了一种回归测试的形式。我们目前正在开发一个命令行接口(CLI)工具，它将在一系列示例对话中运行pytest断言。使用一个命令，所有的对话都可以被测试，如果任何测试用例中断，我们可以手动更新测试或者认为我们的“更好的”模型实际上并不更适合生产。

简而言之，有一个适当的测试框架对于理解当前和实验模型在生产ML系统中的表现是至关重要的。有了一个合适的测试框架，你的模型改进pipeline应该更有效地推进，允许你比以前运行更多的实验。

使用工具快速演进

从快速发展的库中提取代码并将其写入使用该库的修改过的旧版本的生产系统是很困难的。如何修改一个快速发展的库以满足你的需要并尽可能高效地应用它的最新更新？

我觉得没有正确的答案，只有许多不同的途径。一种方法是把他们的代码和你的代码结合起来，让它工作。另一种方法是使用他们的代码并完全升级旧版本，但这通常需要更长的时间。简而言之，考虑一下你有多少时间进行重构，以及重构的优先级是什么。在你自己的代码库和快速发展的工具变得更加稳定之后，你应该关注优先级，并考虑完整的重构。

实验整理

当你专注于取得成果时，往往很容易忽略整洁。考虑下一组要运行的实验，以及它的超参数集。发生了一个错误？没问题，更改输出文件夹上的时间戳并重新运行实验。然而，你最终得到的是由于试验不完整而生成的额外文件或文件夹。之后，你在MLflow中滚动一长串记录，寻找完成的实验，结果却让他们摸不着头脑。

解决方案是自动删除不想保存的所有试运行。例如，最好在第一次训练迭代完成执行之前就删除失败的运行。为了我们的同事和未来的自己，我们都应该尽我们最大的努力保持实验池的整洁。

关注点的分离

当你研究并尝试各种ML项目以希望改进你的模型时，你将遇到相互冲突的Python包需求。你最初可能在两个开发人员之间共享一个云服务器，但这很快就变得不方便了，因为你的安装可能会覆盖你的同事的运行环境。

进入Docker生态系统，这是一个轻量级的容器化软件平台，用于管理你的项目环境和依赖项。通过为每个ML模型和应用程序服务使用单独的Docker容器，我们可以主动减少“它在我的机器上工作”问题的数量，并防止项目之间发生依赖冲突。与其设置更多的开发服务器，你的每个同事可以在单个共享服务器上设置自己的Docker容器，如果这样做更划算的话。

此外，你可能想知道，为什么选择Docker而不是Conda，而且Conda还允许你使用不同的包版本创建不同的环境。我们选择Docker是因为它提供的工具更适合于生产和处理云的环境。如果要在远程机器上使用Conda，则必须先与机器连接并处理文件传输。但是，只需在Docker中使用几个命令，你就可以对本地文件进行更改，并将它们反映到远程机器的Docker容器中。此外，运行项目所需的一切都在Dockerfile或Docker Compose文件中指定。

另一方面，对于Conda，如果不引用README，就不清楚是否需要其他步骤。最后，利用Docker Compose的强大功能，如果ML项目需要运行其他服务，它们可以在其他Docker容器中单独运行，并根据Docker Compose文件设置相互通信。据我所知，在Conda中不能跨环境通信。

准备好做扩展

作为一个处于早期阶段的初创公司，你现在可能不需要扩大规模，但最好是开始考虑可以扩大规模的技术。其中一种技术是Celery，这是一个异步任务队列系统，可以将任务分配给多个工作者。目前，对于每种类型的服务(服务器、客户机、embeddings模型等)，我们都有一个单独的worker，但是如果有必要的话，为相同的服务启动更多的worker应该不需要太多的工作。通过嵌入进行缓存会成为瓶颈吗？没问题，让我们启动另一个嵌入的Celery工作程序，或者增加当前工作程序的“并发”计数，它允许多个子进程并行运行。在我们的Toucan AI配置中，一个Celery worker在一个Docker容器中运行，因此也遵循关注点分离。

除了允许你的生产系统扩展之外，Celery还非常适合执行长时间运行的任务，比如ML模型推断任务。与允许服务器响应挂起不同，服务器响应(代理的应答)可以立即返回给与Toucan AI代理对话的最终用户，而异步任务(如缓存机制)可以在后台悄悄运行。此外，我们使用Celery beat来运行我们每天计划的分析工作者任务。

与同事和未来的你合作

随着ML研究的不断发布，作为ML工程师，你如何让你的团队成员保持一个从尝试到使用的模型或技术的循环？没有什么魔法可以将他们获得的所有知识、经验和洞察力传授给你。但是你能做的就是交流。经常交流。

尽可能的交流，尤其是在写文档的时候。因为通常情况下，你是在做你自己的项目，所以你现在正在做的事情可能和你的同事正在做的事情并不完全相关。然而，将来他们可能需要审查或扩展你已经实现的内容。甚至可能是你几个月后，不得不对你自己的项目做出改变，而你已经忘记了其中的关键部分。文档，文档，文档。怎么强调都不为过。

另一方面，肯定会有文档不够用的时候。如果你有一些东西不确定，你想要他们的诚实的意见，你觉得说话是一个更有效的沟通媒介的时候，注意你的同事的精神集中的状态，寻求与他们讨论项目的方向。从一开始就尽可能的清晰，这对于防止误解，徒劳的工作，和悔恨是非常重要的。

作为机器学习工程师的内部斗争

作为一名机器学习工程师，你必须学会权衡好你想要修复的东西的想法以及让流程变得更好以完成当前的需求之间的关系。你必须学会接受采取最直接的方式来完成工作。例如，我很想花时间改进第三方的训练/评估代码，但当时，我只需要采用最短路径来查看我们的推理结果是否会得到改进。

由于我有web开发的背景，所以大多数情况下我必须编写自己的代码，但是在ML工程中，我必须学习如何应用其他人的代码。当你经常使用的代码不是你自己的 —— 通常是学生和研究人员花了几个月或几年研究出来的代码 —— 有时很难不觉得自己很失败，尤其是当你试图理解不是直接部署到生产系统中的那方面的代码的时候。

在一天结束的时候，只要记住我们是天性好奇的生物，想要学习比你需要学习的更多是可以的。如果有你想探索的途径，与你的队友保持透明是关键。一个好的工作环境不会因为你想要学习更多而责备你，如果你足够及时地实现了目标。只要你有优先考虑的事情，尽量少担心，多享受。

结论

为生产系统构建ML流程并不简单。尽管在这篇文章中提到了所有的内容，有时候，你能做的最好的决定就是简单地做一个决定。如果没有成功，那就继续下一条路。不管怎样，我希望这篇文章能够帮助我们更好地理解各种不同的想法。

英文原文：https://www.toucanai.com/blog/post/building-production-ml/

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本