黄晓雯

对话Facebook机器学习专家Joaquin Quiñonero Candela

Writing Sessions是Quora推出的与各领域专家、学者对话的板块。从去年年初开始，该板块开展了一个机器学习系列，迄今已邀请了百度首席科学家Andrew Ng、《The Master Algorithm》作者Pedro Domingos、Quora技术副总裁Xavier Amatriain等十多位该领域专家对热点问题进行解答。

近日，Quora邀请了Joaquin Quiñonero Candela与网友进行问答。Joaquin Quiñonero先后在普朗克研究所(Max Planck Institute in Tübingen)、柏林工业大学(Technical University of Berlin)和微软研究院担任研究员，之后进入Bing带领工程团队，目前是Facebook公司Applied ML(AML)团队的主管。本次对话共有26个问答，问题主要围绕Facebook在机器学习领域的实践、学术界与产业界的异同、机器学习实践中的经验教训、团队协作与人才招聘、如何平衡工作与生活等方面。InfoQ精选以下5个问答，一同了解Joaquin Quiñonero的观点。

问题1：Facebook在机器学习领域做的最有趣的研究是什么？

我所在的Applied ML团队是Facebook的应用研究部门。我们进行核心机器学习[core ML]、计算机视觉、计算摄影和语言处理方面的研究。我们与AI Research(FAIR)团队密切合作，他们推动该领域的理论发展，我们则在应用方面进行补充。我想介绍几个近期让我感到非常兴奋的研究。当然这不是一个完整的列表，同时这些研究是我们与FAIR团队、Core Data Science(CDS)团队以及许多产品团队共同进行的。

在计算机视觉领域，我们有一个系统用于处理上传到Facebook的每一张图片和每一段视频，每天大约处理十亿数据。我们会预测图片内容，这一技术有很多应用场景，例如为盲人生成图片说明、自动检测并删除冒犯性的内容、优化多媒体检索结果、自动产生视觉验证码。我们使用的深度卷积网络带有数十亿参数。这个模型的有趣之处在于特征的普遍性。最近，Connectivity Lab和CDS团队利用这一功能来创建基于卫星图像的高分辨率人口密度图(查看相关视频)。

还有一些我们正在进行的很有意思的研究，包括：使用多任务学习的通用视觉模型、表征学习(相关文献)、使用Elastic SGD进行大规模分布式训练、用于视频的时空卷积网络(相关文献)、用于构建更快更好的视觉模型的级联网络[cascade of networks for faster and better vision models]、基于视频的物体识别(相关文献)。

在语言处理方面，我们一直致力于消除Facebook上的语言障碍。为此，我们每天大约翻译二十亿条帖文，提供超过40种语言、1800多个语言方向。我们使用过一段时间Bing翻译，后来改用自己研发的翻译技术。目前我们正在评估深度学习用于翻译的效果，希望能利用神经网络获得更人性化的翻译结果。

在核心机器学习方面，我们专注于研究大规模实时机器学习、人工智能算法，并将其运用在一些全世界规模最大的应用上。无论用户何时登录Facebook，这些模型都在用于排序信息流中的故事(每日约十亿登录用户，平均每位用户1500多条推送)、广告、搜索结果(每天超过十亿次请求)、热门新闻、好友推荐，以及用户收到的通知、帖文下的评论。Core ML团队设计了先进的基于深度学习的文本理解算法。这些算法已经集成到我们构建的机器学习平台上。每个在产品里使用机器学习的团队都在使用这个平台。有超过20%的Facebook工程师(甚至有些人不是工程师)在使用这个平台，可见机器学习在Facebook有多流行。现在我们的研究方向有基于深度学习模型的事件预测、分布式稀疏建模和深度学习、基于卷积网络和循环网络的文本理解表征学习、基于多任务学习的模型压缩。

问题2：数据、算法、架构，哪个更重要？

首先要明确，在机器学习实践中，成功意味着最大化机器学习系统对实际应用的影响。例如通过机器学习系统预测广告与用户的相关性，从而最大化广告竞价总额。竞价与两个因素正相关：

预测准确度；
可以用准确度最高的预测器进行评估的广告数量(通常，严格的延迟限制会促使在级联方法中使用准确度较低的预测器精简候选集来提升运算速度)。

我们需要在最大化准确度的同时最小化预测所需的计算工作量。

先考虑最大化预测准确度。机器学习系统通常有实验阶段，目的是设计和训练模型。我们发现最重要的是实验速度。一个团队在单位时间内进行的实验次数越多，他们在优化模型上就能取得更多进展。在AML，我们奉行每周更新算法的准则，取得了很好的效果。为了能在一个特定应用上每周上线至少一个模型，我们需要执行几十次线上实验和成百上千次线下实验。优良的架构、平台和工具是机器学习实践的基础，它们都可以在最大化实验速度的同时最小化线上的预测开销。

让我们回到最初的问题。这三个元素按重要性从高到低的排序是：

数据：获取尽可能多的数据并确保数据质量。根据我们的经验，数据噪音总是会通过意想不到和不寻常的方式产生。我最喜欢的一个案例是，有段时间在引入用户点击广告数据时经常会失败，因为我们假设用户点击数据会发送到存储该广告的数据中心，然而实际情况并非如此。一旦解决了这个bug，团队关心的指标立刻有了极大的提升。
特征工程：做大量特征工程。将你的数据提炼成有最大预测性的信号。尽量多地构建自动化工具(在后台不间断运行的自动化特征选择可以最大限度地利用CPU)。我必须要强调深度学习的出现多少改变了游戏规则：深度学习可以自动化学习表征(例如特征)，因此你可以提供原始数据。例如DeepMind研发的学习玩经典街机游戏的项目，该项目纯粹基于屏幕像素，没有做任何特征工程。通过自动化学习表征，深度学习也彻底改变了计算机视觉和语言处理。不过，使用机器学习的产品团队仍然能不断从特性工程中获益。
算法：一旦你获得了良好的数据和工具，接下来要做的就是不断提升算法性能(但要保证算法通用性)。在Facebook，我们会定期上线性能有很大提升的模型。但需要注意的是，这只有在训练数据量增长且性能(包括训练和线上预测用时)没有降低很多的情况下才有意义，否则性能的降低会抵消精度提高带来的好处。我们通常会将复杂模型带来的准确度提升情况和预测时CPU功耗的增加程度进行比较。这意味着我们通常会使用能完成任务的(在计算效率方面)最简模型。

总结：在机器学习应用中，架构是基础。然后你应致力于获取尽可能高质量的数据、开发大量特征工程以及使用能完成任务的最简算法。

问题3：在构建通用机器学习平台时有哪些经验教训？

构建通用机器学习平台是困难的。机器学习和人工智能不断在发展变化，这使得任何通用框架要不断接受考验，而有些很快就过时了。另外，在灵活性和规模之间、灵活性和可用性之间都存在冲突，如何权衡也是构建框架时需要考虑的。

我将分享一些我们在构建Flow系统时的经验教训。Flow是一个通用机器学习管道系统。工程师们利用Flow构建机器学习管道，以训练深度学习模型、大规模罗杰斯特回归、决策树等模型。每周，所有这些模型都会经历数次从实验阶段进入生产环境的过程，并被几十个团队使用。

理解使用场景：有很多机器学习框架都过分强调了单一的使用场景。对于Flow，我们认为主要有两类用户：一类搭建新管道，另一类提供数据以使用管道。我们确保能为这两种场景都提供良好的体验。

构建多层平台：优秀的平台应避免用户陷入全赢或全输的局面。一个优秀的平台应该提供多层抽象。最外层提供最好的体验，如果用户无法在最外层找到他们需要的，他们应该能进入下一层。

速度，速度，速度：对于产业界的机器学习研究，应该设计支持高速计算的抽象。因为平台处理的数据量往往很大，容易形成瓶颈降低研发速度。

可重用：任何时候，工程师在Flow里编写新管道，公司里其他人都可以重用。这意味着工程师的创新速度与过去相比有了指数级的增长。

做好重写的准备：如果这是平台的第一个版本，你要做好重写的准备，因为会有很多错误产生，设计时糟糕的理念也会慢慢浮现。先忍耐直到你认为重写的合适时机已经到来，同时要确保在此之前你已经探讨、研究过一个更好的架构是什么样的。

避免过早推广：在推广平台前确保你已经有2到3个具体的、影响度高的场景。如果过早推广，可能会错过关键点而进展缓慢。记住，如果这是你的第一个版本，无论如何你都会重写它，所以不要过早地推广。

算法无关：通常，机器学习平台会执行许多不同的机器学习算法。在Flow里，我们的宗旨是平台欢迎任何算法。我们支持并构建了大部分Facebook工程师都需要的一些算法，但平台也对其它算法开放。这帮助Flow在新算法出现时仍可以得到推广。

统一接口：算法多样性是非常有益的。也就是说，一个将这些算法连接起来的统一的管道系统是非常强大的。假设你开发了一个算法，用于广告排名和搜索结果排序时非常有效。然后你只需在Flow里用标准接口实现一次算法执行器，广告排名和搜索结果排序管道都可以使用这个执行器。之后算法改进了，你只需进行很少的改动，就可以在所有使用该算法执行器的管道上试验和部署新算法。这使得我们的应用研究人员可以在整个公司快速扩大他们的影响力。

问题4：学术界和产业界有哪些区别？

产业界和学术界有很多相似之处也存在很多差异。过去十年我都在产业界，所以我的观点受产业界影响更深。但我仍然和学术界保持紧密联系，我喜欢发表团队研究成果，热衷于组织和参加学术研讨会议。

数据：通常产业界会比学术界获得更多数据。互联网正在慢慢缩小这种差异，但差距依然巨大。这意味着，有时学术界使用的数据集并不能代表产业界面临的问题。但另一方面，在学术界，很多想法产生自较小的数据集，这有助于快速迭代新想法。

工具和架构：产业界拥有更多资源可用于构建工具。在产业界，你更容易与工程师和架构专家合作，他们可以帮助你为你的研究打造坚实的基础。这些性能稳定的工具能让你更快取得进展。

速度：在时间就是金钱的产业界，速度相当重要。产业界的工程师和研究员通常会优先考虑产品开发的速度和频率，因为我们的目标是最大化一段时期内产品的总体影响。更快的迭代也有助于探索新想法并忽略没有前景的方向。

目标驱动：产业界的研究是目标驱动的。我们的重点是实现业务的影响力，不断朝着公司的使命投入和推动相关研究。产业界通常会关注实践中创新和投资的规模、成本、边界情况处理和用户体验等方面。需要重点指出的是，学术界在基础研究上扮演了重要的角色。因为产业界传统上更看重短期效益，因此很多有重大变革意义的突破已经、并将持续在学术界产生。

简单性：在学术界，发表的论文和研究成果是衡量成功的主要标准。发表论文可以以结构化的方式验证新想法，但也会因为鼓励创新而忽略了有很好实践效果的想法。产业界宁可简单一些，因为处理大规模的复杂系统是很大的开销。

我们不应对事物抱有非黑即白的看法。在产业界有很多优秀的研究员，同样在学术界也有很多杰出的工程师，他们使得各领域产生突破成为可能。理想的情况是产业界和学术界一起努力，集二者之所长，共同推动该领域进步。

问题5：招聘时你看重什么？

我看重技术实力和性格。我寻找的同事应具有以下特征：

任务驱动 在研发过程中会遇到很多困难、意想不到的阻碍，会出现没有人能胜任的工作。而任务驱动型的人会凭借决心、激情、智谋和应变能力，不惜一切代价来完成项目。
轻松面对不确定性 在进行巨大变革的同时也要承担技术风险。通往成功的道路总是充满未知的挑战，团队成员不应对此感到不适应。优秀的人能够散发出自信，帮助周围的工程师——尤其是资历尚欠的那些——去轻松面对不确定性。这样的人也能在前进的过程中做出正确的假设和判断。一个不完美的计划胜过没有计划。
无私且乐于合作 人很难不自我，但面对足够有挑战的任务时，人们会倾向于帮助周围的人一起获得成功。我相信，无私源自于明白靠一己之力无法取得更大成功的成熟，和无需挣扎于获得短期认同感的自信。
机器学习骇客 对于AML团队，曾经将AI或ML应用于解决真实世界问题的人，正是我在寻找的人才。我喜欢雇佣实现过多种算法的人，因为他们具有一种直觉，认为简单优于花哨。
强大的技术背景 对于研究员，有强大的科研文献发表记录，最好还在Github等开源社区分享过代码，这会是候选者巨大的优势。

Joaquin Quiñonero还分享了他进入机器学习领域的经历，以及他在平衡工作、家庭方面的心得。Joaquin Quiñonero还是一名长跑爱好者，每周晨跑50多英里，“跑步有助于清空思绪，有点像冥想，让我可以以非常冷静沉着的状态开始新的一天”。

请访问Quora查看完整的问答记录。Quora的机器学习系列后续还将邀请更多专家、学者，查看日程安排了解该系列最新动向，也可访问链接回顾往期对话。

感谢杜小芳对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作，请邮件至[email protected]。也欢迎大家通过新浪微博（@InfoQ，@丁晓昀），微信（微信号：InfoQChina）关注我们。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
6.0 践行打卡 D47 星月格格
去努力改变1.运动步行13000+8分钟腿部拉伸2.阅读《墨菲定律》第三章第三节:霍桑效应～适度发泄，才能轻装上阵“霍桑效应”这一概念，源自于1924年一个1933年间以哈佛大学心理专家乔治·埃尔顿·梅奥教授为首进行的一系列工厂工人的谈话实验研究。“霍桑效应”告诉我们，在工作，生活中总会产生数不清的情绪反应，其中很大一部分是负面的负面情绪的积累会影响人的精神和心情，不仅仅会影响个人健康，还会破坏人
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
2021.11.18 星初呀
2021.11.18＃小狗钱钱金金先生和吉亚的对话，金先生说，我总感觉你和大多数小孩很不一样。吉雅说我思考的问题不一样。很惊讶于一个小孩这样的归纳能力。我们思考问题方式是怎样的?自从跟着小狗群练习，思考问题方式也在跟着转变，关注自己做到的，写成功日记，关注微小事情，思考问题消耗我们的注意力。注意力放在哪里，哪里就会开花结果。所以我们琢磨的东西会塑造我们的大脑，建立稳固的价值观。今天听了定投课堂一节
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
使用datepicker和uploadify的冲突解决（IE双击才能打开附件上传对话框） zhanglb12
在开发的过程当中，IE的兼容无疑是我们的一块绊脚石，在我们使用的如期的datepicker插件和使用上传附件的uploadify插件的时候，两者就产生冲突，只要点击过时间的插件，uploadify上传框要双才能打开ie浏览器提示错误Missinginstancedataforthisdatepicker解决方案//if(.browser.msie&&'9.0'===.browser.version
《拖延心理学》（一）你为什么会拖延？|木盒笔记纯se蓝调
《拖延心理学》是帮助你向拖延症宣战的一本书，作者简·博克和莱诺拉·袁是全球知名的拖延症治疗专家。大概每个人或多或少总会有一点拖延症的行为。比如明天要叫论文了，今天你还没有写好，你一边在焦虑症怎么办，一边又拿着手机漫无目的的刷新闻；比如你想了很久准备减肥，但是迟迟又没有行动，想着今天晚上少吃一点吧、明天我就开始运动。今天分析的笔记来告诉你“你为什么会拖延？”，解读人杨坚。有人说拖延就像巨大的泥沼，让
Sissi书单｜《每天刷本书》365天不间断阅读第28天每天刷的sissi
以前我是一个不太会和自己对话的人，但是后来经历得多了，就慢慢变得喜欢自省起来。喜欢通过做各种测试题来更好的了解自己。测出来什么点，我觉得需要改善，就会到处去找调整的方法。这本书就是我在找方法的时候看到的，看的过程中除了觉得有用，还是觉得有用，非常推荐阅读！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Vue3 vant组件库自动导入不叫虎子 Vue vue.js 前端 javascript 前端框架 typescript
实现：完整使用vant组件库文档安装：#Vue3项目，安装最新版Vantnpmivant#通过yarn安装yarnaddvant#通过pnpm安装pnpmaddvant【一】按需引入：https://vant-contrib.gitee.io/vant/#/zh-CN/quickstart#fang-fa-er.-an-xu-yin-ru-zu-jian-yang-shi【二】批量引入在基于vit
编译Windows平台的Nginx+ngx_http_proxy_connect_module Grovvy_Deng windows nginx http
编译Windows平台的Nginx+ngx_http_proxy_connect_module背景：由于公司的正向出局代理是windows机器。机器上的Squid不稳定，打算替换成nginx+ngx_http_proxy_connect_module实现。通过几天痛苦的尝试，最后参考了github大神项目通过在线CICD工具编译window平台可用的ng。步骤：获取git可识别的patch由于CI
关闭Windows自动更新的6种方法 Gemini1995 windows
在Windows操作系统中，可以使用多种方法来关闭自动更新。以下是其中一些常用的方法：使用设置应用：打开“设置”应用（Win+I），选择“更新和安全”。在左侧菜单中选择“Windows更新”。点击“更改活动时间”或“高级选项”。在“更新选项”下拉菜单中选择“通知我但不自动下载或安装”或“从不检查更新”。通过服务管理器：打开“服务”管理器，可以通过在运行对话框中输入services.msc来打开。找
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
等待是一种煎熬静待花开202004
老妈住院4天了，整天到处疼，让她做个全面检查。自己在医院待了4天了，想想她也挺煎熬的，不让陪护，病房就她自己，而且她又笨，不会开电视。也挺无聊的。预约今天下午做胃肠镜，因为今天省里专家来坐诊。大早上6点就开始清肠，6点到10点4个小时，每隔一小时喝一大碗泻药。泻的昏天暗地的。11点多给她打电话，问她怎么样。她说泻完了，没事了。刚才晕得不行，一量血压高，吃了降压药就没事了。下午两点半开始做胃肠镜，我
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【前端】vue 报错:The template root requires exactly one element 程序员-张师傅前端前端 vue.js javascript
【前端】vue报错:Thetemplaterootrequiresexactlyoneelement在Vue.js中，当你遇到错误“Thetemplaterootrequiresexactlyoneelement”时，这通常意味着你的Vue组件的模板（template）根节点不是单一的元素。Vue要求每个组件的模板必须有一个根元素来包裹所有的子元素。这个错误通常出现在以下几种情况：模板中有多个并行
知错不责白开水的幸福时光
上课做卷子时，班上有三个同学半天了还找不到试卷。别的同学已经埋头做题了，他们三个有的钻在桌子兜里，有的蹲在地上，哗哗啦啦地整理凌乱的书桌，找试卷。我在教室里转了两圈，他们还在低头找试卷。换做以前，我肯定会质问他们：“连个东西都看不住，人家都开始做了，你们还找不到，快点找！”这话已经到嗓子眼儿上了，又被自己硬生生咽了下去。我在心里与自己对话：别批评他们了，他们又不是坐着不动，他们已经在四处寻找了，不
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

对话Facebook机器学习专家Joaquin Quiñonero Candela

你可能感兴趣的:(对话Facebook机器学习专家Joaquin Quiñonero Candela)