元宇宙iwemeta

诺亚方舟实验室李航：深度学习还局限在复杂的模式识别上

width="22" height="16" src="http://hits.sinajs.cn/A1/weiboshare.html?url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F2015-07-03%2F2825125&type=3&count=&appkey=&title=%E5%8D%8E%E4%B8%BA%E6%8A%80%E6%9C%AF%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8%E8%AF%BA%E4%BA%9A%E6%96%B9%E8%88%9F%E5%AE%9E%E9%AA%8C%E5%AE%A4%E4%B8%BB%E4%BB%BB%E6%9D%8E%E8%88%AA%E5%8D%9A%E5%A3%AB%E6%8E%A5%E5%8F%97CSDN%E9%87%87%E8%AE%BF%EF%BC%8C%E5%88%86%E4%BA%AB%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E3%80%81%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%8A%80%E6%9C%AF%E5%9C%A8%E8%AF%A5%E5%AE%9E%E9%AA%8C%E5%AE%A4%E7%9A%84%E5%BA%94%E7%94%A8%E7%8A%B6%E5%86%B5%EF%BC%8C%E4%BB%A5%E5%8F%8A%E4%BB%96%E5%AF%B9%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E5%92%8C%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E6%8A%80%E6%9C%AF%E8%B6%8B%E5%8A%BF%E7%9A%84%E8%AE%A4%E8%AF%86%E3%80%82&pic=&ralateUid=&language=zh_cn&rnd=1435926266972" frameborder="0" scrolling="no" allowtransparency="true"> 摘要：华为技术有限公司诺亚方舟实验室主任李航博士接受CSDN采访，分享人工智能、机器学习技术在该实验室的应用状况，以及他对深度学习和人工智能技术趋势的认识。

华为技术有限公司诺亚方舟实验室主任李航认为，机器学习、数据挖掘和人工智能的研究，对华为未来的智能通信网络、智能企业管理、智能信息助手三个应用方向很有帮助，比如机器学习对SDN的控制能力、网络优化、人机交互、跨国交流等，都可以发挥很大的作用。

诺亚方舟实验室已经将采用深度学习（DL）提升自然语言处理（NLP）的能力（DL4NLP）作为一个研究重点，包括自然语言对话（包括知识问答）、机器翻译和图片搜索，实现以往的自然语言处理技术无法达到的效果。

李航认为，深度学习时代的到来是统计学习发展的必然趋势，今后若干年里深度学习还将是研究的热点，会有很多新技术开发出来，利用深度学习的应用也会有革命性的进步。尽管深度学习目前还停留在“复杂的模式识别（pattern recognition）”层面上，但它仍是最有效的方法，会极大推动人工智能的进步。

“如果把实现人工智能的理想比喻为登月，那么有些方法看起来好像是在爬树、在登山，基本不可行，而深度学习的方法好像是在做火箭，它至少能把我们带出地球大气圈，虽然可能还不能达到登月的目的。”他说。

李航还透露，诺亚方舟实验室在开发一个GPU、CPU与FPGA的异构深度学习平台。详情敬请期待后续报道。

李航采访实录

CSDN：诺亚实验室目前在ML/DL领域主要有哪些研究方向？具体的应用场景是什么？

李航：诺亚方舟实验室的研究领域是机器学习、数据挖掘、人工智能。我们特别聚焦在几大研究方向，包括深度学习、强化学习、流数据挖掘、图数据挖掘、时空数据挖掘、语音和语言处理、信息与知识管理。

我们的研究由三大应用牵引：智能通信网络、智能企业管理、智能信息助手，目标是为华为的未来发展做出重大贡献。华为的主要产品是通信设备、数据中心、智能手机；我们坚信大数据分析、人工智能能够使这些产品更加智能化，为用户提供全新的、更好的体验，实现跨越式的发展和进步。

智能通信网络包括SDN、网络规划与网络优化、网络维护三方面。SDN（Software Defined Networks）是未来网络的发展方向，其基本想法是将通信网络中的软件硬件剥离，将网络当作一个巨大的计算机来运行；用数据驱动、机器学习的方法帮助提升SDN的控制能力是很自然的选择，会极大提升网络的性能与效率。通信网络也看作是一个超大的图（graph），当中有大量数据在流动，怎样对网络的性能进行规划和优化是网络建设中的大问题；而数据驱动、机器学习的方法会帮助做出最优的选择。通信网络需要许多工程师维护，保证线路的畅通与高质量的通信实施，如何帮助工程师们迅速排除网络故障是通信领域的一个大问题；机器学习、人工智能技术可以帮助工程师做网络质量的预测，故障的自动诊断及自动排除。

智能企业管理也是个重要方向。对每个企业来说，客户、产品、员工都是其宝贵财富，而围绕着这些实体现在有大量的数据积累下来，如何利用这些大数据，做有效的客户关系管理、供应链管理、人力资源管理，对每个企业来说都是至关重要的，因为可以极大地提升企业的效益，企业的竞争力。从另一个角度看，企业中的知识、信息在运营中也以大数据的形式积累下来，包括结构化的数据和非结构化的数据，对每个企业来说这都是宝贵的资源，如何有效地利用这些信息与知识，挖掘更多的知识，构成了一个巨大的挑战，也提供了一个巨大的机会。还有，帮助员工之间、客户与企业之间提高交流的效率，继而提高企业的效益与竞争力，也是一个重要的问题，如像在华为这样的跨国公司，需要帮助员工克服语言障碍进行顺畅的交流。数据挖掘、机器学习等是帮助解决所有这些问题的最佳手段。

我们预见智能手机将会成为我们每个人的智能信息助手，提供信息推荐、信息抽取、信息管理、信息检索与问答、机器翻译、自然语言对话等几方面的功能。我们处在信息爆炸的时代，信息助手可以将外部的信息进行过滤把最有用的信息推荐给用户；用户与不同的人、物进行交流，信息助手可以将这其中的重要信息进行抽取；个人的信息也处于泛滥状态，如有大量的照片，信息助手可以帮助用户有效地管理个人信息；用户时常会遇到问题，信息助手可以帮助解答问题，访问信息；地球变得越来越小，用户需要与讲各种语言的人进行交流，信息助手可以给用户做翻译，克服语言障碍；作为一个贴心的“伙伴”，信息助手可以自如地用自然语言与用户交流。毫无疑问，智能信息助手需要先进的机器学习、人工智能技术构建。

CSDN：诺亚方舟实验室用DL做机器翻译获得了不错的效果，您认为其中的决定性因素是什么？您如何看到DL在NLP方面的潜力，是否会完全取代传统算法？

李航：用深度学习提高自然语言处理的能力是我们深度学习研究的一个重点，我们称之为Deep Learning for Natural Language Processing（DL4NLP），最近取得了不少的成果，可以说在业界处于领先地位。在DL4NLP中，我们主要考虑三个应用，自然语言对话（包括知识问答）、机器翻译、图片搜索。这里我想介绍一下前两个。

深度学习最近三、四年有了长足的发展，“深度强化学习”、“神经图灵机”等许多新的概念被提出。深度学习已不局限于模式识别，如图像识别、语音识别等，事实上已扩展到语言处理、知识利用、逻辑推理、自动控制等其他任务上。特别是基于深度学习的自然语言处理是当前深度学习研究的一个热点，诺亚实验室也希望自己在这方面做出重大贡献。

我们应该是用深度学习做自然语言对话最早的团队。自然语言对话包括单轮与多轮的，方法分基于检索的和基于生成的；可以认为，传统的自动问答系统属于单轮的、基于检索的特殊对话系统。我们在NTCIR组织了一个比赛，聚焦在中文、日文的单轮对话上，大家感兴趣的话可以参加。

我们用深度学习开发了几个模型做自然语言对话，包括单轮和多轮的，检索和生成的。这里介绍一下将在今年的自然语言处理顶会ACL发表的一篇论文。这个工作中我们开发了神经应答机（Neural Responding Machine），是一个单轮的对话系统，基于RNN(Recurrent Neural Network)模型，用编码器将问句转换成中间表示，再用解码器将中间表示转换成回答。用500万对话数据训练的该系统可以达到非常好的对话效果，自然回答的比率占70%以上。比如你说：“我想买一部三星手机”，系统回答：“还是支持一下国产的吧”。注意系统的回答是它看了许多对话的例子后自动生成的，而不是延用对话数据中已有的回答。系统能达到这种“智能”水平，确实让人惊叹。纯粹用数据驱动的方法建立起对话系统，以往的自然语言处理技术基本做不到，可以说深度学习给自然语言对话带来的技术进步是革命性的。

机器翻译经历了基于规则的和基于统计模型的两代技术，大家现在努力尝试用深度学习提高翻译的精度。有两种想法，一个是将深度模型集成到已有的统计翻译模型的框架中，比如BBN公司提出的方法就属于这类。另一个是彻底推翻传统的统计翻译模型，完全使用深度学习进行机器翻译，实现下一代技术。大家现在关心的是后者是否可以真正成为现实；事实上，在这方面谷歌、蒙特利尔大学各自提出了不同的模型，取得了重大的进展，受到广泛关注。

诺亚实验室在机器翻译方面的研究，采用两路齐头并进的策略，因为有许多问题需要探索，一方面研究完全基于深度学习的方法，另一方面也研究深度学习与传统模型融合的方法。我们也在与计算所、哈工大深研院合作。你提到的我们的机器翻译工作，都属于后者，有两篇今年的ACL论文。其中我们利用CNN（Convolutional Neural Network）改进了统计翻译模型中的翻译模型、语言模型，BLEU分数整体有两个点的提高，翻译模型胜过BBN模型。我们还在探索到底什么样的方法能对机器翻译带来巨大的进步。细节大家可以参照相关的CSDN报道。

我们目前为止的DL4NLP的工作，重点放在了句子的语义表示学习上，考虑用CNN或RNN模型在对话、翻译等问题中的应用。我们提出了一系列的模型，这些模型，以及业界已有的模型，到底在什么条件下工作得更好，还需要今后的研究去验证。我们DL4NLP的研究，今后会朝几个方向推动，考虑的还是以上的应用，但会把方法做得更深入，具体地关注以下问题：更复杂的深度模型（如多轮对话模型），深度模型与知识的融合，外部记忆的增强，深度学习与推理的结合等等。这些方向还有许多有意思的问题值得去探索。

CSDN：能否介绍诺亚搭建深度学习系统的过程，采用了哪些工具？为什么如此选择？

李航：诺亚实验室深度学习的研究主要是用GPU集群。我们也在开发一个深度学习的平台，是一个GPU、CPU与FPGA的异构平台。关于我们的深度学习平台，我们近期会有一些详细介绍。

CSDN：您在之前的访谈中谈到ML还需要提高学习能力，做到触类旁通、无师自通，您认为目前的挑战在哪里？技术路线上应当如何一步一步地实现这种能力？

李航：统计学习是现在机器学习的主流，大家也看到了它在许许多多应用中的成功案例。特别是现在处于大数据时代，又赶上人工智能的热潮，大家对机器学习技术的期待达到了空前的高度。但是我们应该清楚地认识到统计学习比起人的学习能力还有很多局限。比如，人的举一反三、触类旁通、无师自通的学习能力是现在的统计学习所远远不能达到的。当然，统计学习也有一些人不具备的学习能力，如大规模计算（对应着思考）、大规模存储（对应着记忆）。

深度学习其实是统计学习的一部分，或者说一个分支，其特点是复杂模型（复杂神经网络）的统计学习。深度学习时代的到来这也可以说是统计学习发展的必然趋势，因为现在数据更多了，计算机能力更强了，简单的问题用简单的方法已解决得差不多了。可以预见今后若干年里深度学习还将是研究的热点，会有很多新技术开发出来，利用深度学习的应用也会有革命性的进步。

但是，我们也应该看到，深度学习，至少是目前为止的深度学习，还是停留在“复杂的模式识别（pattern recognition）”层面上，我们有时感到它很智能，如上述的自然语言对话，但是它还只是总结并记忆住了复杂的模式，给出看似非常智能的结果。虽然我们上面说到，深度学习已扩展到推理、控制等任务，但目前为止的方法也还是局限在复杂模式识别的范围内。只是它学到的模式太复杂了，已超出了我们直观想象范围，我们感到很了不起。

Hinton、LeCun、Bengio三人最近在Science杂志上发表了题为“Deep Learning”的论文，他们预见非监督学习、语言处理、逻辑推理将是深度学习的重要发展方向。CSDN上也刊登了译文，大家可以参考。

今后的机器学习、深度学习会发展到什么水平，我们现在还看不太清楚，但有一点我们是深信不疑的，那就是它会极大地推动人工智能的进步。沿着这条路到底能走多远，是我们想知道的，也是让我们感到兴奋的。如果把实现人工智能的理想比喻为登月，那么有些方法看起来好像是在爬树、在登山，基本不可行，而深度学习的方法好像是在做火箭，它至少能把我们带出地球大气圈，虽然可能还不能达到登月的目的。

CSDN：对于机器学习的入门和进阶，您有哪些好的建议？

李航：机器学习的本质是“数学化的数据学”。所以，对机器学习技术的掌握，首先需要有好的数学基础，拥有足够的概率统计、计算理论、信息理论的知识；其次需要对数据处理有丰富的经验，经历足够多的开发、实验、观察。因为机器学习涉及的面非常广，所以需要一步一步地积累，不断地学习与钻研，这对初学者与专业人员都是一样的。我也是在这样鞭策自己。

机器学习的入门教材，我觉得最好的是Andrew Ng的机器学习讲座，他讲得确实很好，把重要的、基本的概念全部覆盖了，而且内容准确与清晰。中文的教材，据说周志华老师将出版一本入门的书，大家可以期待。

我写的《统计学习方法》并不是针对初学者的，目的是把最基本最核心的概念整理出来，让大家可以随时学习、参考，特别是对做应用的人。是工具书的定位，对有一定基础的人来说，可以成为入门书，但不适合所有人。

我自己经常参考的，统计学方面Hastie、Tibshirani 、Friedman的书，机器学习方面Bishop的书，信息理论是Cover与Thomas的书，都是领域的权威。机器学习领域太广，不太可能有一本书满足所有人的需求，大家可以根据自己的情况，有选择地学习。另外，现在网上有大量的学习资料，论文、书籍、代码、讲座、博客，大家都可以去有效地利用。

李航

华为技术有限公司诺亚方舟实验室主任，北京大学、南京大学兼职教授

日本京都大学电气电子工程系毕业，日本东京大学获得计算机科学博士学位。曾就职于日本NEC公司中央研究所，任研究员，以及微软亚洲研究院，任高级研究员与主任研究员。李航博士的研究方向包括信息检索，自然语言处理，统计机器学习，及数据挖掘。一直活跃在相关学术领域，曽出版过三部学术专著，并在顶级国际学术会议和国际学术期刊上发表过上百篇学术论文，拥有40项授权美国专利。

OCR 赋能发票管理系统：守护医疗票据合规，让管理更智能 EkihzniY ocr 人工智能大数据
医疗收费电子票据种类多、数据杂，票据编号、金额、诊疗项目等信息的合规核验是医院财务管理的重点。传统人工核对易出错，还难以及时发现票据篡改、重复报销等问题。OCR技术为发票管理系统装上“智慧眼”。它能快速识别电子票据上的关键信息，自动与医院HIS系统的收费数据比对，核验金额是否匹配、票据是否真实有效。一旦发现异常，系统立即预警，从源头阻断不合规票据流入财务流程。同时，OCR将票据信息自动录入管理系统
OCR 识别：综合信息采集仪的 “核心引擎” EkihzniY ocr
综合信息采集仪作为多场景信息收集的重要设备，需处理身份证、营业执照、票据等多种载体的信息。传统采集依赖人工录入，面对海量且格式多样的资料，不仅效率低下，还易因人为失误导致信息偏差。OCR识别技术让综合信息采集仪实现质的飞跃。它能快速精准提取各类证件、票据上的文字信息，自动转化为结构化数据存入系统，几秒内完成单份资料的信息采集，效率较人工提升数十倍。无论是模糊的扫描件、复杂的多语种文本，还是不规则的
移动网络http请求不到数据，wifi下可以添码星空 Android开发 HTTP 网络连接
今天客户反馈手机登录不上去，用wifi可以，但是切换到移动网络就不行。查找相关文档发现由于AndroidP(版本27以上)限制了明文流量的网络请求，非加密的流量请求都会被系统禁止掉。所以如果当前应用的请求是htttp请求，而非https,这样就会导系统禁止当前应用进行该请求。请看下面的官方说法：Android致力于保护用户们的设备和数据安全。我们保证数据安全的方法之一是保护所有进入或离开Andro
一次XSS漏洞引发的用户信息泄露 —— 在线教育平台真实案例剖析与防御实践
一、引子：一个“学习感言”输入框引发的安全事故在一次大型在线教育平台的开发中，笔者曾亲身经历过一起严重的安全事故。事故的起点很微不足道：一个允许用户提交“学习感言”的输入框。然而，由于缺乏安全意识和输入输出处理的规范，这个字段成为攻击者入侵的跳板，最终导致大量用户信息泄露、信任危机和平台业务受损。这个案例虽然已过去多年，但其中反映的安全盲点依然广泛存在于当前的互联网项目中，特别是在中小团队、快速上
MySQL 大数据量分页查询优化实战：从 90秒到 965毫秒的性能飞跃要阿尔卑斯吗. mysql 数据库分布式架构 java
在日常开发中，我们经常需要对数据库中的数据进行分页展示。特别是当表数据量达到几十万甚至上百万级时，传统的LIMIT分页方式会面临严重的性能瓶颈。今天，我将分享一个真实的性能优化案例，通过模拟大页码查询的现场，从90秒缩短到965毫秒，显著提升了查询效率。本篇文章将从问题出现的原因、索引原理、优化思路和最终实战效果等方面，为你全面讲解如何高效处理MySQL大数据分页查询问题。一、问题背景：大页码分页
全面解析阿里巴巴 Seata：微服务架构下的分布式事务解决方案(AT模式) 要阿尔卑斯吗. 架构微服务分布式
在微服务架构盛行的今天，系统被拆解成多个独立服务，每个服务对应独立的数据库。这种“服务自治”的设计虽然提高了系统可维护性和扩展性，却带来了新的难题——分布式事务一致性问题。为了保障跨服务、跨库操作的原子性，阿里巴巴开源了一个优秀的解决方案：Seata（SimpleExtensibleAutonomousTransactionArchitecture）。本文将从背景动因、整体架构、核心原理、事务模型
Redis缓存四件套的学习(七) 冷崖 Redis redis 缓存
一、缓存四件套1.1、缓存预热1.1.1、什么是缓存预热缓存预热就是在系统启动前，将数据提前加载到缓存中，这样就可以避免在用户请求的时候，先查询数据库，然后再将数据回写到缓存中1.1.2、如何实现缓存预热什么都不做，只对数据库操作，利用redis回写机制，逐步将数据库的数据同步到缓存中。-------最好晚上部署完成之后，自己人提前做一次，让数据写回缓存，别把这个问题交给用户。通过中间件或程序自行
马士兵系列——缓存行数据一致性2——缓存行的MESI 公众号【专注CLinuxCloud】缓存 python 开发语言
hello，你好鸭，我是Ethan，西安电子科技大学大三在读，很高兴你能来阅读。✔️目前博客主要更新Java系列、项目案例、计算机必学四件套等。人生之义，在于追求，不在成败，勤通大道。加油呀！个人主页：EthanYankang推荐：史上最强八股文||一分钟看完我的几百篇博客温馨提示：划到文末发现专栏彩蛋点击这里直接传送本篇概览：详细讲解了缓存行的一致性协议之一的MEESI的方方面面。⭕【计算机领域
AI赋能，让办公更智能 enter回车键人工智能
AI赋能：解锁办公智能化新图景当智能化办公成为企业创造新价值的核心引擎，AI技术正以其强大的学习能力与数据处理能力，成为这场办公变革的“隐形推手”。从流程自动化到决策智能化，从单向执行到双向协作，AI正全方位渗透办公场景的每一个环节，让办公更高效、更精准、更具创造力。AI为办公流程注入“自动化基因”，将人类从机械劳动中彻底解放。传统办公中，员工需花费30%以上的时间处理重复性任务：财务人员逐张核对
.NET CORE 分布式事务(四) CAP实现最终一致性精神小伙就是猛 .netcore 分布式架构微服务
目录引言：1.0最终一致性介绍2.0CAP2.0架构预览3.0.NETCORE结合CAP实现最终一致性分布式事务3.1准备工作(数据库，本文使用的是MySql)3.1.1数据模型3.1.2DbContext3.1.3数据库最终生成3.2Nuget引入3.3appsettings.json3.4docker启动一个RabbitMQ3.5Program.cs3.6用户1API控制器3.7用户2API控
【用户运营】如何做好用户增长？数据分析星球
“用户增长，这个近几年互联网人无人不知无人不晓的名词，已经成了互联网人之间沟(chui)通(niu)的必备，那么什么是用户增长？又该如何有效地做用户增长呢？”01、什么是用户增长？虽然人人耳熟能详，但是究竟什么是用户增长？最近产品上线，老板让Jack做个用户增长方案，Jack心想，这个简单，找了几个渠道，第一个月投了10w获取了1w新用户，感觉还不错，第二个月继续加码，投了20w获得了2w新用户，
靠谱的返利APP有哪些?值得推荐十款返利APP 直返APP淘宝优惠券
在互联网高速发展的今天，返利APP成为了消费者们节省开支、提高购物体验的重要工具。但市面上的返利APP众多，如何挑选出正规靠谱的返利APP成为了一项难题。本文将为您推荐五款值得信赖的返利APP，让您轻松省钱购物。一、直返直返的口号是“返利就用直返”，它强调没有上级赚差价，直接为用户提供商家和消费者之间的综合优惠券返利平台。用户可以在直返上获取自己感兴趣的商品，购买后可以获得一定比例的返利。直返的返
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
老码农和你一起学AI：Python系列-Pandas 并行计算 chilavert318 熬之滴水穿石 pandas python
但凡用到科学计算，Pandas几乎是绕不开的工具——它以简洁的API、灵活的数据操作能力成为数据处理的“瑞士军刀”。但随着数据量增长（比如从10万行到1000万行），你可能会发现：原本流畅的代码突然变慢了，一个简单的apply操作要等好几分钟，读取大文件时进度条仿佛凝固了。这不是你的代码有问题，而是原生Pandas的“单线程”基因在多核时代遇到了瓶颈。并行计算正是解决这个问题的核心方案。简单来说，
老码农和你一起学AI：Python系列-Pandas大数据处理 chilavert318 熬之滴水穿石 pandas python
今天开始梳理一下pandas的大数据处理，在数据处理领域，Pandas凭借简洁的API和强大的功能成为Python开发者的首选工具。但当面对GB级甚至更大的数据集时，直接读取数据往往会触发“内存不足”的错误——这是因为Pandas默认将数据全部加载到内存中进行处理。此时，分块处理（Out-of-Core）技术就成为解决问题的关键。它通过将大文件拆分为小块，逐块加载并处理，最终整合结果，实现“用有限
关于线上技术学习的一点学习心得 GuangHui
我是**五期学员,和你分享一下我的学习心得,希望能够帮助到你.这是自己对于学习的思考和想法,因为我还在不断的学习和调整中,所以并不能说自己的所想都是正确的.我想即使我实现了成功的转行,也并不代表我说的我所选择的方式都是适合所有人的.每个人还需结合自己的实际情况,找到适合自己的最佳方法.我们一起努力.一.目标篇因为大数据需要学习的内容很多,所以学习过程中,一定要对进行定位,要做到有所取舍.针对自己的
没有本钱怎么才能赚到钱?除了打工还有许多方法高省APP大九
很多人空闲时难免会为了没钱而苦恼，如果你现在正处于焦虑迷茫的时候，不知道该做什么，那你务必要好好地利用互联网，在网络上副业兼职的平台有很多，方法也很多，可根据自己的特长和喜好来进行选择。今天就介绍一下无本金利用网络赚钱的方式有哪些。一、下载【高省】赚钱高省APP属于杭州长孚科技有限公司旗下，是国内首家和京东淘宝多多官方对接多电商平台的综合返利导购平台，返利比例可达到99%，市面上那些返利APP的佣
【Kafka】深入理解 Kafka MirrorMaker2 - 实战篇 showyoui Kafka kafka 分布式开源大数据容灾
文章目录一、把“家伙事儿”都备齐二、部署其实很简单三、配置MirrorMaker2四、修改启动脚本五、集群启动与验证六、这集群“结实”吗？聊聊它的高可用它没有“大脑”，但活得很好极限测试：干掉两个节点会怎样？写在最后最近在跟Kafka死磕，想着搭一个跨机房的数据同步方案，MirrorMaker2自然就成了首选。所以，我决定自己从头到尾摸索一遍，把整个过程记录下来，权当是写给未来自己的备忘录，也希望
2023-11-04 低代码云MES
近年来，全球新材料行业快速发展，我国新材料产业处于第二梯队，年均复合增速超过20%，但目前上游关键材料、设备发展仍存在诸多“卡脖子”环节，国产替代需求迫切、市场巨大、进程加速。未来一段时间内，国产替代将成为行业成长主旋律。因此，企业对数字化工厂的建设提出了更高的要求，新材料制造业工厂目前在生产管理和信息化方面存在如下不足：数据采集不及时：车间现场报表（包括流转、报工、废品数据、呆滞信息）录入不实时
RDS Proxy提高数据库可扩展性可用性GenAI taibaili2023 AWS
亚马逊云科技-RDSProxy改善数据库可扩展性GenAI关键字:[yt,AmazonRDSProxy,DatabaseScalability,RdsProxy,ConnectionPooling,SeamlessFailover,IamAuthentication]本文字数:400,阅读完需:2分钟导读演讲者介绍了”亚马逊云科技-RDSProxy改善数据库可扩展性GenAI”。在演讲中,他阐释了
aws rds mysql 连接_使用 Amazon RDS 代理连接到 Amazon RDS MySQL 数据库实例或 Aurora MySQL 数据库集群... 仁安同学 aws rds mysql 连接
如何使用AmazonRDS代理连接到我的AmazonRDSMySQL数据库实例或AuroraMySQL数据库集群？上次更新时间：2020年9月21日如何使用AmazonRDS代理连接到运行MySQL的AmazonRelationalDatabaseService(AmazonRDS)数据库实例或AmazonAurora数据库集群？简短描述您可以使用AmazonRDS代理来管理与应用程序之间的连接。
遥感云平台-GEE下载Landsat8/9影像数据（python）
内容介绍上期文章介绍如何在网页端导出Landsat8/9数据，本期主要介绍如何在本地GEE-python端导出数据以及出图。环境配置：Vscode+Jupyternotebook+gee+geemap+python3.10#导出所需要的包，注意提前安装ee和geemapimporteeimportosimportnumpyasnpimportgeemapfromgeemap.datasetsimp
短剧小程序的「技术革命」：从「粗放生长」到「精准运营」 weixin_lynhgworld 小程序
随着短剧行业进入「存量竞争」阶段，技术能力正成为小程序的核心竞争力。从内容推荐到用户留存，从广告变现到IP开发，每一环节都需要数据驱动和算法优化。一、智能推荐：让「用户找到剧」变成「剧找到用户」传统短剧平台依赖标签匹配，而小程序通过多维度数据实现精准推荐：「情绪图谱」分析：记录用户观看时的快进、暂停、重复播放等行为，构建情绪波动曲线；「场景化推荐」：根据时间（如深夜）、地点（如地铁）、设备（如手机
AWS RDS MySQL是否能实现登录限制类需求 shiran小坚果 RDS aws 云计算 database mysql
问题描述：此类问题一般来说在等保中会频繁遇到：对于AWSRDSMySQL5.7和8.0的实例，能否做到如下限制和需求：1.一个连接到数据库的session，超过一段时间以后被RDSMySQL结束的功能：RDSMySQL5.7和8.0中，均可以通过更改参数组中wait_timeout和interactive_timeout参数来设置。当连接空闲并超过参数设置的时长，那么会导致RDSMySQL自动断掉
探索AWS基础服务：构建云端架构的基石
本文将深入介绍AWS的几种基础服务，包括弹性计算（EC2）、简单存储服务（S3）、关系数据库服务（RDS）等，助您构建高效、稳定的云计算架构。
深入理解Mysql索引底层数据结构与算法桑翔
一.索引的本质索引是帮助MySQL高效获取数据的排好序的数据结构二.索引数据结构1.二叉树2.红黑树3.Hash表4.B-Tree1.叶节点具有相同的深度,叶节点的指针为空2.所有索引元素不重复3.节点中的数据索引从左到右递增排序B-Tree5.B+Tree1.非叶子节点不存储data,可以放更多的索引2.叶子节点包含所有索引字段3.叶子节点用指针连接,提高区间访问的性能(体现在做范围查询的时候)
Django ORM系统
1.ORM基础概念1.1什么是ORM？ORM（ObjectRelationalMapping，对象关系映射）是一种编程技术，用于在面向对象编程语言中实现不同类型系统的数据转换。在Django中，ORM充当业务逻辑层和数据库层之间的桥梁。核心映射关系：类（Class）↔数据库表（Table）类实例（Instance）↔表记录（Row）类属性（Attribute）↔表字段（Field）1.2ORM的优
贝融助手是什么？贝融助手是专业的大数据信用查询平台无忧达人
贝融助手是一个可以快速了解自己信用的工具，是一个生活中非常实用的小助手，信用是现在最重要的一个生活场景，人人都想有一个好的信用，贝融助手就是帮助我们查询自己信用的平台。贝融助手是一个非常专业的平台，贝融助手18年就上线了，到现在已经有很多年的历史了，在信用行业一直都是行业前三的平台，用户量也是非常的大，身边朋友都在用的平台。贝融助手查询入口放在文末了，划到文章结尾就可以看到查询入口贝融助手大数据信
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
使用Mybatis-Plus进行单表操作讴歌oge Java后端 mybatis java 数据库
使用updateById()修改数据时，值为null的属性不会被修改。intupdateById(@Param("et")Tentity);测试代码：@SpringBootTestpublicclassSpringBootMybatisPlusTest{@AutowiredprivateUserMapperuserMapper;@Testpublicvoidtest(){Useruser=newU
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

诺亚方舟实验室李航：深度学习还局限在复杂的模式识别上

诺亚方舟实验室李航：深度学习还局限在复杂的模式识别上

李航采访实录

CSDN：诺亚实验室目前在ML/DL领域主要有哪些研究方向？具体的应用场景是什么？

CSDN：诺亚方舟实验室用DL做机器翻译获得了不错的效果，您认为其中的决定性因素是什么？您如何看到DL在NLP方面的潜力，是否会完全取代传统算法？

CSDN：能否介绍诺亚搭建深度学习系统的过程，采用了哪些工具？为什么如此选择？

CSDN：您在之前的访谈中谈到ML还需要提高学习能力，做到触类旁通、无师自通，您认为目前的挑战在哪里？技术路线上应当如何一步一步地实现这种能力？

CSDN：对于机器学习的入门和进阶，您有哪些好的建议？

你可能感兴趣的:(大数据,互联网,互联网,创业者,开源,数据,程序员)