唐门教主

CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit：深度学习还不足以解决 NLP 核心问题...

文 | 胡永波

7 月 22 - 23 日，由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会（CCAI 2017）将在杭州国际会议中心盛大开幕。

会前，我们采访到了大会 Keynote 嘉宾、德国人工智能研究中心科技总监 Hans Uszkoreit 博士。

Uszkoreit 博士是中德两国人工智能合作的核心人物，负责德国人工智能研究中心在中国的所有合作项目，今年 3 月，他刚被任命为在北京新成立的人工智能技术中心（AITC）总监兼首席科学家。在访谈中，Uszkoreit 博士谈到了人工智能在工业 4.0 和商业智能上的应用，以及中、美、欧在人工智能领域的差异。

对于他的老本行，Uszkoreit 博士认为，语言技术是人工智能的核心部分，但当前的深度学习方法还不足以解决 NLP 领域的核心问题。他提到汉语在语义理解上的潜力。说起不久前 NLP 领域的大论战，Uszkoreit 博士认为 Yoav Goldberg 敢于倡导正确科研行为的严格规则，是个英雄。

以下是访谈全文：

中国 AI 研究需要覆盖所有领域

CSDN：最近，媒体常常拿中美两国的 AI 行业和研究成果进行对比。对于中美、中欧在 AI 领域的差异，您有什么看法？以您的理解，哪一方能引领这一轮的人工智能革命？

Hans Uszkoreit：欧美的 AI 研究有着长期的广泛基础，但中国正以惊人的力量和热情追赶上来。在某些研究领域，中国的研发速度可能比美国还快。然而，中国的 AI 研究只是集中在少数几个热门领域，可热点和趋势总是来了又去。下一代 AI 架构，将会用到具备大量认知任务和能力的、广泛擅长于 AI 的系统。我希望中国的研究人员能有足够的动力迅速来覆盖所有的 AI 研究领域。

我个人所期待的人工智能突破，是多种感官信息输入的交叉领域，以及 AI 在常识性知识与直觉的获取。

欧洲在语义学技术、神经网络与机器翻译等领域的研发投入上往往准备充足，但研究成果在科学上的成熟与商业上的收获更多发生在美国。其中的例外，是制造业领域的 AI，它是欧洲、特别是德国的强项。而今中国在 AI 领域的下游应用研究与上游资金投入上同美国的大力竞争，则相当耐人寻味。前者是今天 AI 应用的关键，后者则有可能逆转我们过去的 AI 创新流程。

CSDN：在深度学习近年来的进展上，有许多像李飞飞这样的华人 AI 科学家和 AI 研究者，他们在其中做出了突出的贡献。据我了解，您的许多研究伙伴也是华人，您能说说选择他们的理由吗？华人在 AI 研究领域有什么优势呢？

Hans Uszkoreit：长期以来，我都非常喜欢跟中国的博士生或博士后研究员们一起工作。他们头脑聪明、积极主动、精力充沛而又注重实效。一般说来，中国研究者的高中和大学基础都非常扎实。我个人的体会是，中国和西方研究者的混合团队，其合作效果出奇的好。我会在北京继续推动这种跨文化的合作。我相当期待接下来同过往的亲密同事和学生们的交流，他们现在大都在中科院、中国的大学和公司工作。

投资环境和早期市场是 AI 创业成功的保障

CSDN：前不久，您刚任职北京人工智能技术中心（AITC）总监兼首席科学家。您能跟我们介绍一下您这份新工作，以及这个新的研究机构吗？

Hans Uszkoreit： AITC 在今年 3 月份成立于北京的亦庄经济技术开发区。它的使命，是把 AI 技术从研究成果转化为工业应用。在德国，我们还没有特别成功的商业化 AI 案例。有好多次，我参与创立的公司都是过早进入市场，好在历经多年的挣扎，这些公司都活下来了。但更多的情况是，由于缺乏资金，我们只能眼睁睁看着美国的竞争对手取得成功。他们不光有着更好的投资环境，同时还拥有一个更大的早期市场。

在中国，我也同时注意到了这两大因素的存在：一种友善的投资氛围，加上一个需求庞大而前卫的 B2B 市场。在我的老东家 DFKI（德国人工智能研究中心），我们同 20 多家工业股东进行过合作研究，还创立过超过 80 家衍生企业，在 AI 技术转化方面的这些经验都来之不易。

基于这样的经历，AITC 有能力实现这样的技术转化及其研究机制，以及成功的商业化 AI 的最佳实践，这让我们同时也有能力来帮助这一领域的其他人。

CSDN：工业 4.0 和商业智能将成为主流的 AI 应用场景，但这两大领域的不同之处在哪里？对于 AI 在此所取得的突出成绩，有没有什么具体的实例？

Hans Uszkoreit：第四次工业革命是由工业界所有的部门、设备、人员之间完全的数字化连接所触发的，工业 4.0 是一个针对于此的广泛说法。这种完全的数字化连接是由物联网来实现的，其中还包括机器、产品、车辆和建筑之间的连接。

商业智能适用于所有的公司，不只针对制造业。它的基础是组织内部有关从战略决策到日常运作的所有决策过程的数据。这些数据大多来自公司内部，但很多重要的信号来自于外部的消费者、投资者、政策制定者、供应商和承包商，以及员工们的生活领域。对所有这些数据的分析，有助于做出更好的决策，甚至优化并调整决策的过程。

对于制造业来说，商业智能是工业 4.0 的一部分。今天我们所能看到的，只是商业智能与工业 4.0 的第一步。这里的数据通常是需要去主动获取与整合的。对于数据解释，特别是针对非结构化的数据，AI 将扮演一个重要角色，并从数据中不断学习。物流与供应链领域的控制、优化以及预测管理，就是这方面 AI 应用的具体实例。

语言技术是 AI 的核心

CSDN：您是语言技术顶级专家。就语言技术来说，它在 AI 中的角色是怎样的？前景如何？对于自然语言处理，它是否也存在一个突破性的时刻，正如深度学习之于图像识别、语音识别那样？

Hans Uszkoreit：语言是知识的钥匙，而知识正是 AI 的终极目标。人类社会的知识，正是通过语言来代代相传的。仅靠观察他人，人类是无法获取到广泛的可复用知识的。对于下一代智能系统所需的知识，人工智能必须能同时进行“阅读”和“聆听”才能获取到。而此等程度的机器学习，其关键技术正是 NLP。NLP 还是实现人与 AI 之间成功沟通的技术关键。所以说，语言技术是 AI 的核心部分，并将在很大程度上同知识技术相结合。

CSDN：您怎么看当前的消费级语言技术？特别是当下大热的智能语音助手，比如亚马逊的 Echo、苹果的 HomePod 等？

Hans Uszkoreit：这些智能助理正在成为我们日常生活的一部分。我自己也每天都在使用。它们还远未完美，但能被快速改进，因为其前卫的用户每天都在提供大量的免费数据给它们。

汉语在语义理解上有一定潜力

CSDN：对于不同的语言，其语言处理技术有何差异？比如说，汉语和英语。

Hans Uszkoreit：不同的语言差异确实很大。尽管作为口语，汉语和英语都能在同样的时间内被小孩学会。但细节上，汉语没有词法，句法也相当简单。二者作为书面语，绝无可能在同样的时间内被人学会。事实上，汉语的复杂性绝无仅有。这对 NLP 来说更为棘手：汉语词汇甚至都没有起始标识。除了语言本身所固有的复杂性，汉语更难于用电脑处理的原因还有另外一个：NLP 一直是被以英格兰为中心的研究所主导。

但如果 NLP 未来的研究方法和算法在处理汉语和其他东亚语言时的效果能超过英语，我也不会特别意外。这有一个先决条件，即找到语义理解上的改进办法，毕竟句法在汉语中的重要性要远小于西方语言。

深度学习还不足以解决 NLP 的核心问题

CSDN：上个月，Yann LeCun 对阵 Yoav Goldberg 的那场 NLP 大争论十分引人注目。您如何看待这场争论，特别是深度学习和 NLP 的关系？您支持哪一边的说法？为什么？

Hans Uszkoreit：我认为这场争论被误读了，它不是一场 NLP 领域的深度学习倡导者与怀疑论者之间争执，它不是那样开始的。Yoav Goldberg 不是反对深度学习，他也不是反对深度学习在 NLP 领域的应用。相反，Yoav 大力推动了深度学习在 NLP 领域的应用。

Yoav Goldberg 只是对那篇自然语言生成（NLG）领域的标题党论文表示不满，它只是在吹嘘一些很小的成果。Yoav 的说法并没有错：那篇标题党论文对于 NLG 领域的研究进展毫无意义，它未能解决 NLG 领域所公认的任何问题。

而 Yann LeCun 和 Fernande Pereira 认为他们应该站在论文作者一边的原因，是确实有很多的 NLP 研究者极端怀疑深度学习在语言分析和生成上的作用。LeCun 和 Pereira 把这种怀疑主义视为过时的研究范式反抗深度学习大法的无力尝试。保守派对阵革新派，这是科学革命中的古老游戏。但这绝非是 Goldberg 此次争论的目的。

我个人的看法是：当前的深度学习方法还不足以解决 NLP 领域的核心问题。但它们已经改善并实现了 NLP 技术的很多应用。深度学习此处的不足，并不在于当前所用的各种人工神经网络及其各自的学习算法，而在于我们还没有正确类型与足够数量的语言类标注数据。人类语言和人脑共同进化的方式，是语言能被用来表达信息和知识的同时，还能让儿童用很短的时间就能学会。语言的这种可习得性与基本知识概念的可习得性紧密相连。没有语言就无法学到概念，不与概念想结合也无法学到语言。如果我们可以找出一个能同时教会人工智能语言和概念的方法，问题就解决了。这里的第一步就是基于人工神经网络的可复用知识的机器学习。

在这样的技术变革形势下，Goldberg 只是在倡导正确的科研行为的严格规则。但我们都清楚，面对这样的环境，惯常的行为标准并不总是适用。在社会变革中，有勇气在正确的时刻说话的人，往往都是我们历史上的英雄。

给年轻从业者的三条建议

CSDN：在您的人工智能生涯中，最宝贵的经验是什么？对于新一代的 AI 从业者，您有哪些建议？

Hans Uszkoreit：我有三条小建议。

扩展视野：多去国外看看，或至少能在跨国企业工作一段时间。我在美国待了将近十年，并领导过多个国际项目。我一直都是一个国际博士生项目的共同负责人，我还主持过一个国际研究生项目。我在国际项目、暑期学校与会议中的经历，极大地丰富了我的专业能力和个人生活。
爱上数据，尽量为你所爱的数据工作：它可能属于商业统计、图片、音频、视频或文本，所有这些数据都有它们各自独特、丰富且有意义的内在结构。尽量弄懂这里的结构，尽量靠自己来解释数据。一定要坚持做高质量的错误分析，甚至要自己去读这些错误数据。尽量把算法的特性和数据的特性联系起来去看。
尽量去接触自身领域之外的研究：至少，要能不时地去考量你的子领域同相邻领域的关系、你的数据同其他类型数据的关系、你的方法同其他方法间的关系。不要因为你不理解就放过同其他领域专家进行交流的机会，敦促他们用最简单的方式来解释他们的问题和解决方案，同时尝试以同样的方式来解释你自己的研究工作。多了解人类的认知机制，即便机器智能的机制是一种完全不同的方式。

CCAI 演讲亮点

CSDN：您在 CCAI 演讲主题是“结合机器学习和知识解释的商务智能应用”，但相对于上一代基于规则的人工智能，机器学习和深度学习近年来突飞猛进、硕果累累，那么，我们为什么还需要这种基于规则的知识工程？

Hans Uszkoreit：当前，深度学习主要用来获取某种形式的“智能”行为。对于给定的输入，系统能够习得人类的方法并做出反应。这些系统还没有外在的可复用知识，但能够获取到一些内在知识。只是这样的知识通常无法被复用于其他任务。我并不支持人工智能像 30 年前所尝试的那样来使用知识工程，但我坚信人工智能终将找出办法来使用人类已有的海量的外在知识（如维基百科或结构化的 DBpedia 等），并且它很快就能自动获取更多的外在知识。

与其讨论深度学习与深层知识间的竞争关系，我更愿意去思考这两大技术有效结合起来的前景：只要机器能够从人类身上学习，它就有可能学会数以百万计的人的知识。

CSDN：您对本届 CCAI 大会有何期待？您最想听的演讲时哪一场？

Hans Uszkoreit：中国有很多我还不知道的 AI 研究团队和研究中心，对于他们的研究成果与应用创新，我特别期待。对于中国公司所能贡献的 AI 成果，我相当好奇。

关于 CCAI

中国人工智能大会（CCAI），由中国人工智能学会发起，目前已成功举办两届，是中国国内级别最高、规模最大的人工智能大会。秉承前两届大会宗旨，由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会（CCAI 2017）将于 7 月 22-23 日在杭州召开。

作为中国国内高规格、规模空前的人工智能大会，本次大会由中国科学院院士、中国人工智能学会副理事长谭铁牛，阿里巴巴技术委员会主席王坚，香港科技大学计算机系主任、AAAI Fellow 杨强，蚂蚁金服副总裁、首席数据科学家漆远，南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展，汇聚了超过 40 位顶级人工智能专家，带来 9 场权威主题报告，以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛，届时将有超过 2000 位人工智能专业人士参与。

目前，大会门票正在火热发售中，扫描下方图片中的二维码或直接点击链接火速抢票。

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
谁家酒器最绝唱，藏在酒厂人未知？景阳冈酒厂先秦藏品大揭秘李虓酒评论
文/王赛时中国的酒器酒具历史久远，举世闻名。从北京的故宫博物院、中国国家博物馆，到世界各国的大型博物馆，都以能够收藏中国古代酒具而夸耀。但很少有人知道，在山东阳谷景阳冈酒厂，默默地收藏了两千件中国酒器。这些酒器，就封藏在景阳冈的酒道馆里。其中有一些青铜酒器，一睡就是三、四千年，堪称无声国宝，堪作无字史书！今天，我将引领诸位首先窥视一下景阳冈酒道馆的9件先秦藏品，你自己来说震撼不震撼。提示：这只是景
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
读《人间鲁迅》有感琳语读书
上周读完《闻一多传》后，我对中国近代知识分子产生了兴趣，这周继续读了《人间鲁迅》。厚厚的两本书，记录了一个人的一生，苦痛，彷徨和挣扎，虽然只读了一小部分，却也心潮澎湃。闻一多和鲁迅是完全不同的。鲁迅是沉郁的，现实的，寂寞的，抗争的。除了天生性格的不同外，环境的塑造也是非常之大。鲁迅少年经历了家庭的变故，看尽了人间冷暖，世态炎凉。这种经历促使他很早就观察思考人生，立志用文学来改变中国国民的劣根。闻一
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
高仿包包批发在哪里买最便宜?推荐6个购买渠道鸿运工作室
高仿包包作为一种时尚单品，受到很多人的喜爱。然而，对于批发高仿包包的人来说，如何找到最便宜的购买渠道是一个关键问题。本文将为您推荐6个购买高仿包包最便宜的渠道，帮助您更好地满足批发需求。咨询加微信：FB2260(下单赠送精美礼品)1.义乌国际商贸城义乌国际商贸城是中国最大的小商品批发市场之一，也是高仿包包批发的热门地点。这里有众多的批发商聚集，提供了各种各样的高仿包包，价格相对较低。您可以在这里找
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR