结对作业微软学术搜索分析

殷鹏程 10061130

姚铭 10061204

选题：微软学术搜索

第一部分——关于微软学术搜索网站的Functional Bugs

1. Academic Map 鼠标滚轮缩放失效问题

Symptom：正常使用Academic Map的缩放功能时，缩放操作可以同时通过拖动页面右上角滑块与滚动鼠标滚轮实现（后者符合大多数用户习惯），但在Academic Map上点击一个学术机构之后，系统提示加载，拖动滑块依旧可以执行地图缩放，而此时鼠标滚轮失效。

2. Academic Map 载入学术机构后用户当前缩放失效问题

Symptom：当点击一个学术机构时，地图返回一个固定的缩放比例，用户当前缩放比例失效，这不利于用户查看地理位置临近的学术机构的相关信息（用户需再次执行缩放操作），比如北航与北科。

3. Academic Map 双击学术机构后无法返回地图模式问题

Symptom：正常情况下，单击学术机构，程序载入正确的机构相关信息，此时地图做阴影化处理，用户可通过单击任意非连接区域回到地图模式。而双击某一学术机构（特别是多次双击）时，程序载入机构相关信息后，此时单击任意区域都无法回到地图模式，同时，此时地图未作阴影化处理。程序核心功能无法继续使用。

本Bug在Chrome 23及IE 8下均出现：

Probable cause：在多次双击某一节点的情况下，程序可能会多次异步载入学术机构信息，由于未能够正确的处理鼠标双击节点的事件，程序对“当有信息后台载入时鼠标双击节点”的情况处理有问题，或未作处理。

4. 搜索部分中文关键词出现不相关结果

Symptom：尝试搜索“数据挖掘”，得到如下所示结果，初步判断两篇文章与“数据挖掘”此中文关键词不相关（虽然正文内容可能为数据挖掘），在两篇论文的题目、摘要中都未出现“数据挖掘”，且由于原文链接失效，无法验证正文中是否出现相关词汇。

注：搜索结果中未给出“数据挖掘”在正文中出现的位置信息。

5. 强制停止搜索操作时UI仍显示‘载入’状态问题

Symptom：在首页执行搜索操作后，强制停止新页面的载入，此时最右侧‘载入’图案仍旧显示

补充：一个可能的功能性bug：键入某个keywords，无法自动导航至关键词页面，如information retrieval，而键入social network则可以，虽然用户的query string同关键词是完全match的。希望能够修复这个bug(我发现当keyword与某个期刊或会议的关键词重叠后，系统会自动给出提示，让用户选择进入哪个页面，那么为何keyword不会与其发生重叠时自动进入keyword页面，而不是让用户选择是否由结果页面跳转到keyword页面？应该统计当用户搜索某个keyword时的意向页面来决定哪个优先展示)（来自采访后的用户反馈）

6. 非功能性：UI问题

Subdomains下的下划线过长问题，如图所示，subdomains下发的下划线右端过长，影响了页面的整体视觉效果

7. 非功能性：数据问题 ‘color image processing 与 colour image processing’被作为不同关键词处理

这是我本人在日常使用微软学术搜索时发现的一个Bug，关键词库中很多包含color或colour的关键词被视为不同的关键词处理，如‘color image processing 与 colour image processing’，两者的关键词id分别为6646与6502，除此之外，还有很多类似情况。

第二部分——关于微软学术搜索网站项目开发的不足

我作为微软学术搜索长时间来的用户，虽然使用频率不高，但学术搜索确实帮我解决了很多问题。在阅读了邹老师关于微软学术搜索项目的历程介绍之后，我综合分析得到以下几点问题：

1. 前台代码规范问题

根据邹欣老师教程，结合本人日常开发的总结，我认为微软学术搜索在前台开发上存在如下几个问题：

1.1 JQuery代码与前台代码混用问题

查看首页（http://academic.research.microsoft.com/）的源代码，我们可以在<head></head>标签内发现对JQuery的引用。

JQuery是一个十分流行的Javascript框架，那么，既然使用了JQuery，根据使用JQuery的习惯与业界普遍赞同的编码规范，页面内所有对DOM元素的操作都应该通过JQuery实现，而不应该再使用丑陋的getElementById方法（否则就失去了使用JQuery的意义~）。但是，我们却赫然发现了下面的代码：

如上图所示，页面中同时使用了JS原生的getElementById()方法，以及JQuery的$(selector)方法，虽然两者的功能是一致的，但考虑到后期的可维护性已经对编码规范的遵守，应该统一使用JQuery风格的DOM操作方式。

1.2 HTML页面标签内嵌CSS样式的问题

下图截取的代码为网页底部栏目的html代码。

可以看到，这个div引用了footer class，而让人费解的是，div标签中却仍旧有内联的CSS样式属性（style="height: 30px;"），对于前端开发而言，这是一种很不好的习惯，因为对同一个标签的控制分散到了不同的地方，很不利于代码的维护，即使在学霸的UI中，我们的前台DEV也不会做这样的事情。

从标签风格来看，这个div应该不是asp.net自动生成的，那么前台开发人员在书写其css样式时，应该将其所有样式放到footer class里。

1.3 HTML标签内嵌JavaScript函数问题

从下图可以看出，页面的标签元素中内联了很多javascript函数，而根据一般的js编码规范，js函数应该单独放到<script></script>标签内，html的事件（如onClick）应该直接饮用js函数名，而非直接在onClick事件中定义。

这样做，会有以下几个问题：

1. 不同的事件，其处理函数可能相近，内联定义会造成代码冗余

2. Html代码与js代码高度耦合，当代码量达到一定量级后，可维护性会很差

在学霸UI中，所有的js代码均位于Header标签内的<script></script>标签中，方便了引用与维护。

从以上几点可以看出，beta版本的微软学术搜索在前台代码的代码质量控制上可能有所疏忽，希望能够引起重视。

2. 关于开发技术手段的问题：对与合理使用asp.net服务器控件的探讨

仅从微软学术搜索的首页来看，可以发现，页面大量使用了asp.net技术，具体表现在几乎所有的div的id都由ct100打头。

使用asp.net的服务器控件可以简化UI的开发流程，但是，从我个人的观点，不恰当的使用反而会带来以下几个问题：

控件的状态须由IIS维护，不必要的控件产生的无用状态加重了服务器的负担

部分可以通过前台技术（如js）实现的功能通过服务器实现，不利于充分利用客户端浏览器的处理能力（动辄酷睿cpu，甚至浏览器支持gpu渲染），且加重了服务器的负担。

对于前台的某些功能，因为采用了控件，既需要编码人员参与，又需要前台工程师参与，不利于协作与分工

3. 关于项目开发流程的问题

邹老师的博客上有这样一句话：

由于项目的绝大部分模块都进行了大规模的工程性重构，重写。有些问题太难, 研究员们逐步撤出了项目。

根据博文，可以发现，在M1阶段，研究员与工程师共同参与，我虽然不清楚他们是否共同参与编码，但从上文可以看出，M1阶段可能没有采取比较好的架构，或者比较好的设计模式，导致项目在迭代过程中需要进行大规模的工程性重构，但代码重构对于一个项目来说，是很可怕的（我曾经看到过一篇博文，讲的是代码重构（重写）标志着项目的失败，具体链接无从找寻）。

因此，我猜测，M1阶段的研究员与工程师可能共同参与了编码，但很可能由于研究员的编码风格可能不是面向工程的，导致M1阶段的代码存在架构上的问题，否则为何要大规模重构？之前不是根据MS Agile，进行了2周的计划了么？恳请邹老师解答~

第三部分——使用Academic Search进行学习领域的选择：记黄同学使用Academic Search 的心得

编者按：

最近我的哥们黄同学需要进行CS专业领域的选择，面对CS领域下形形色色的Subdomain，该选择什么方向为好？在某日跟我提到此事后，我便推荐他使用微软学术搜索。以下是黄同学使用微软学术搜索完成专业领域选择的过程记录。

用户背景：

黄同学，我航高工大三本科生，计算机科学与技术专业。

使用Academic Search的目的：发掘CS下的热门领域，进行专业选择

感兴趣方向：Social Network，Machine Translation，Peer to Peer，Information Retrieval

用户使用过程：

1. 学习阶段与功能选择

由于黄同学之前没有使用过Academic Search，笔者首先向其大致介绍了AS的主要功能，并建议他通过两个途径进行热门领域的比较：

1 查看相应Keywords（见上）的论文发表与引用数目图

2 使用AS的Domain Trend功能，横向比较CS下各个subdomain的论文发表情况。

黄同学希望通过衡量某个领域的热度（主要还是看论文发表数目），并结合自我的个人兴趣，来确定今后的研究方向。因此，以上两种手段是比较有效的。

2. 具体使用阶段

2.1 Domain Trend功能

在大致熟悉了AS的主要功能后，黄同学便开始了具体工作J，首先使用Domain Trend, 但打开Domain Trend的主界面后，小黄在左侧的subdomain中找了又找，只找到了Information Retrieval……

“咋没有其他的关键词呢？！”

我向他解释：AS中的Domain Trend只列出了AS中定义的subdomain的论文数目信息，其他的关键词不在subdomain范围之内。它们可能属于某个subdomain。

那么，该如何找到上述关键词所在的subdomain呢，我跟小黄犯了愁，Social Network属于啥？Network & communication还是World Wide Web？Academic Search貌似没有给出Domain与Keywords的对应关系哎…..

2.2 直接搜索Keywords得到相应图表

比起第一种方法，这招来的更实在~

但是，我们在检索各个关键词结果后发现，对于上述所有KeyWords，2011年与2012年的论文publication数目都少于2010年，导致我们无法根据图表判断上述领域在11年与12年是否热门（见下图）。

其中，12年的数据只有两位数，但为什么11年的也相对较少？估计是AS对近两年的数据收录不全。

但让小黄没有想到的是，keywords页面还给出了领域大牛们对keyword的定义，方便了用户对领域进行初步的认识与了解。

经过一番搜索之后，小黄认为Academic Search提供的近两年的论文发表数目不太准确，不能很好的反映某一领域的发展趋势，只能够通过横向比较各个领域间的论文发表数目来判断热门领域。最后，小黄选定了Machine Translation（兴趣是第一位的J）。

最后，根据小黄同学的反馈，我们一起总结了AS的各个方面的优缺点~

项目

优点

缺点

数据量

横向来看，CS各个subdomain的论文收录颇全，足够支撑日常论文检索需求

对近两年，特别是2012年的论文收入很少

界面

界面设计很人性化，特别是各项Visualization功能，将数据可视化，特别有利于向黄同学这类需要进行领域分析与研究的用户

“怎么没有中文界面？！”（用户语），Google学术至少还有个中文版，PS：本人常用国产万方（wangfangdata.com.cn）

功能

对比Google学术搜索与国内的万方（wanfangdata.com）、中国知网等，微软学术搜索的功能明显更多，而且数据的可视化程度更高

部分功能在细节上仍需要完善，比如Domain Trend无法添加Custom Domain（比如比较用户指定个N个关键词）

准确度

对大部分KeyWords的搜索比较精准

搜索结果排名上存在一些问题

对于部分keyword，如social network，题名social and biological networks的文章竟然排在第一页第三位，远高于题名包含social network的文章

搜索information retrieval，无法自动进入关键词页面（虽然关键词同用户键入文本一致）

用户对产品的改进意见：

强烈要求有类似于Domain Trend的Keywords Trend功能，用于横向比较不同的Keywords

一个可能的功能性bug：键入某个keywords，无法自动导航至关键词页面，如information retrieval，而键入social network则可以，虽然用户的query string同关键词是完全match的。希望能够修复这个bug(我发现当keyword与某个期刊或会议的关键词重叠后，系统会自动给出提示，让用户选择进入哪个页面，那么为何keyword不会与其发生重叠时自动进入keyword页面，而不是让用户选择是否由结果页面跳转到keyword页面？应该统计当用户搜索某个keyword时的意向页面来决定哪个优先展示)

第四部分——移动设备上的微软学术搜索

市场情况

目前学术搜索产品基本都是以网页为载体，除了微软，规模最大的学术搜索是谷歌学术搜索，其余的还有CNKI和Heliloid等搜索产品。但针对移动的客户端尚未成熟，微软学术搜索推出的WP7客户端，其余的没发现。

功能

关于要设计什么样的功能以及为什么用户会用该产品，我们使用NABC模型来分析的学术搜索的功能需求及改进方法以及这样做的优点。

1) N (Need 需求)

现在的学术搜索产品功能大都仅限于学术论文资源的搜索，加以学科领域分类。而对于文献之间的关系，学者之间的关系，还有研究机构之间的信息比较很少有体现。微软学术搜索的几个模块功能实现了上述关系的深入分析，为学者提供了对学术资源的分析与整理。除此之外，我们还应该为用户提供个性化的信息定制，给用户感兴趣的领域等信息给予更新。针对在移动设备上使用的用户，我们应考虑到移动设备的使用特点，设计适合移动设备特点的功能。

2) A (Approach 做法)

考虑到为用户提供在移动设备上快捷简便的使用体验，设计以下功能：

为用户提供账号登陆功能，用户使用自己的账户可以设置自己感兴趣的学科领域或者学术作者，可以及时的获取这些限定领域的最新消息。

提供收藏功能，在遇到喜欢的文献或出版物时可以加入自己的收藏夹，以便以后查看。

设置感兴趣的学术会议，会议临近时提供提醒。

社交网络分享功能，看到不错的文献资源时可以分享到各大社交网站。

简洁视图模式。考虑到移动设备屏幕大小有限。可以选择设置为简洁模式，搜索的文献或学者结果时仅显示标题或学者最简单的信息，点击时展开，显示较详细的信息。

3) B (Benefit 好处)

实现了上述功能，使得该学术搜索客户端不再是用户单方面向程序发出请求并获得结果的平台，而是用户与学术资源互动的平台。客户端可以根据客户的喜好，有针对性的提供给用户最需要的资源，节约了用户搜索相关信息的时间，方便了使用过程。另一方面，我们针对移动平台，特别是手机，考虑到屏幕大小有限，提供简洁和常规两种阅读模式是有必要的。

4) C (Competitors 竞争)

目前对于学生机研究人员，在网络上搜索大量的学术资源是必要而又比较繁琐的工作。一个易操作，功能强大的学术搜索平台是有很大市场价值的。而目前的相关产品功能大都仅限于论文资源的搜索，加以学科领域分类，很少对资源的相互关系加以梳理，针对用户的个性化信息支持更是几乎没有。所以经过分析，完成这个学术搜索移动客户端的市场价值巨大，而且目前阶段市场竞争还不是特别强烈，但面对其他相关学术搜索产品的不断升级，竞争压力在后期应该会有所上升。

角色配置

项目初期阶段，测试量较少，设置开发人员2名，美工2名，测试人员1名；

项目中后期，设置开发人员2名，测试人员2名，美工1名。

12周计划

项目采用迭代式开发过程。每周都必须召开例会分析项目的进度与当前难点，并且分析怎样做确保进度的正常进行，每个小阶段结束后进行一定的总结。而其中重要的一点，项目文档是贯穿整个12周必须要做的事情，完整的文档是保证项目顺利进行的前提。

第1-2周

进行需求分析，并向公众征求功能需要，综合各方面的需求，最终确定项目的整体定位，细化并确定所有功能需求，形成需求报告。

第3周

软件的架构设计，据需求分析所得结果完成软件架构的详细设计，为正式开发做准备。

第4-7周

第一轮开发，根据之前的详细设计进行项目开发。

第8周

测试版发布，收集软件的bug和其他不足之处，制定改进计划。

第9-10周

第二轮开发，主要是完善之前的测试版本，并修改bug

第11周

项目稳定阶段，进一步完善项目，做项目的收尾工作。

第12周

结束项目的开发，制作说明文档，帮助文档等，完成发布。

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
容易满足的小孩洒在心头的阳光
去年买的榨汁机没有用几次就坏了，前些时间答应娃儿给他买个，天天没事就问我，啥时候买，还自己淘宝上比较，加入购物车，这不前几天赶紧给他买了，省的每天叨叨在我耳边念叨着。今天终于到货了，因为他一直想和喝芒果汁，顺便买了芒果在家，放学回来兴奋的，赶紧要榨芒果汁，还特意搜索一下芒果汁的做法，我说他要是学习能有吃这般如此认真，我也就没有那么操心了。今晚喝到了芒果汁，他很开心，是阿，孩子就是这么容易满足，得到
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
Table列表复现框实现【勾选-搜索-再勾选】～四时春～ java 开发语言 elementui vue
Table列表复现框实现【勾选-搜索-再勾选】概要整体架构流程代码实现技术细节注意参考文献概要最近在开发时遇到一个问题，在进行表单渲染时，正常选中没有问题，单如果需要搜索选中时，一个是已选中的不会回填，二是在搜索的结果中进行选中，没有实现，经过排查，查找资料后实现。例如：整体架构流程具体的实现效果如下：代码实现{{scope.row.userName}}已选区{{userItem.userName
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
2024春节微信红包封面序列号大全一览帮忙赚赏金
2024微信红包封面序列号哪里领取红包封面领取微信搜索公众号：【艺间封面】千万红包封面等你领取2024微信红包封面免费序列号如何设置微信红包封面？1.打开微信，点击好友选择红包。2.单击红包封面。3.单击“添加红包封面”。4.输入接收序列号。来一波免费的微信红包封面序列号微信红包封面序列号红包封面领取微信搜索公众号：艺间封面千万红包封面等你领取微信红包封面序列号kGnkrbw5a7N微信红包封面序
天猫返利网哪个最好?天猫返利网站有哪些? 优惠券高省
关于哪个返利网站好用，今天汐儿给大家介绍以下十大网站，可以作为参考：1、高省网【高省APP】（邀请码：668666）全网佣金最高。手机应用商店搜索“高省”即可免费下载安装，填写高省邀请码：668666，直升2皇冠，享更高佣金及分红奖励。高省APP全网佣金最高，手机应用商店搜索“高省”即可下载，高省邀请码：668666，此码注册，直升2皇冠，佣金更高！送万元推广大礼包，教你如何1年做到百万团队。其实
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
HarmonyOS开发实战（ Beta5.0）搜索框热搜词自动切换让开，我要吃人了 OpenHarmony HarmonyOS 鸿蒙开发 harmonyos 华为鸿蒙移动开发鸿蒙系统前端开发语言
鸿蒙HarmonyOS开发往期必看：HarmonyOSNEXT应用开发性能实践总结最新版！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）介绍本示例介绍使用TextInput组件与Swiper组件实现搜索框内热搜词自动切换。效果图预览使用说明页面顶部搜索框内热搜词条自动切换，编辑搜索框时自动隐藏。实现思路使用TextInput实现搜索框TextInput({te
leetcode刷题day19|二叉树Part07（235. 二叉搜索树的最近公共祖先、701.二叉搜索树中的插入操作、450.删除二叉搜索树中的节点）小冉在学习 leetcode 算法数据结构
235.二叉搜索树的最近公共祖先思路：二叉搜索树首先考虑中序遍历。根据二叉搜索树的特性，如果p,q分别在中间节点的左右两边，该中间节点一定是最近公共祖先，如果在同一侧，则递归这一侧即可。递归三部曲：1、传入参数：根节点，p，q，返回节点。2、终止条件：因为p,q一定存在，所以不会遍历到树的最底层，因此可以不写终止条件3、递归逻辑：如果p,q均小于root的值，递归调用左子树；如果p,q均大于roo
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
阿里巴巴商品搜索API返回值实战解析 weixin_43841111 api java 前端 javascript
在解析阿里巴巴中国站商品搜索API返回值并进行实战时，可以从以下几个方面入手：一、了解API返回值的结构基本信息返回值通常包含商品的标题、价格、库存、图片链接等基本信息。这些信息对于了解商品的概况非常重要。例如，商品标题可以让你快速了解商品的名称和特点，价格信息可以帮助你进行价格比较和成本核算。详细描述可能包括商品的详细描述、规格参数、使用方法等。这些信息对于深入了解商品的特性和功能非常有帮助。比
果冻宝盒官方app邀请码有哪些一览(附邀请码填写指南)省钱又开心！小小编007
果冻宝盒是一款备受瞩目的社交电商软件，其独特的邀请机制和丰富的奖励制度吸引了大量用户。在使用果冻宝盒的过程中，填写正确的邀请码是获取奖励的重要步骤之一。本文将为您详细介绍果冻宝盒官方app的邀请码有哪些，以及如何正确填写邀请码，帮助您更好地参与果冻宝盒的社交电商生态。果冻宝盒直升金牌总裁（最高返利）注册教程：1各大应用市场搜索【果冻宝盒】并下载安装2注册果冻宝盒，根据提示填写邀请码：2233773
2022-04-25 L是木子李呢
上门维修APP开发应具备哪些功能随着移动互联网的不断发展，上门维修在我们生活中已经是非常普遍的存在了，为了给用户更方便的找到上门维修的渠道，上门维修APP应运而生，那么上门维修APP开发应具备哪些功能呢？1、维修门店搜索为了更好地方便用户省时省力，上门维修APP会依据用户定位信息搜索线下实体店，促使用户更好的找到线下维修店面，省时又省力。2、维修服务分类包括管道洁具维修、强电弱电维修、木工维修、粉
网站推广爬虫 Bearjumpingcandy 爬虫
网站推广爬虫是一种用于升网站曝光度和推广效果的工具。它通过自动化地访问和收集网站信息，从而实现对目标网站的广告、关键词、排名等数据进行分析和优化。以下是网站推广爬虫的一些介绍：数据收集：网站推广爬虫可以自动访问目标网站，并收集相关的数据，如网站流量、关键词排名、竞争对手信息等。这些数据可以帮助网站推广人员了解网站的现状和竞争环境，从而制定相应的推广策略。关键词优化：通过分析搜索引擎的关键词排名情况
【美食分享】油炸牛奶吴老师教语文
一直宅在家里，闺女感觉很无聊，又不想学习，干嘛呢？突发奇想：做一道菜！啥菜呢？通过多方搜索，发现有一道菜看起来比较诱人：油炸牛奶。说做就做，这个喜欢拖延的娃，居然这次没有拖延。一个下午的忙碌，居然还真的做出了一道色香味俱全的菜肴。不信，晒图为证：这道菜，看着就很诱人，外焦里嫩。轻轻夹起一块，咬上一口，嫩嫩的，香香的，糯糯的，滑滑的，哇，唇齿留香，美味无比！闺女盯着我，期待地眼光看着我：“咋样？好吃
一部手机就能操作的10种赚钱方式,看看哪种适合你? 氧惠全网优惠
手机已经成为了我们生活中不可或缺的一部分，拿着手机刷分享赚钱已经成为了不少人的日常。今天，我想和大家分享一下手机赚钱的10种好方法。京东密令红包：最爱领红包828红包多多148今天给大家分享我长期在做的副业，也在这里赚到人生第3桶金！氧惠APP佣金高，资质靠谱，各大应用市场均可搜索使用。【氧惠】氧惠app是杭州长孚科技有限公司旗下一款新开发电商导购应用，为用户打造一个集成电商购物优惠佣金平台，公司
UI 自动化的页面对象管理神器 PO-Manager TesterHome
原文由alex发表于TesterHome社区网站，点击原文链接可于作者直接交流。做UI自动化的同学都知道，UI自动化一个难点就是页面元素的变化，让自动化维护成为一个痛点。在此，为了减轻这个痛点，我在基于Page-Object模式的基础上开发了页面对象维护的工具。该工具为vscode的一个插件，可以通过vscode插件市场搜索PO-Manager来下载安装本文中的页面对象库文件基于json.一个元素
亚马逊真的可以赚钱吗？亚马逊怎么做才能赚钱？古楼
1、代购：近年来，随着移动支付和国际物流的发展，代购行业不再像以前那样火爆，但依旧有着不错的利润空间，大家可以兼职亚马逊代购，获得手续费，汇率差价等等，是可以赚到钱的。2、跨境电商：所谓的亚马逊跨境电商，就是通过通过亚马逊跨境平台，把中国的货物卖到全球去，虽然在国内，亚马逊的流量不如京东、淘宝、拼多多，但在国外亚马逊的流量是很高的，其市场空间庞大。一、注册店铺网页搜索“亚马逊全球开店”进入官网。找
大家在哪里买高仿包包，推荐6个最新渠道腕表鞋屋
大家在哪里买高仿包包，推荐6个最新渠道在如今的社会中，有许多人喜欢购买高仿包包。虽然真正的奢侈品价格昂贵，但是高仿包包的外观和品质却能够满足大多数人的需求。那么，大家想知道在哪里买高仿包包吗？下面就为大家推荐6个最新渠道。微信:97870758(下单赠送精美礼品)第一个渠道是线上购物平台。如今，互联网的发展让我们可以方便地在各大电商平台上搜索并购买高仿包包。一些知名的电商平台如淘宝、京东等都有很多
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

项目	优点	缺点
数据量	横向来看，CS各个subdomain的论文收录颇全，足够支撑日常论文检索需求	对近两年，特别是2012年的论文收入很少
界面	界面设计很人性化，特别是各项Visualization功能，将数据可视化，特别有利于向黄同学这类需要进行领域分析与研究的用户	“怎么没有中文界面？！”（用户语），Google学术至少还有个中文版，PS：本人常用国产万方（wangfangdata.com.cn）
功能	对比Google学术搜索与国内的万方（wanfangdata.com）、中国知网等，微软学术搜索的功能明显更多，而且数据的可视化程度更高	部分功能在细节上仍需要完善，比如Domain Trend无法添加Custom Domain（比如比较用户指定个N个关键词）
准确度	对大部分KeyWords的搜索比较精准	搜索结果排名上存在一些问题对于部分keyword，如social network，题名social and biological networks的文章竟然排在第一页第三位，远高于题名包含social network的文章搜索information retrieval，无法自动进入关键词页面（虽然关键词同用户键入文本一致）

第1-2周	进行需求分析，并向公众征求功能需要，综合各方面的需求，最终确定项目的整体定位，细化并确定所有功能需求，形成需求报告。
第3周	软件的架构设计，据需求分析所得结果完成软件架构的详细设计，为正式开发做准备。
第4-7周	第一轮开发，根据之前的详细设计进行项目开发。
第8周	测试版发布，收集软件的bug和其他不足之处，制定改进计划。
第9-10周	第二轮开发，主要是完善之前的测试版本，并修改bug
第11周	项目稳定阶段，进一步完善项目，做项目的收尾工作。
第12周	结束项目的开发，制作说明文档，帮助文档等，完成发布。

结对作业 微软学术搜索分析

你可能感兴趣的:(搜索)

结对作业微软学术搜索分析