谷歌搜索服务器介绍
二十一世纪是信息爆炸的时代,政府、企业、高校的信息化建设取得很大进展,纷纷建成了各自的内部信息网络和各种应用系统,数据量爆炸式增长,海量的数据信息以数据库、MS-Office、TXT、PDF、HTML等多种形式存在于各台服务器或其他存储设备中。结构化信息和非结构化信息并存,信息存储方式多种多样,不同的子系统使用不同的数据库并共同存在于Intranet中,很容易形成信息“孤岛”,给信息查找带来了极大的挑战。先进的搜索工具,可以帮助用户极大的提高搜索效率,更快更全面地从海量的资料中查找到需要的信息。
Google Search Appliance(以下简称GSA)是一套软硬件集成的整体解决方案,能够对政府、企业、高校、协会等机构拥有的网页、文档、数据库等相关信息进行高效安全的通用搜索,它支持的文件格式达 220 余种,可索引的文档数量高达数十亿。
GSA可以查询您现有系统内的文档,帮助您在内容管理上的工作,包括:文件共享、Web服务器、文件管理系统和企业应用等。搜索服务器充分利用现有设备提供最高质量、最高匹配度的文档资料,而不用考虑文档的来源和格式。包括:人员搜索,即搜寻有关组织中的人员背景信息,能够立即与他们取得联系并开展协作;以及搜索所有在SharePoint2010的内容,包括HTML、Office、PDF、PostScript,WordPerfect和Lotus Note及其它很多格式。还可以为您提供实时业务数据,例如ERP、CRM或商业智能系统中的数据资料等。不仅如此,GSA还能通过门户网站、内容管理系统、文件共享等方式查询非Web访问的内容。
GSA提供全面的搜索功能,并可使用户在内部局域网进行搜索时达到与谷歌搜索引擎同样的搜索效果。可搜索局域网、文件服务器、门户网站、共享文件、数据库、目录管理系统、业务应用系统等数据,为您提供真正的“全面搜索”。
GSA特点
GSA确保搜索安全
GSA具有严格的安全性,并可以整合企业的安全机制,支持单点登录以及多种审核机制以确保搜索安全性。GSA支持早期绑定和后期绑定的选择,不同级别的用户只能看到其有权查看的内容资源的搜索结果。GAS同样支持大量的身份验证和个人登陆服务机制,包括:Windows完整身份验证、X.509客户端证书、Keberos认证、SAML组策略管理、SAML的API认证等。并集成了LDAP、NTLM和Windows身份认证,包括Oracle访问管理和CA SiteMinder的登录认证。另外,系统管理员可定义SAML的SPI身份访问控制,并且在单点登录域后可查询多个域中内容。
GSA使用方便快捷
GSA提供便捷的解决方案--“开箱即用”,无需复杂的配置,更节约了定制硬件和操作系统的费用。用户可以进一步自定义搜索功能,如源、日期、元数据、收集和节点偏置、全阵列等。此外,GSA还允许用户自定义用户界面和安全机制。
无论您使用的是哪种语言,GSA都可以自动检测,并支持包括中文、英文、法语、德语、西班牙语、日语、芬兰语、葡萄牙语等在内的27种语言。同时GSA还能进行自动拼写检查,包括错别字和错误拼写都可以反馈给用户正确的结果。在部分语言中,甚至可以对短语进行拼写检查并修正。
GSA将根据您个人的使用习惯和搜索偏好等方面进行学习,使得您的查询结果越来越精准。
GSA为企业级用户提供了与Google.com同样的体验,并额外增加了一些特性使得搜索更加简单、有效和直观
内容整理:为管理员和用户提供内容分组和归类功能,以满足用户特定需求。
高级语言段落分类:提供多种语言段落分类,包括中文、日文、韩文、泰文等。
查询优化功能:通过查询优化功能,可键入少量信息即可完成查找,帮助用户快速浏览。
定制搜索:根据不同部门和职能需要,可为不同用户群调整搜索结果。
社会性搜索:自动建议使用者从搜索查询中选择最适合的结果。
网络新闻定制服务:员工可以按照他们设定的日期订阅关于重要主题和文档的电子邮件提醒服务。
动态分类:使用户通过下拉菜单指向特定的主题并更容易的进行搜索优化,并按照标题将搜索结果进行分类。
使用HTML进行搜索呈现:自动将220多种文件格式进行重新排列,并以HTML展现,并不需要原来的应用程序。
日期和数字排序:通过日期范围和年龄、数据范围和数字等对文档进行排序。
高级布尔搜索:使用布尔参数进行复杂查询。
相关查询:定义和建议公司特定的专业术语和缩略语。
关键字匹配:对应于特定查询,优先结果显示在大量搜索结果的上方。
GSA的优势
GSA具有可扩展的架构,您可以使用多个GSA,在大量内容中共同搜索,并且不用改变软件和硬件以及现有的部署规模。您甚至不必关心具体有多少部GSA在运行,因为无论GSA数量的多少,您的搜索结果都将保持一致。
在多台GSA同时运行的情况下,Active-Active Mirroring技术将搜索流量分别引导到GSA的主搜索设备和副搜索设备上,有效的提高了自身的可用性,使得系统负载均衡。并基于GSA现有的镜像架构,能够将搜索请求分布开,从而使得所有节点都可以提供服务。该架构允许多台GSA进行实时索引更新,并允许Crawling仅发生一次。而其他GSA则可以用来处理额外的疑问负载或者用作热备份单元。在一个工作组中分布的Crawling Multiple GSAs可以智能地分配任务来加速搜索速度。GSA还将自动生成Google.com的网站地图并向谷歌网站管理员工具提交,让您的公共网站的内容被Google.com轻易发现,从而提高点击率,扩大广告效应。
Google还可提供更多的与其他系统的连接内容,包括:
•EMC Documentum
•IBM FileNet
•微软SharePoint
•OpenText LiveLink
•BEA AquaLogic
•EMC Documentum eRoom
•Hummingbird
•IBM WebSphere
•Domino Lotus Notes
•Oracle内容服务器(Stellent)
•SAP 知识管理
以及开放式架构平台的任何其他内容
产品型号
GB -7007
GSA包括软件和硬件,以及两年的服务。打包购买的模式消除了昂贵的年度维护费,并消除成本超支的威胁。我们对您的整个用户群所查询的数量没有限制,不再增加额外费用。
GB -7007采用的硬件是机架式设备,厚度为2U,可查询文档数量为50万至1000万。此外,多个GB -7007可以连接在一起,以支持更大的文件查询数量。多个GB-7007连接的方式也可用于多个部门、地区或网站搜索。在RAID架构与冗余组件的基础上,GB -7007提供了内置的冗余。
GB-7007可通过单一平台解决所有企业搜索内容,用户可以轻松升级,无需更换硬件或软件许可。
GB -9009
对于多个业务单位或大型网站来说,可能需要查询更多的文档,GB -9009应运而生,它可以搜索多达3000万文件。与GB-7007一样,多个GB -9009设备可以连接在一起,搜索数亿乃至数十亿的文件。GB -9009支持内置冗余和故障切换,提供最高的容量和可靠性。
GB-9009可通过单一平台解决所有企业搜索内容,用户可以轻松升级,无需更换硬件或软件许可。
典型用户及用户反馈
典型用户
目前Google企业搜索已经有了25000个企业用户,其中包括:
阿拉巴马州国土安全部、美国食品和药物管理局、国家公园管理处、美国运通、苹果电脑、波音公司、英国石油公司、英国航空公司、美国康菲石油公司、探索通信、依视路、霍尼韦尔、惠普、金佰利、美敦力公司、摩根士丹利、国家半导体、北方信托公司、路透社、佛罗里达大学、沃达丰、世界银行、施乐等
我们的客户说...
“我建议所有机构使用GSA。它惊人地大幅增加了WellStar的能力、知识和效率。”
-Robert Zanin,Systems analyst manager,Wellstar Health System
“即使我们的19,000名员工,在搜索信息上花费的时间只是节省了一点点,那么我们提高的生产效率所带来的收益将很快付清GSA的费用。”
-Haroon Suleman,Global IT Enterprise Architect,Mercer
“在我们平均查找信息所花费约12分钟的时间里,如果能减少一分半到两分的时间,那就意味着浪费也减少了10-15%。我们相信,GSA在带给我们提高的同时,会让我们省下该节省的钱。 “
—Ray Coyle, Global Workplace Services Manager, HP Enterprise Services