ModelWhale

可复现、开放科研、跨学科合作：数据驱动下的科研趋势及应用方案

信息技术的快速发展，催化了数据科学场景下科研组织提高科学研究的可复现性、实现开放科研、开展跨学科领域的交叉研究等协同诉求。本文剖析了此三类诉求的实现难点，并提供了系统化的解决方案。

欢迎进入ModelWhale 官网注册试用，个人专业版与团队版含更多高阶功能，可一体化解决多种科研数据分析建模及团队协作问题，现可免费体验。

扫描官网右侧二维码，联系 MoMo（移动端点此链接）延长试用周期，了解更多详情。

数据驱动下的科研诉求

科学研究的可复现性

数据科学场景下的可复现

解决方案

开放科研的学术理念

数据科学场景下的开放科研

解决方案

跨学科领域的交叉研究

数据驱动的催化作用

解决方案

结束语

数据驱动下的科研诉求

现如今，越来越多的研究者用量化的方法解决科研问题，不仅会对广泛的数据作实时、动态地监测与分析，更把数据作为新的对象和基础来思考、设计和开展科学研究。这给科学界带来了更严谨、更有创造力的科研成果，极大地提升了科研效率，但同时也对数据驱动的研究范式与工具提出了更多的要求和挑战，我们将其归结于科研团队的三方面诉求。

1. 科学研究的可复现性

可复现性指的是在相似条件下，在重复测量、实验、计算等研究过程中可以得到相对稳定的数据结果。“可复现”通常被视为一项有意义的科研成果的重要标准。

相较于基于文本的传统学术信息交流，数据驱动研究中的文献与数据紧密相连，为此学界需要一个二者可以交互的环境，提高传递和获取学术信息的效率，帮助研究者在查看文献的同时可以获取研究数据进行复现，保证科学研究过程更加高效，结果更加可靠。

2. 开放科研的学术理念

以“自由、开放、合作、共享”为特征，通过科学资源的开放共享与开放获取，可以提高科学研究的透明度与传播力，实现更多科研合作、促进更多科学发现。

数据驱动的研究不仅需要更完善的学术交流体系，对于共享数据的需求也会更加强烈。数据的聚合应用需要研究者将从不同地方获取到的数据黏合在一起，形成新的数据集，为了避免重复劳动并实现研究项目结束后数据价值的最大程度挖掘，更加广泛的数据资源开放是未来发展的必然趋势。

3. 跨学科领域的交叉研究

信息技术的发展推动传统学科交叉融合，各个学科领域的研究者开展多主体、多视角的学术合作已经成为了当代科学探索的一种新范式。

在数据驱动的研究中，一方面，数据作为学科间同质化的基础和媒介将弱化学科边界；另一方面，随着科研方法从传统的假说驱动型向探索型转变，开展跨学科领域的交叉研究将有利于对获得的海量数据进行更全面的关联性分析，形成学科间优势互补，解决更多复杂的科研问题。

云计算时代的数据科学协同工具

然而，当前科研团队在上诉诉求的实现过程中仍面临着各种各样的困难，例如：生产要素的复杂性将导致复现流程繁琐、数据对外公开易产生安全隐患、学科认知差异致使研究思路难以传递等……某种程度上，我们可以认为部分科研团队缺乏了高效流畅的对内对外协同机制。

为此，下文将结合真实科研案例及数据科学协同平台 ModelWhale 的解决方案作具体解析。

欢迎进入ModelWhale 官网注册试用，个人专业版与团队版含更多高阶功能，可一体化解决多种科研数据分析建模及团队协作问题，现可免费体验。

扫描官网右侧二维码，联系 MoMo（移动端点此链接）延长试用周期，了解更多详情。

科学研究的可复现性

数据科学场景下的可复现

在过去 10 年中，“可复现性危机（Reproducibility Crisis）”经常被研究人员、管理人员以及社会公众所提及。2016 年，《自然》（Nature）期刊对 1576 名来自不同领域的科研人员开展了调查，超过 70% 的受访者表示曾遇到过无法复现他人实验的情况，一半以上甚至表示无法复现自己的实验结果。显然，若科学研究的结果难以或无法复制，这种失败将破坏建立其之上的理论的可信度，使公众对科学知识的可信性产生质疑。对此，越来越多的研究者开始重视并努力提高其研究领域及研究成果的可复现性来应对此“危机"。

关于“可复现性危机”的调查（图源 Nature 官网）

相比于传统研究，数据驱动研究的特殊性在于它的生产要素相对复杂——要完成复现，科研人员至少需要同时获得以下信息：

1. 研究所使用的数据

数据是最关键的生产要素，随着可复现性危机的产生，越来越多的期刊、出版社都会要求作者提供原始数据文件。在数据层面当前主要存在着两个问题：

其一是数据管理问题。科研数据的规模大、类目多，本身就不易保存，而在研究的过程中科研人员又可能经常需要补充新的数据或者使用新的特征，则还需要妥善管理好所有数据处理记录和各个数据版本。若中途发生了硬件故障导致数据丢失，或者备份、记录不清导致版本混乱，都可能造成后期无法提供研究所使用的原数据。

其二是数据的安全和权限问题。某些科研人员在发表论文时可能会因数据集的安全或权限问题而对公开传播产生顾虑，比如一些私下合作的数据，就有可能涉及到隐私或版权问题。这种情况本身不可避免，但若是研究者无法提供数据集，他人也自然无法完成复现的工作。

2. 研究过程中的代码文件

在论文投稿发布时，很多作者会在原文中附带上开源代码的获取方式，如告知读者可以进入对应的 github 代码仓库下载，从而便于其他研究者对项目复现。某些研究的源代码可能存在一定的代码规范、代码抽象或代码解释问题，即便他人获取了源代码，也很难理解每串代码的具体功能和作用，无法对研究思路的理解提供帮助。

3. 研究所使用的分析环境

找到源代码后，在运行代码前，科研人员还要先根据源码的需求调试分析环境。环境的切换也比较麻烦，需要下载安装各种依赖包，并要注意版本问题。此外，安装的过程中即使是按照步骤一点一点配置，还是可能会产生各种各样的报错。这种高重复、低价值的科研活动往往会在复现的过程中带来无谓的时间损耗。此外，计算性能的瓶颈也一样会为复现带来阻碍，往往需要研究人员付出额外的调试成本。

4. 匹配整个研究的各要素的对应版本

这一点主要针对于研究团队内部的“复现”需求。随着科学研究的主体呈现出从小团队科研到大团队科研的明显趋势，合作发文的背后则是科研人员间愈发频繁的协同工作。当团队成员针对研究的各个阶段开展分工合作时，需要实现生产要素在研究团队内部的流转与共享，这是因为下一阶段的工作很有可能以上个阶段为基础，而上个阶段的生产资料又有很大概率来源于团队内的其他人。若是在获取他人的数据或代码时出现版本错误等情况，不仅复现失败，也会对后续研究的开展造成影响。

我们可以看到，在数据驱动的研究中，复现与协作过程中的一些阻碍将影响到科研人员的研究效率，需要有特定的技术和工具支持。

解决方案

基于 ModelWhale ，研究者可以相对比较轻松地完成科研成果的复现及生产资料的共享。

首先，ModelWhale 作为开箱即用的数据分析挖掘平台，同时具备了强大的协作及管理功能，科研人员可以以项目为单位实现数据、环境及代码等生产要素的一体化整合配置管理。

当研究者为研究新建一个项目时，可以选定项目所使用的分析环境，除了使用平台预置的环境外，也可以构建自定义分析环境。ModelWhale 会自动记录每一次代码运行时的镜像环境，以便于运行和复现时自动匹配。同样地，ModelWhale 也会记录代码运行时所选用的数据并在后续自动匹配。
完成阶段性的研究后，研究者可以将项目一键共享给团队成员。出于对科研资料安全的考虑，数据、分析环境和项目的使用权限可以单独设置。例如，研究者禁用数据下载权限，仅允许他人在线查看代码和使用数据完成复现，而无法将数据下载至本地。ModelWhale 也提供了申请-审核功能，协作者可以在拷贝项目时，主动申请获得项目相关的数据源及镜像环境的使用权限。

在 ModelWhale 的既往客户中，北京协和医学院就采用此种方法开展教研活动。当老师在辅导学生学习医学数据挖掘的方法时，会对国内外经典临床研究论文进行复现，将数据的提取、探索、统计分析全流程的代码，以及过程的思路制作为一个在线 Jupyter Notebook ，并且关联好论文的数据以及包含了该研究所需的包依赖的环境镜像，则学生可以一键运行复现整个研究的代码，免去从头搭建环境的困扰，快速理解论文作者的研究思路，甚至可以快速调整数据、方法与参数，即时获得运行结果，开展更多探索性研究。

另外，这一复现工具也可以帮助研究者使论文发布前的同行评议过程更为高效。在投稿时附带上项目的查看链接将提高投稿完备度，并在无形中提升了论文的可信性。审稿人除了能快速查看数据分析的完整流程外，也可以就项目 Notebook 中具体的 Cell 进行提问和评论。对于研究的模型成果，科研人员可一键完成自动化部署并发布为网页应用，则审稿人就能在网页端直接上传数据，实时看到模型的调用结果，对论文产出有更直观的认识和更准确的评价。

ModelWhale 还为内部的所有生产资料都提供了版本管理功能：

代码：对于阶段性的研究成果，科研人员可以生成一个项目版本，则其他人可以通过项目版本同步进度和完成协作，在该版本之上进行后续的研究工作。
数据：在研究过程中，对数据进行修改后，科研人员可以即时生成新的数据版本。通过组织内共享，团队其他成员也可以同步使用新版本的生产资料进行分析研究。另外，只需切换数据至特定的版本，研究者就可以随时复现之前的研究成果。
分析环境：在研究过程中不断引入的新的量化方法可能会调整分析环境中的工具包和框架，研究人员也可以生成版本以确保使用此前分析环境的历史项目依然可以运行。
模型服务：训练得到的模型进行迭代升级后，ModelWhale 支持更新部署的模型服务版本供调用、验证并获得反馈。同样地，模型服务也可以随时切换回历史版本。

最后，课题研究完成后，科研人员可以选定运行时的分析环境、挂载的数据集、最后的代码版本，将生产要素全部整合在一起，并补充一定的文字说明，沉淀至组织的课题成果库中。一方面，团队内的其他成员可随时查看成果库进行复现；另一方面，这也同时解决了科研人员随着时间推移由于分析环境改变或文件丢失而无法复现自己既往成果的问题。

ModelWhale 项目成果管理界面

科学的发展既要踩着前人的肩膀，又要走前人没有走过的路。无论是将原始数据、分析方法分享给他人以降低其复现结果的难度，还是在团队内部共享交流，科学进步的成功总是取决于“复制+创新”产生的共同效应。ModelWhale 通过生产要素的一体化管理及零门槛易上手的获得与复现流程为数据驱动的研究提供了更有效率的协同平台。

欢迎进入ModelWhale 官网注册试用，个人专业版与团队版含更多高阶功能，可一体化解决多种科研数据分析建模及团队协作问题，现可免费体验。

扫描官网右侧二维码，联系 MoMo（移动端点此链接）延长试用周期，了解更多详情。

开放科研的学术理念

数据科学场景下的开放科研

近年来，开放科研的学术理念逐渐受到了国内外研究者的欢迎和推崇，2017 年就有一群学者在《自然》杂志上发表了倡导开放科学的“宣言”。开放科研通常包括了开放获取（Open Access, OA）、开放数据（Open Data, OD）、开源运动（Open Source Movement, OSM）等方面。随着信息技术的发展，开放科研更是受到了前所未有的重视，这主要源于数据科学场景下研究的数据驱动的特性。

一方面，开放科研的发展促进了科研成果的共享，尤其是开放数据，有利于发挥科学数据的最大价值。单个的科研项目终会在一个时间点结束，而项目结束后这些数据的去向是研究者一直关注的问题，科研数据包括的信息类和数据项丰富，贯穿于科研的整个周期，通过数据共享基础设施开放和传播将解决当前科研数据的剩余价值流失问题。

另一方面，开放科研可以让更多的人共同参与科学研究工作，为数据驱动的研究提供社会效益的支持。针对类似于大流行病这类相对复杂的问题，开放的科研网络可以为研究提供大规模更结构化的开放数据，减少数据重复生产的同时支持研究高效推进；另外，将模型公开给更多的人使用并收集相关评述，相当于是在完成大规模的“同行评议”，有利于模型成果持续优化，提高研究者的科研产出质量。

然而目前仍存在着许多壁垒阻碍了开放科研的实现。

就数据来说，首先，科研数据的数据源载体多、存储形式多样、数据类型广泛，给科研人员的数据分析、共享及管理过程造成了比较大的麻烦。在数据驱动的研究背景下，海量数据通过多种途径和方式获取，并存储在硬盘、数据库或其他存储介质中，则研究者每次进行数据分析时都要采用不同的方式调取数据分别管理。与此同时，数据共享的方式也比较局限，若是使用网盘共享，数据上传、下载耗时耗力；移动硬盘共享倘若后续发生数据修改也很难再同步给相关共享人；云计算虽然可以调用公开数据，但有些无法提供本地上传数据集的接口，也并不方便。

其次，传统的有限防护机制不一定能保障数据权益和数据安全，数据共享者将面临风险责任与权利受益的矛盾。一方面，科学数据本身具有可复制性，在共享中易被窃取，造成数据贡献者自身产权受到侵犯；另一方面，数据的集中化共享很有可能导致数据使用边界模糊，增加了数据误用、数据滥用等多重风险。现有大部分共享平台可追溯性差，即使数据泄露，参与用户也很难追究。

以上这些问题使得对于那些有数据资源的科研机构来说，即使想要将数据公开给非内部人员使用，所能实现的方法也非常局限——要么只能允许内部熟识且有一定信誉度的科研人员拷贝数据，要么就是外部科研人员自行撰写繁复的申请报告，再实地去到机构的机房中完成数据分析。因此，如何在开放的同时管控公众对生产资料获取、使用和保存的权利，可能是科研人员面临的一大难点。

解决方案

ModelWhale 为科学研究生产资料及多形态科研成果提供了安全、完善的共享交互和公开机制。

当科研机构基于云端环境搭建起科研数据沙箱后，即可实现数据云端安全公开和调用管理。机构的数据管理员可以通过平台多种方式接入存放在本地、数据库、对象存储以及 NAS 空间的各类数据并进行统一管理，添加数据描述和标签，通过权限系统控制其公开的范围。

管理者可有选择性地将可开放的数据公开至机构的门户页，实现更大范围的数据共享和传播；尚不合适公开的也可以只给到内部的研究人员，支持其在线分析。另外，管理者可以将各个成员的数据需求与其所参与的研究课题、研究进度相结合，进行数据定向分发，保证数据使用权限在机构内部也能保持个体独立。

数据管理员还可以自定义每个数据集访问用户的查看、使用或下载权限，实现数据公开且不落地，并通过平台自动生成“数据账本”，查看数据实时、完整的使用记录，从多个环节有效避免了数据的安全隐患。

另外，ModelWhale 支持为每份数据生成一套 DOI 标识，在认证数据权益的同时，他人也可以通过 DOI 号快速分享或查找到相关数据集，更进一步提升了数据价值利用的科学性和可持续性。

华东师范大学就曾采用这项机制来建设他们的研究数据中台，打造了一个集数据沙箱、数据出版和数据公有链于一体的数据闭环系统。数据沙箱实现的是数据隔离和数据不落地分析，保护数据隐私和数据版权的同时，让研究者可以线上分析数据，最大化地提升了数据的利用率；数据出版实现的是为数据集和数据富媒体绑定 DOI 链接，可以快速跳转并精确定位到相关数据集，在完成数字对象标识的同时可以对数据定位、引证、溯源、故障追踪，以及数据互操作等诸多功能；数据公有链实现的是以区块链的形式记录数据集的使用记录，通过去中心化提升数据集历史使用记录的信用度，研究数据中台还会将日志记录通过区块链算法的加密，然后广播到区块链每一个服务节点。

华东师范大学门户页展示

除了数据之外，ModelWhale 还支持更多类型的成果开放发布，比如研究项目、模型成果等。

科研人员可将优质的数据集和已完成的研究项目一同公开分享或沉淀至机构的门户页，便于他人复现，实现更大范围的共享传播。既能吸引更多研究者在平台上进行相关课题的协同探索，也能在公开的过程中收集公众的反馈，对数据和项目进行检验和完善，形成更多高价值科研成果。

算法模型作为数据驱动的研究中较为独特的要素，ModelWhale 为模型开放也提供了专门设计。对于训练完成的模型，科研人员可以方便地自行完成自动化部署并公开发布，他人则可以通过公开的外部链接直接应用模型，一方面提升了模型的实用性，另一方面，社会面的大规模应用也是检验模型的实际效能的一个过程。研究者可以根据平台记录下的模型被调用的次数、历史、及使用过程等信息，来制定下一步研究计划和优化方向。

开放科研使研究的形态从独立走向聚合，让每一位科研人员既是生产者又是使用者，既是开拓者又是受益者。ModelWhale 持续关注各个科研主体在公开共享过程中的顾虑和诉求，打破基础设施的壁垒，充分释放数据驱动的研究价值。

欢迎进入ModelWhale 官网注册试用，个人专业版与团队版含更多高阶功能，可一体化解决多种科研数据分析建模及团队协作问题，现可免费体验。

扫描官网右侧二维码，联系 MoMo（移动端点此链接）延长试用周期，了解更多详情。

跨学科领域的交叉研究

数据驱动的催化作用

“跨学科”一词最早出现在 20 世纪 20 年代，指超越单一学科边界进行的涉及两个以上学科的知识创造和传播活动。自这一概念被提出后，科学家们发现跨学科的研究成果普遍存在着多样性，能够解决更多科学研究的复杂问题，甚至几乎可以说，现实中的一切重大课题，如寻找传染病的病源、人类基因组测序、航天探索、灾难救治研究等，都是需要通过跨学科合作的形式才能完成的。

随着过去十年数据的持续爆炸，数据驱动的研究方法更是成为了推动科研人员跨学科交叉研究的催化剂。数据本身具有“非学科性”的特点，可使各领域的界限变得模糊，让不同学科之间的研究对象有了同质性的基础，打破了过往学科差异下“各自为政”的状态。社会科学界的研究者可以联手数据科学界的专家，甚至自然科学界的学者，共同采用量化分析的方法开启规模更大、参与更广的合作研究。当多领域的科研人员聚集在一起，采用共同的框架和新的科学语言时，既能加速科学创新，也能赋予研究者更多发展空间。然而，研究方法与合作模式的改变还是会给科研人员在研究过程中造成一定障碍。

其一是学科专业知识与数据分析能力存在协作隔阂。

当开展基于多学科数据驱动的交叉融合研究时，数据分析手段应当与学科的实际问题紧密相连，二者形成双向驱动。一方面，学科知识可以指导数据工作，给数据分析提供更多理论支持；另一方面，数据不仅可以用来检验理论，也可以为理论建构提供新的启发，拓展理论建构的新方向。

然而，部分领域的科研人员本身数据分析能力较弱，在实际合作开展研究时难以参与至数据阶段的工作，常用的分析工具上手门槛又较高，需要耗费很多时间精力再学习；相对的，数据研究者虽然分析能力强，却又不一定了解各个学科的研究范式和专业，研究思路在传递的过程中很容易产生信息流失或理解偏差，对数据分析建模的准确性造成影响。

其二是客观因素导致的研究团队项目管理与资源同步效率低。

由于开展跨学科研究的科研团队成员通常各居于不同的地方，若缺乏频繁的信息同步，则成员彼此间很有可能对他人的任务情况和研究进度不了解，这将导致一些重复工作或者某些任务无人认领的情况；另外，文献材料、数据、代码等生产要素和分析结果只能通过通讯软件采用文件传输的形式共享，一旦任何成员进行了修改，则需要再次同步，这将在不同设备中形成多个文件版本，难以管理。

数据科学场景下，如何充分释放各领域研究者的优势和特长，实现理论与技术的相互渗透与融合，是保证跨学科领域的交叉研究顺利推进亟待解决的问题。

解决方案

ModelWhale 以丰富的基础设施建设使科研人员在研究中的参与及合作形式更加多样化。

平台为用户打通了底层架构，零基础的科研人员无需任何软件安装及环境部署，随时随地登录账号即可开始科研分析。针对“学科 x 计算机”或数据驱动的“学科 x 学科”的融合研究，ModelWhale 同时提供了 Notebook 交互式编程、 Canvas 拖拽式编程和 CloudIDE 三种开发模式，契合不同工程能力研究者的分析工作需求。

首先，各学科领域的科研人员在即开即用的云端环境下可快速参与至数据工作中，Canvas 画布式的界面采用低代码的编程方式，研究者只需通过简单的图形连接并设置好参数，即可搭建起最底层的科研思路，相较于传统口述式的信息传达，更为直观高效。
分析流程搭建完成后，数据工作者即可将 Canvas 的模型组件无缝转化为 Notebook 代码，开展后续的精细化分析建模工作。对于比较标准化的数据分析流程，数据人员也可将常用的代码制作成代码片段并分享给团队内部其他成员，方便快速调用。
此外，基于 Canvas 与 Notebook 间互补转换的敏捷开发模式，兼备数据能力和领域知识的高级工程人员可以先用 Notebook 构建一些细分方向的标准化研究流程，而后将其封装为 Canvas Flow 研究模板，则此模板既包含了研究方法本身的传递，也可以直接给到其他研究者进行使用。

上海交通大学临床研究中心在与某些顶尖的三甲医院，如上海第六人民医院、上海儿童医学中心的医生开展临床研究合作时，研究中心的生物统计师即会搭建多个可复用的低代码临床研究分析模板，给到医院不同科室的相关医生使用，方便其直接通过分析模板快速开展课题研究。在此过程中，双方也可以直接在平台上针对研究过程中的重点难点问题进行讨论与协作。

ModelWhale 三种开发模式界面展示

另外，跨学科研究的数据量一般比较大，模型相对复杂，当计算资源或工具跟不上的时候，研究者很难自行管理偏工程的基础设施。以遥感中心为例，机构有着非常丰富的遥感数据，除了提供给内部的研究人员做数据探索分析外，也同时与十余家企事业单位在相关领域开展了遥感数据应用的研究工作。然而，遥感数据分析需要使用大量算力，但由于硬件资源有限，机构需要特地设置专人来负责机器的运维和算力的管理协调工作。

ModelWhale 除了提供从数据到代码版本管理的协作机制外，同时解决了机构与众多合作者开展研究时的算力调度问题。管理者可为组织轻松接入各类算力，并根据需求将算力拆分或组合，进行更为精细化的分发、调配和管理，保证科研人员可根据计算需要弹性调用各类 CPU/GPU 云资源、进行离线运行，从容应对不同复杂度算力需求。

最后，针对研究过程中团队内部的项目管理与资源同步问题，ModelWhale 支持团队将研究课题拆解成多个阶段任务进行宏观管控。研究者可以在各个细分任务中实时查看进展情况，并明确每个人的职责分工。任务完成后，任务结果可以以项目、数据集、文件等多种形式提交，则其他成员即可在线查看或 Fork 项目，并就结果发表意见或进行讨论，不受时间和地域的限制。这有利于科研团队把控整体研究节奏，完善信息同步流，提高研究课题交付的效率。

随着新一轮科技革命和产业变革加速演进，新的学科分支和新增长点不断涌现，学科深度交叉融合势不可挡。除了对科研过程的支持外，ModelWhale 还提供了教学评一体的课程模块，可以帮助高校和科研机构培养更多高层次的创新型、复合型人才，为跨学科领域的交叉研究注入新鲜的源动力。

欢迎进入ModelWhale 官网注册试用，个人专业版与团队版含更多高阶功能，可一体化解决多种科研数据分析建模及团队协作问题，现可免费体验。

扫描官网右侧二维码，联系 MoMo（移动端点此链接）延长试用周期，了解更多详情。

结束语

无论是守护科学研究的权威性，还是以开放共享缔结科学共同体，又或是助推学科融合、探索更复杂的科研系统，随着大规模科学数据的增长，数据驱动的科研协作将成为未来科学发展的必要条件。数字化给每个行业都带来了很大的变化，但科学领域是一定存在其独特性的，在面向未来的科研精神和科研意义之下，数字技术应当为科研工作者的探索持续赋能。

作为数据科学协同平台，ModelWhale 希望能给每一位从事数据驱动的创新研究的开拓者提供支持。ModelWhale 提供了即开即用的云端分析环境，将科研数据管理、建模分析、模型服务、任务及权限管理等功能深度整合，可以使数据驱动的研究更加便捷高效。

过去5年来，清华大学、南开大学、华东师范大学等高等学府，国家气象信息中心、国家人口健康科学数据中心、紫金山实验室等先进科研组织都与 ModelWhale 进行深入合作。未来，ModelWhale 希望与更多高校和机构联手，活用双方所积累的海量数据资源，一同开拓新的研究与应用。ModelWhale 将持续升级产品功能，完善全方位服务体系，欢迎更多组织共同交流沟通。

ModlWhale 同时支持 SaaS 云端使用及本地私有化部署，可满足不同组织需求。

进入 ModelWhale.com，申请免费试用（专业版/团队版）。获赠 CPU 和 GPU 算力！

如果你对 ModelWhale 有任何建议或疑问，欢迎扫描官网右侧二维码，【联系MW】（移动端可点此链接），MoMo 有问必答 ~

更多 ModelWhale 资料见：

ModelWhale 产品介绍
ModelWhale 如何助力组织内部协同
ModelWhale 应用案例

你可能感兴趣的:(人工智能,大数据,数据挖掘,数据分析,jupyter)

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe