近日,星环科技在线上举办了2022年春季新品发布周,带来数字底座、数字化转型、国产替代、数据安全与流通四大专题,60余场演讲。来自金融、能源、交通、政务、高校、运营商等多个领域的客户、合作伙伴现身说法,分享数字化转型成功经验。华东师范大学信息管理系教授许鑫结合其团队在人才与产业数据云项目的探索和经验,带来了《人才与产业数据云:来自高校科研领域的创新实践》主题演讲。
建立科学人才评价体系
促进产业链、创新链与人才链的深度融合
重视人才,发展人才是当前重要的国家战略,国家领导人多次在重要场合发表讲话强调,要深化实施人才强国战略,发挥好人才对经济社会发展、国家综合国力提升的重要能效。同时,人才也是产业创新发展的重要资源要素,习近平总书记在2020年深圳经济特区建立四十周年庆祝大会上发表重要讲话,他说:“发展是第一要务,人才是第一资源,创新是第一动力。”以人才为引领可以创新产业发展形式,形成人才强磁场,放大人才对促进产业发展的能效。同时,产业的有序良性发展又可以培育和集聚人才,进而使产业成为专业人才的重要孵化地,人才与产业密不可分,两者深度融合,螺旋上升。
由于当前的学术评价体系还不够科学,管理体制和运行机制还不够完善,处于有数量缺质量、有专家缺大师的状况,因此急需建立科学权威、公正透明的科研成果评价体系,建立以创新价值、能力贡献为导向的人才评价体系,形成并实施有利于科技人才潜心研究和创新的评价体系。具体到个体层次,人才个体的发展是实现其社会价值的前提。个体的自我实现与社会价值辩证统一,互为前提基础,密不可分。
人才与产业数据云项目的研究思路及框架
2020年华东师范大学启动了人才与产业数据云项目,该项目受华东师范大学“幸福之花”先导研究基金“智能+”领域项目——“大数据视阈下基于学术共同体的人文社科学术评价与促进研究”的资助。该研究项目从多元数据融合视角评价学者个人及评估学术成果价值,构建了基于多元数据的评价指标体系和评价框架,采用定性和定量方法融合,为学术评价的理论创新和应用实践提供实证支持。相关研究成果《A big-data-based analysis framework and its application in talents and industry research》在《Science》专刊发表。
人才与产业数据云项目是上述研究的落地,同时也是研究团队探索新时代全面综合人才评价方法和框架的重要场景。人才的洞察、产业发展和经济社会发展三者是相辅相成的,人才是产业发展的重要资源和驱动力,产业是人才培养的重要孵化地,优质的人才群体和良性的产业又对经济社会发展提供好的支撑,经济社会发展反之则为人才成长和产业发展提供好的大环境。
目前的研究以多元数据为基石,探索人才链、创新链和产业链的三链高度协同融合,洞察人才现状,聚焦关键核心技术领域,进而促进产业的高质量发展。具体而言,以科创人才大数据、科研成果大数据、重点产业大数据为基础,主要开展如下方面的研究:人才评价和人才战略;产业结构、产业发展和产业战略;人才和产业数据碰撞下通过领域主题的关联进行人才链、创新链和产业链的协同发展。
为了支持相关研究的开展和推进,项目团队采集汇聚了27个学科领域、3300万学者、6540万篇论文、600万组织机构等的大数据资源,以此为依托进行数据的清洗和集成,支撑人才评价指标体系的构建,进行人才精准画像和人才群体综合评价的计算,进而支撑创新人才评价新方法和新框架的探索。
该项目有四个核心理念:
(1)在数据上实现数据的隔离与安全,底层有大数据的存储、管理和计算;
(2)在评价方面开发特色评价指数,形成一套分类分级的人才评价体系;
(3)将人才评价及产业分析的算法、模型容器化,形成算法模型市场,尝试打造一种新的生态;
(4)生态是动态的、活的,因此项目还面向多种类型的租户提供不同层次的应用服务,引入多类型、多层次市场主体参与到项目中来,共同去探索和实践人才评价和产业创新方面的新方法、新框架,从而促进新生态的形成和运转。
在数据隔离方面,主要通过存储隔离和计算隔离两种方式来达成数据隔离的目标,对于租户而言,支持创建多种数据区,例如共享区、租户区和敏感区,提供每个租户独立使用存储资源,保证存储的隔离性。租户区存储用户上传的组织内数据,敏感区存储具有高价值的数据和敏感数据。同时,平台支持每个租户使用独立的HDFS服务,不直接与其他租户共享HDFS服务。此外,通过数据沙箱、联邦学习等技术实现隐私计算,进一步保障数据应用的安全。
研究过程中,研究团队全面分析和提炼国内外关于评价理论和实践的有益部分,探索并构建了一套系统性、通用性的科研评价体系,实现对评价要素和评价维度的全方位挖掘和整合。该项目研究将人才评价、科研评价视作复杂系统,认为评价工作应该逐步细化,层层剖析人才的知识、技能、经验、能力、意愿等全方位多维度信息,构建一套全评价、服务于现实需要的新型科研评价方法及框架,即数字驱动的全评价方法论。基于大数据和人工智能等数据智能技术,通过激发活力和鼓励协作作为人才评价的导向,全方位的去挖掘各种与评价有关的科学计量指标,创建基于大数据的人才全面综合评价体系。
该项目研究中的特色评价指标体系,实现了“质+量”,“过去+当前+未来”相结合的针对于人才个体的精准画像和全面综合评价。从2018年7月起,国家先后出台了若干关于“破四唯”、“破五唯”的文件,这些文件的发布都在强调人才评价没有唯一的标准,在具体开展人才评价工作时,需要根据工作具体要求构建恰当的人才评价方法。
人才与产业数据云项目希望传递的就是这样一个理念,人才评价没有唯一的标准,要构建面向需求的人才评价动态调整机制。为了达成这个目标,该项目借助星环科技的PaaS平台,支持在线编写算法模型,并应用于人才数据分析,自动导出产业人才分析报告,同时还支持用户将自己的算法模型共享,形成算法模型市场,创新人才评价生态环境。用户可以从零开始自定义人才分析算法和模型,也可以直接使用市场上共享的算法和模型,还可以在共享的算法模型基础上进一步进行自定义。基于此流程构建面向需求的人才评价标准动态调整机制,创新人才评价生态。
星环科技的PaaS平台为项目的算法模型容器化提供了基础支撑,通过将平台的能力以服务的形式提供给租户们,比如数据库、中间件、文件存储等,减少了项目的开发和维护工作量,以更快的速度和更低的成本来开发、测试、部署、更新和扩展上层应用。当前的用户主要是机构和产业两类租户,通过为租户提供可支撑大数据资源存储和管理的经数据隔离,实现数据安全和隐私保护的数据空间,同时也向租户共享计算资源,支撑租户基于大数据资源进行计算分析。此外,最重要的一点,通过容器化构建算法模型市场,可以向租户共享人才评价的理念和方法,作为技术保障,实现了应用、数据、资源和运行的隔离。
项目的整体架构,从底层的数据采集到数据仓库、数据分析引擎,再到面向不同需求和主体的服务门户,通过分批建设实现项目的核心理念并落到实处,服务现实人才评价和产业创新的发展需要。
人才与产业数据云平台应用架构从下到上分为三层:底层为各租户数据仓库,租户间数据隔离;中间层为指标分析挖掘的PaaS支撑平台,为租户进行指标和数据分析挖掘提供分析引擎支撑;前端以应用门户的方式为各租户和人才与产业云运营管理提供服务。
星环科技数据云平台TDC,基于云原生技术融合数据的PaaS、分析的PaaS、应用的PaaS,实现多租户的人才与产业数据计算分析,为保障数据隔离,为每个产业租户、机构租户构建私有的数据仓库,每个租户使用独立的TDFS用于数据存储。平台构建了一个用于做数据分享的租户空间,通过细粒度的权限控制和审批流程完成数据共享和隔离。TCOS是星环科技为大数据应用量身定做的容器操作系统,PDC平台整体基于容器化、分布式、微服务等云原生技术,在统一的云平台上提供全面的云上数据服务,平台围绕着项目、租户、用户等概念实现了权限和资源的合理划分与管理,由统一管理平台对多租户提供服务。