深挖全媒体多模态数据价值,蜜度亮相2022世界人工智能大会

蜜度深度挖掘全媒体多模态数据核心价值,提供重要垂直领域解决方案。

编辑 | 宋慧

出品 | CSDN云计算

2022 年 9 月1至3日,由国家七部委和上海市人民政府共同主办的2022世界人工智能大会(WAIC )隆重举行,大会围绕“人类、科技、产业、城市、未来”五大元素,以元宇宙为切入点,深度演绎了“智联世界,元生无界”的会议主题,现场汇集了AI领域的诸多先锋科研进展,包括阿里、华为、腾讯、京东云、商汤科技在内的科技企业携大批新锐应用集中亮相,通过群智赋能、虚实融合、共创分享,展望AI技术的突破为数字经济的创新发展与应用带来的指数级增速。

AI芯片、模型算法与元宇宙背后,全媒体多模态数据成为底层支撑

除了讨论最前沿的底层核心AI芯片与AI模型算法的技术,WAIC上最吸引大众眼球的,也是技术界此前热点讨论过的元宇宙系列软硬件应用。不过,在元宇宙等AI未来世界框架里,来自全媒体的多模态数据既是数字虚拟世界发展的重要支撑,也是AI算法训练的必备供给,通过海量数据的注智赋能,虚实同步的未来世界才能够实现, AI模型的重量级突破也才可能出现,因此敏捷而精准的数据智能与内容认知不仅是数智融合实践的重要航标,也是AI发展征途中的坚韧基石。

作为数据智能领域的创新企业,蜜度基于自主研发的5大能力引擎,构建了 “跨模态信息检索”与“智能校对”两大核心应用,为不同细分场景定制化开发了一系列的数据智能产品。在展会现场,蜜度展示了跨模态检索(CMR)、自然语言处理(NLP)、计算机视觉(CV)、光学字符识别(OCR)、自动语音识别(ASR)、知识图谱、区块链等前沿技术的创新应用,通过虚拟IP蜜小度、蜜小智和蜜小校带来三大互动场景,让观众身临其境地体验了AI作画的精准与贴切、跨模态检索的敏捷与贯通,以及智能文本校对的缜密周致。

蜜度重点突破跨模态信息检索,让AI切实落地

数据智能领域创新企业蜜度在WAIC大会设置了主场展台,将上述核心技术积累和创新应用,在大会现场生动地展示出来。

蜜小度:AI绘画艺术家

在现场的互动中,观众只要说出随机的主题描述短语,蜜小度就可以通过MiduNLP(自然语言处理引擎)理解主题文本,再经由MiduCMR(跨模态检索引擎)对短语进行检索与深度学习,最后由MiduCV(计算机视觉引擎)生成符合语义的图像作品。

深挖全媒体多模态数据价值,蜜度亮相2022世界人工智能大会_第1张图片

这一基于AI的创作过程展示了自然语言处理与跨模态检索在实际场景中的融合与应用:先进的自然语言处理引擎,一定程度上消融了AI对庞杂人类自然语言的理解壁垒;而跨模态检索引擎则通过海量数据的映射而得出有效关联,完成从文本描述到图像输出的演进,最终呈现AIGC(AI Generated Content,人工智能自主生成内容)的初代阐发。

在和AI共同完成创作之后,观众还可以体验蜜度旗下产品对知识产权的一站式保护,通过“蜜度版权通”,利用区块链技术对原创作品存证确权后,用户与蜜小度合作的联名作品将升级为“数字藏品”,未来,“蜜度版权通”将随时基于人工智能与大数据,快速精准地全天候捕捉互联网平台全媒体信息中的疑似侵权线索,时刻为作品的版权保护提供专业支持。

蜜小智:跨模态检索达人

蜜小智则集中展现了蜜度在文字、图片、音视频的跨模态检索应用能力,“文字、图片、音视频互联互搜” 与“AI看图说话”两大互动,均基于蜜度自主研发的跨模态检索引擎MiduCMR所实现。现场观众可以通过与虚拟IP蜜小智的对话,在大屏上感受以文本搜音视频、以图片搜文本、以图片搜图片等多元的新次代酣畅搜索体验;也可以上传任意图片让蜜小智在识别图片特征后进行跨模态语义理解,继而对图片中出现的主体、场景等元素进行画面描述。

深挖全媒体多模态数据价值,蜜度亮相2022世界人工智能大会_第2张图片

随着信息模态中视觉影音内容比例的持续上升,基于单模态的数据检索与内容分析已经无法实现对多元世界的深度认知,跨模态下的信息互通互融已经成为数据智能领域的未来共识。蜜度运用跨模态对比学习、多模态语义融合等多项前沿技术,已经实现了文本、图片、音频、视频信息的高效率检索、高质量分析与高水平应用。

蜜小校:智能文本校对语音助手

蜜小校在现场呈现的是蜜度旗下“蜜度校对通”产品的主要功能——智能文本校对。无论是语料库中的随机文本段落,还是观众在现场即兴讲出的语音内容,蜜小校都可以对其进行快速校对,自动播报错误并提供修改建议。校对内容覆盖了文字标点差错、知识性差错、内容导向风险三大审核与校对类型,并拥有25类全栈审核与校对能力,能够对错别字、词,多字、少字错误,语义重复,语序错误,句式杂糅,量与单位差错;专有名词及术语,法律法规名称,常识差错,时政重点词,媒体报道禁用词和慎用词;以及涉及违法违规等内容进行智能审核与校对。

深挖全媒体多模态数据价值,蜜度亮相2022世界人工智能大会_第3张图片

这一由蜜度自主研发的智能文本校对系统,围绕中文语言特点和使用习惯,以百亿级训练语料为基础,结合行业先进的自然语言处理、知识图谱与图像识别等技术,实现中文文本错误和语义关系的自动发现与纠正处理,快速完成文稿的校对与修改,有效解决内容的规范性、安全性、合法性问题。

而软硬件本地化智能校对解决方案——校对通AI-Box也将在9月3日正式发布,作为首个通过华为昇腾AI生态认证的自然语言处理(NLP)智能文本校对应用解决方案,校对通AI-Box既可以在本地化的部署下,充分保障数据私密性;也能够作为专属的边缘计算,大幅度提升用户工作效率;同时也在融入华为昇腾 AI 生态体系的过程中,与主流国产系统共同营造高质量的数字办公体验。

蜜度更宏大的目标:公共安全、社会治理等等,为数字经济发展增速

在真实场景中,数据智能的应用远不止上述几项。例如在智慧城市领域,对海量数据的智能认知不仅可以助力数字孪生的营建,也能够赋能智慧城市管理,提供对突发事件、舆论态势、热点事件的感知、为公共决策提供支持,并将民众对城市治理意见与态度进行可视化、指标化的展示,为城市治理效能的提升提供助力。

数据智能所带来的降本增效,不仅仅体现在实际应用场景中, AI技术本身也极大地受惠于数据的喂养。在包括算法和算力在内的AI的三大基石中,数据是至关重要的元素,唯有高质量的数据才可以训练AI不断进化与迭代,这也意味着唯有丰沛的数据以及对数据的充分应用,才能够推进行业的数字化转型。

蜜度基于数据智能引擎开发的不同垂直领域解决方案,正在通过深度挖掘全媒体多模态数据中的核心价值与关键洞察,为数字经济注入澎湃能量,实现发展进程的全面提速。

你可能感兴趣的:(机器学习,人工智能,AI,人工智能,WAIC,蜜度,舆情,多模态)