E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
文本智能处理
实在RPA:银行数字化,业务流程自动化“一小步”,贷款审核效率“一大步”
如今,自动化、智能化工具大范围应用于需求触达、风险管理、资金定价等业务服务和决策管理中,RPA、自然语言处理、机器学习、计算机视觉、知识图谱等
文本智能处理
技术正在成为银行数字化转型的重要方式,不断拓展银行现有能力边界
IT观察
·
2023-11-09 16:14
其他
达观杯”
文本智能处理
挑战赛
回顾任务1-----对数据进行初步的预处理:https://blog.csdn.net/weixin_38966454/article/details/89046445任务2----F-IDF算法实现https://blog.csdn.net/weixin_38966454/article/details/89058683Now任务3—word2vec算法实现1.什么是word2vecWord2v
jassy_shan
·
2023-01-23 18:54
数据挖掘与算法竞赛
达观杯-
文本智能处理
挑战赛-初识数据
赛题目标:建立模型通过长文本数据正文,预测文本对应的类别数据准备:train_set.csv用于模型训练test_set.csv用于模型预测读取前5000条数据:importpandasaspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitmy_data=pd.read_csv('../datasets/train_
zhengdadalalala
·
2022-12-30 11:22
达观杯-智能文本处理
“达观杯”
文本智能处理
挑战赛--数据初识
一.获取数据7z压缩文件解压后得到两个文件:train_set.csv和test_set.csvtrain_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列:第一列是文章的索引(id),第二列是文章正文在“字”级别上的表示,即正文是由一个个字符组成(article);第三列是在“词”级别上的表示,即正文由词和字组成(word_seg)
July@AI
·
2022-12-30 10:12
数据竞赛-“达观杯”
文本智能处理
-Day1
数据竞赛-“达观杯”
文本智能处理
-Day11.竞赛简介a)任务b)数据c)评分标准2.读取数据,观察数据3.训练集数据划分4.对数据以及赛题的理解和发现1.竞赛简介大赛链接点击此处a)任务建立模型通过长文本数据正文
Mr._Hou
·
2022-12-30 10:41
数据分析
文本处理
数据分析
nlp
文本智能处理
与RPA领军企业达观数据宣布完成5.8亿元C轮融资
中国人工智能和RPA知名企业达观数据宣布近期已成功完成了C轮5.8亿元融资,并刷新了中国
文本智能处理
行业的单笔最高融资记录。
AI界小学生
·
2022-12-23 08:52
OCR
人工智能
RPA
人工智能
自然语言处理
知识图谱
RPA
NLP自然语言处理——文本分类之数据集汇总
文本分类数据集汇总名词解释一、“达观杯”
文本智能处理
挑战赛数据集二、东方财富网上市公司公告数据集2.1获取手段:python网络爬虫。具体方法和代码见我的另一篇博客。
Little_Yuu
·
2022-10-21 07:57
NLP学习笔记
python
分类算法
“达观杯”
文本智能处理
挑战赛
比赛链接数据介绍:数据*注:报名参赛或加入队伍后,可获取数据下载权限。数据包含2个csv文件:train_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列:第一列是文章的索引(id),第二列是文章正文在“字”级别上的表示,即字符相隔正文(article);第三列是在“词”级别上的表示,即词语相隔正文(word_seg);第四列是这篇文
敬标
·
2021-06-15 17:13
第三届“达观杯”文本智能信息抽取挑战赛丰厚奖金,群英集结,等你来战!...
“达观杯”大赛由国内
文本智能处理
科技公司达观数据主办,面向全球范围的学生、学者和企业研发人员,旨在通过提供业务场景、真实数据、专家指导,借助社会和学界的技术力量,进一步提升中文自然语言处理技术的研究水平
AI科技大本营
·
2020-08-22 12:30
达观杯
文本智能处理
挑战赛冠军解决方案
之前整理了一份自己的Rank4的解决方案,并开源了部分代码,这次分享一下朋友整理的"达观杯"
文本智能处理
挑战赛冠军的解决方案,希望对新手小白有所帮助~~作者:NLP幼儿园知乎:https://www.zhihu.com
Congqing He
·
2020-07-27 23:19
数据竞赛-“达观杯”
文本智能处理
-Day2:TF-IDF实践
数据竞赛-“达观杯”
文本智能处理
-Day2:TF-IDF实践1.原理2.tf-idf的理论依据及不足3.实践tf-idf(英语:termfrequency–inversedocumentfrequency
Mr._Hou
·
2020-07-07 09:48
数据分析
TF-IDF
数据分析
nlp
达观杯
文本智能处理
(五)——LightGBM理论与实践
达观杯
文本智能处理
(五)——LightGBM理论与实践一、LightGBM模型1.GBDT存在的几个问题2.引入LightGBM二、优势三、lightGBM调参四、lightGBM模型实践参考文献一、LightGBM
Lemon_yq
·
2020-07-06 22:06
达观数据王文广:如何玩转自然语言理解和深度学习实践?
本文根据达观数据王文广在“达观杯”
文本智能处理
挑战赛期间的技术直播分享整理而成,内容略有删减。
达观数据
·
2020-07-01 08:53
文本智能处理
当知识图谱遇上
文本智能处理
,会擦出怎样的火花?
文本根据达观数据副总裁王文广演讲内容《知识图谱与
文本智能处理
》整理所得,内容略有删减。人们一些模糊词义的表达,比如:以前没有钱买华为,现在没有钱买华
达观数据
·
2020-07-01 08:53
文本智能处理
知识图谱
自然语言处理
达观数据桂洪冠:一文详解达观数据知识图谱技术与应用
本文根据达观数据桂洪冠在“达观杯”
文本智能处理
挑战赛期间的技术直播分享整理而成,内容略有删减。
达观数据
·
2020-07-01 08:53
文本智能处理
nlp
知识图谱
技术分享
这是一名既能打比赛,又会发论文JD AI实验室的算法工程师,CSDN博客专家
参加过一些比赛,包括2018年“达观杯”
文本智能处理
挑战赛季军、2018年全国知识图谱与语义计算大会面向音乐领域的命令理解任务季军、CAIL2019中国司法人工智能挑战
小詹学 Python
·
2020-06-29 00:53
达观杯”
文本智能处理
挑战赛——数据预处理
一、数据竞赛简介“达观杯”
文本智能处理
挑战赛1、任务建立模型通过长文本数据正文(article),预测文本对应的类别(class)达观杯比赛链接:http://www.dcjingsai.com/common
小葡萄co
·
2020-06-28 22:55
“达观杯”
文本智能处理
挑战赛
竞赛背景:2018年人工智能的发展在运算智能和感知智能已经取得了很大的突破和优于人类的表现。而在以理解人类语言为入口的认知智能上,目前达观数据自然语言处理技术已经可以实现文档自动解析、关键信息提取、文本分类审核、文本智能纠错等一定基础性的文字处理工作,并在各行各业得到充分应用。自然语言处理一直是人工智能领域的重要话题,而人类语言的复杂性也给NLP布下了重重困难等待解决。长文本的智能解析就是颇具挑战
今天拿到offer了吗?
·
2020-06-25 02:02
竞赛
这是一名JD AI实验室的算法工程师,CSDN博客专家
参加过一些比赛,包括2018年“达观杯”
文本智能处理
挑战赛季军、2018年全国知识图谱与语义计算大会面向音乐领域的命令理解任务季军、CAIL2019中国司法人工智能挑
Wang_AI
·
2020-06-22 08:48
达观杯 LogisticRegression 简单实现分析
1比赛地址“达观杯”
文本智能处理
挑战赛2数据数据包含2个csv文件:train_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。
Spareribs
·
2020-06-21 18:47
[转载]深度学习技术在文本数据智能处理中的实践
在前不久InfoQ主办的Qcon全球软件开发大会上,达观数据创始人陈运文博士受邀出席发表了《
文本智能处理
的深度学习技术》的演讲。
流川枫AI
·
2019-12-16 02:16
文本分类(上)- 基于传统机器学习方法进行文本分类
简介自己由于最近参加了一个比赛“达观杯”
文本智能处理
挑战赛,上一周主要在做这一个比赛,看了一写论文和资料,github上搜刮下。。感觉一下子接触的知识很多,自己乘热打铁整理下吧。
致Great
·
2019-12-15 10:54
当知识图谱遇上
文本智能处理
,会擦出怎样的火花?
文本根据达观数据副总裁王文广演讲内容《知识图谱与
文本智能处理
》整理所得,内容略有删减。当知识图谱遇上
文本智能处理
,会擦出怎样的火花?人们一些模糊词义
达微
·
2019-11-30 21:09
推荐一位大佬,来自京东AI实验室
参加过一些比赛,包括2018年“达观杯”
文本智能处理
挑战赛季军、2018年全国知识图谱与语义计算大会面向音乐领域的命令理解任务季军、CAIL2019中国司法人工智能挑战
Python数据之道
·
2019-10-20 20:00
“达观杯”进行时 | 万字长文详解“智能文本抽取”算法进阶与应用
达观数据是一家专注于做
文本智能处理
的科技公司,目前完成了B轮,融资超过2亿元,投资机构包括宽带、软银、真格等等。
达观数据
·
2019-08-20 00:00
自然语言处理
“达观杯”进行时 | 万字长文详解“智能文本抽取”算法进阶与应用
达观数据是一家专注于做
文本智能处理
的科技公司,目前完成了B轮,融资超过2亿元,投资机构包括宽带、软银、真格等等。
达观数据
·
2019-07-29 18:52
文本智能处理
“达观杯”进行时 | 万字长文详解“智能文本抽取”算法进阶与应用
达观数据是一家专注于做
文本智能处理
的科技公司,目前完成了B轮,融资超过2亿元,投资机构包括宽带、软银、真格等等。
达观数据
·
2019-07-29 18:52
文本智能处理
【NLP数据竞赛】“达观杯”
文本智能处理
挑战赛(六)模型调优
一、网格搜索网格搜索(GridSearch)用简答的话来说就是手动的给出一个模型中你想要改动的所用的参数,程序自动的帮你使用穷举法来将所用的参数都运行一遍。决策树中我们常常将最大树深作为需要调节的参数;K次验证:二、模型调优与参数融合选择均匀融合,调参结果为:模型最优参数F1评分LRC=10,max_iter=200.713SVMC=1,max_iter=200.722LightGBMlearni
AngelaOrange
·
2019-04-16 08:31
NLP自然语言处理
达观杯
文本智能处理
(6)
模型调优及模型融合1)进一步通过网格搜索法对3个模型进行调优(用5000条数据,调参时采用五折交叉验证的方式),并进行模型评估,展示代码的运行结果。(可以尝试使用其他模型)2)模型融合,模型融合方式任意,并结合之前的任务给出你的最优结果。例如Stacking融合,用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分结果。在模型调参的过程中,需要使用到网格搜索(
dzysunshine
·
2019-04-15 16:04
达观杯文本智能处理
达观杯
文本智能处理
(3)
Word2vec词向量原理与实践斯坦福NLP视频1.什么是word2vecword2vec工具主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuousbagofwords,简称CBOW),以及两种高效训练的方法:负采样(negativesampling)和层序softmax(hierarchicalsoftmax)。值得一提的是,word2vec词向量可以较好地表达不同
dzysunshine
·
2019-04-09 21:18
达观杯文本智能处理
2018
文本智能处理
挑战赛-第二天
TF-IDF原理及使用1.TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文本频率).一个词语在一篇文章中出现次数越多,同时在所有文档中出现次数越少,越能够代表该文章.TF(x)TF反映了一个词在当前文章中出现的频率,如果一个词在当前的文本中多次出现,那么它的TF值应该比较高,这个词出现的频率越高,越接近1.TF(词频)=该文章出现此词的次数/文
I_LOVER
·
2019-04-07 23:01
2018达观杯
文本智能处理
竞赛复盘打榜(二)TF-IDF实践
英语,分类资源wordnet.fromnltk.corpusimportwordnetaswnpanda=wn.synset('panda.n.01')hyper=lambdas:s.hypernyms()list(panda.closure(hyper))上面展示的是用nltk包抓取WordNet的操作。几乎所有的NLP都使用了原子符号来表示单词。如何从离散值去建立相似性关系是一个文通。分布相似
蝉鸣时节
·
2019-04-07 21:59
达观杯
文本智能处理
(2)
TF-IDF理论与代码实践1.什么是TF-IDF?TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相关程度的度量或评级。TF-IDF有两层意思,一层是"词频"(TermFrequency,缩写
dzysunshine
·
2019-04-07 14:55
达观杯文本智能处理
2018达观杯
文本智能处理
竞赛复盘打榜(一)
【任务1-数据初识】时长:1天首先我们下载数据导入pandas包importpandasaspdfromsklearn.model_selectionimporttrain_test_split设置路径,导入数据root_path='D:/CS/datawhale/new_data'train=pd.read_csv('%s/%s'%(root_path,'train_set.csv'))trai
蝉鸣时节
·
2019-04-05 21:02
datawhale
datawhale
机器学习第一课 达观杯
网站达观杯
文本智能处理
挑战赛代码"""CreatedonThuSep2000:08:082018@author:Taylen"""print("Start.................")"""
Jerry_589e
·
2019-03-21 11:18
“达观杯”
文本智能处理
挑战赛练习
记录一下项目练习过程task1比赛提供的数据数据包含2个csv文件:train_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列:第一列是文章的索引(id),第二列是文章正文在“字”级别上的表示,即字符相隔正文(article);第三列是在“词”级别上的表示,即词语相隔正文(word_seg);第四列是这篇文章的标注(class)。注
zfnice
·
2019-03-01 19:50
2018“达观杯”
文本智能处理
挑战赛心得
达观杯是一个NLP文本处理比赛,由达观数据公司主办,具体信息参考此比赛网址。为了熟悉一下算法比赛的流程,报名并参加了这个比赛,此比赛已经结束了,但是仍然可以报名参加获取分数和排名,这个kaggle的比赛一样,我觉得对于新人练手来说还是很方便的。废话不多说,以下详述比赛流程。环境配置win10python3.6pycharmjupyternotebookscikit-learn0.19.1time数
保护我方鲁班八号
·
2019-02-19 16:16
机器学习
自然语言处理
算法刷题/竞赛
当知识图谱遇上
文本智能处理
,会擦出怎样的火花?
文本根据达观数据副总裁王文广演讲内容《知识图谱与
文本智能处理
》整理所得,内容略有删减。人们一些模糊词义的表达,比如:以前没有钱买华为,现在没有钱买华
达观数据
·
2018-11-28 00:00
知识图谱
达观数据王文广:如何玩转自然语言理解和深度学习实践?
本文根据达观数据王文广在“达观杯”
文本智能处理
挑战赛期间的技术直播分享整理而成,内容略有删减。
达观数据
·
2018-10-31 00:00
深度学习
达观数据荣获中国人工智能最高奖项吴文俊科学技术奖
其中,百度高级副总裁王海峰荣获吴文俊人工智能杰出贡献奖,专注于
文本智能处理
的达观数据等11家企业,入选吴文俊人工智能科技进步奖企业技术创新工程项目。
美通社
·
2018-10-16 09:00
“达人”计划丨达观数据2019届校园招聘正式启动
一Whoweare用理解分析情景用热诚驱动革新用AI开拓未来为有志于在人工智能NLP领域发展的同学提供一条有趣、钱多、目标明确的赛道为客户提供
文本智能处理
解决方案以一流文本挖掘技术赋能企业转型在AI趋势中一起破浪前行
达观数据
·
2018-10-15 10:51
一文详解达观数据知识图谱技术与应用——技术直播回顾
讲师|桂洪冠来源|AI科技大本营在线公开课本文根据达观数据桂洪冠在“达观杯”
文本智能处理
挑战赛期间的技术直播分享整理而成,内容略有删减。
大数据专家
·
2018-09-26 15:25
nlp
知识图谱
技术分享
达观数据桂洪冠:一文详解达观数据知识图谱技术与应用
本文根据达观数据桂洪冠在“达观杯”
文本智能处理
挑战赛期间的技术直播分享整理而成,内容略有删减。
达观数据
·
2018-09-26 10:15
nlp
知识图谱
技术分享
文本智能处理
达观数据桂洪冠:一文详解知识图谱关键技术与应用
本文根据达观数据桂洪冠在“达观杯”
文本智能处理
挑战赛期间的技术直播分享整理而成,内容略有删减。
达观数据
·
2018-09-26 00:00
技术分享
深度学习
nlp
sklearn文本特征提取与“达观杯”
文本智能处理
挑战赛
参加的第一个线上比赛,经历了下比赛过程,记录下。这个比赛比较简单,主要是要调参费时间,只提交了两次结果,下次比赛认真对待。核心思路:文本矢量化后进行逻辑回归训练。print("start....")##导入需要的库importpandasaspdfromsklearn.linear_modelimportLogisticRegressionfromsklearn.feature_extractio
周雄伟
·
2018-09-08 14:02
机器学习
自然语言处理
深度学习、机器学习与NLP的前世今生
以下内容是根据达观数据联合创始人高翔在《深度学习与
文本智能处理
》直播的总结。一、为什么做文本挖掘什么是NLP?简单来说:NLP的目的是让机器能够理解人类
大数据专家
·
2018-09-03 16:12
nlp
深度学习
机器学习
深度学习、机器学习与NLP的前世今生
以下内容是根据达观数据联合创始人高翔在《深度学习与
文本智能处理
》直播的总结。一、为什么做文本挖掘什么是NLP?简单来说:NLP的目的是让机器能够理解人类
达观数据
·
2018-09-03 00:00
nlp
深度学习、机器学习与NLP的前世今生
以下内容是根据达观数据联合创始人高翔在《深度学习与
文本智能处理
》直播的总结。一、为什么做文本挖掘什么是NLP?简单来说:NLP的目的是让机器能够理解人类
达观数据
·
2018-08-31 15:13
“达观杯”NLP这趟车,有数据,给奖金,还赠书,你上不上?
本届“达观杯”以
文本智能处理
为主题。上线一个月以来,参赛人数破图2100+人,参赛队伍近1800支。本届“达观杯
Hadoop技术博文
·
2018-08-07 11:00
乘积点应该乘那几科
嵌入式系统及其应用 2.5
文本智能处理
技术
weidiao
·
2016-01-05 22:00
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他