aws 未完成sagemaker ner

命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译、知识图谱等应用领域的重要基础工具。

英语中的命名实体具有比较明显的形式标志(即实体中的每个词的第一个字母要大写),所以实体边界识别相对容易,任务的重点是确定实体的类别。和英语相比,中文命名实体识别任务更加复杂,而且相对于实体类别标注子任务,实体边界的识别更加困难。
aws 未完成sagemaker ner_第1张图片

https://aws.amazon.com/cn/blogs/china/use-amazon-sagemaker-to-run-chinese-named-entity-recognition-based-on-tensorflow/?nc1=b_rp

https://www.bilibili.com/video/BV1f5411s7Yz?from=search&seid=16029321477206824532
aws 未完成sagemaker ner_第2张图片

可以直接用他的notebook

右上角创建实例

环境和notebook 一样 存储空间什么的配置自己选

1.2 下载代码和数据

笔记本启动后,打开页面上的终端,执行以下命令下载代码:

cd ~/SageMaker
git clone https://github.com/whn09/albert-chinese-ner.git

这个是放大的,不知道怎么点开terminal的

aws 未完成sagemaker ner_第3张图片
默认会保存在根目录下 但是你关掉notebook会消失掉
只有你放在sagemaker下才好

配置,训练好的参数,词典等等
aws 未完成sagemaker ner_第4张图片

果然是老了,就这你都能给忘了。。。

aws 未完成sagemaker ner_第5张图片
进入到这个环境了

aws 未完成sagemaker ner_第6张图片

你可以去github看它怎么运行起来,这个稍微改动了

aws 未完成sagemaker ner_第7张图片

aws 未完成sagemaker ner_第8张图片

aws 未完成sagemaker ner_第9张图片
没写完 nabidia-smi

albert只是对bert做了一个改进

比如他做了一个简历的标注,就对ner进行改造 就是要标注成什么

aws 未完成sagemaker ner_第10张图片

需要分布式 或者批量训练 就ok

aws 未完成sagemaker ner_第11张图片

aws 未完成sagemaker ner_第12张图片

多机并行有config
放验证数据集和测试数据集

model是放你训练的目录

output 是输出

aws有 DeepLearning container 你可以下载相应的包 会比 海外的官网快

代码数据放到一个地方 你也可以设置到底上传什么

设置 sagemaker运行什么代码

名字就是train的脚本在这里插入图片描述

没看完有时间再说吧

你可能感兴趣的:(机器学习,金融大数据,nlp)