每周编辑精选|希尔贝壳语音数据集系列上线、中国学者建立乳腺癌预后评分系统 MIRS

新春佳节,归程千里为团圆
人间烟火,年味浓浓阖家欢

辞别玉兔,金龙迎春。明晚就是大年三十除夕夜了!HyperAI超神经在这里提前祝大家新春快乐~龙行龘龘(dá)!本周 hyper.ai 官网上线了希尔贝壳开源的数千小时中文语音数据库,打开你的语音之门。

2 月 5 日-2 月 8 日,hyper.ai 官网更新速览

  • 优质公共数据集:8 个
  • AI4S 论文案例:2 篇
  • 热门百科词条:8 条

访问官网:hyper.ai

公开数据集精选

1.AISHELL-1 开源中文语音数据库

该数据集由 400 名来自中国不同口音地区的人参与录制。经过专业语音校对人员转写标注,并通过严格质量检验,此数据库文本正确率在 95% 以上。分为训练集、开发集、测试集。

直接使用

https://hyper.ai/datasets/29344

2. AISHELL-2 中文语音数据库

希尔贝壳中文普通话语音数据库 AISHELL-2 包含 1,000 小时的语音时长。录音文本涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等 12 个领域。

直接使用

https://hyper.ai/datasets/29347

3. AISHELL-3 高保真中文语音数据库

该数据集由 218 名来自中国不同口音区域的人员参与录制。由专业语音校对人员进行拼音和韵律标注,并通过严格质量检验,此数据库音字准确率在 98% 以上。

直接使用

https://hyper.ai/datasets/29352

4. AISHELL-4 多通道中文会议语音数据库

AISHELL-4 是由 211 个录制的会议会议组成,每个会议会议包含 4 至 8 名发言者,总时长为 120 小时,可用于语音前端处理、语音识别等单独任务。

直接使用

https://hyper.ai/datasets/29375

5. AISHELL-WakeUp-1 中英文唤醒词语音数据库

该数据集邀请了 254 名发言人参与录制,共有唤醒词语音近 400 万条,1561.12 小时。录音文本为「你好,米雅」、「hi, mia」唤醒词。此数据库经过专业语音校对人员转写标注,并通过严格质量检验,可用于声纹识别、语音唤醒识别等研究使用。

直接使用

https://hyper.ai/datasets/29186

6. AISHELL-DMASH 中文普通话麦克风阵列家居场景语音数据库

AISHELL-DMASH 数据集是在两个不同房间的真实智能家居场景中记录的,该数据集包含 30,000 小时的语音数据。数据集由专业语音标注人员转录,单词准确率达 98%,可用于声纹识别、语音识别、唤醒词识别等研究。

直接使用

https://hyper.ai/datasets/29380

7.DeepSymNet 深度符号网数据集

这是中国科学院半导体研究所的研究人员提出的一种名为 DeepSymNet 的全新符号网络来表示符号表达式,用于符号回归的符号网络。

直接使用

https://hyper.ai/datasets/29321

8. Evol Instruct Chinese GPT4 文本数据集

该数据集是通过以下方式创建的:

(1) 将 Evol-instruct-70k 的英文问题翻译成中文;

(2) 请求 GPT4 生成中文答案。

直接使用

https://hyper.ai/datasets/29318

ScienceAI 论文案例精选

1. 剑指全球第一大癌症,中国学者建立乳腺癌预后评分系统 MIRS

近日,中国学者采用神经网络模型,建立了一个预测乳腺癌预后和治疗的评分系统 MIRS,可用于指导乳腺癌患者治疗策略的制定。相关论文已发表于「iScience」期刊。

查看完整报道

https://hyper.ai/news/29304

2. 中科院深圳先进院提出 SBeA,基于少样本学习框架进行动物社会行为分析

动物行为研究急需通过技术创新提升研究效率和准确性。基于此,SBeA (Social Behavior Atlas) 应运而生,由中国科学院深圳高新技术研究院开发,能够全面量化自由群居动物的行为,使用较少的标记帧数(约 400 帧)进行多动物三维姿态估计,通过双向迁移学习策略,在多动物身份识别方面的准确率超过 90% 。相关成果已发表于「Nature」期刊。

查看完整报道

https://hyper.ai/news/29353

热门百科词条精选

  1. 每秒浮点运算次数 FLOPS
  2. 随机漫步 Random Walk
  3. 虚拟筛选 Virtual Screening
  4. 音乐信息检索 MIR
  5. 量子神经网络 Quantum Neural Network

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki


以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们!

新春到来之际,HyperAI超神经再次祝大家龙行大运,万事兴龙,合不龙嘴,其乐龙龙!新的一年,我们会给大家带来更多惊喜!

让我们龙年再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1200+ 公开数据集提供国内加速下载节点
  • 收录 300+ 经典及流行在线教程
  • 解读 100+ AI4Science 论文案例
  • 支持 500+ 相关词条查询
  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅

https://hyper.ai/

你可能感兴趣的:(人工智能资讯数据集)