新春佳节,归程千里为团圆
人间烟火,年味浓浓阖家欢
辞别玉兔,金龙迎春。明晚就是大年三十除夕夜了!HyperAI超神经在这里提前祝大家新春快乐~龙行龘龘(dá)!本周 hyper.ai 官网上线了希尔贝壳开源的数千小时中文语音数据库,打开你的语音之门。
2 月 5 日-2 月 8 日,hyper.ai 官网更新速览:
- 优质公共数据集:8 个
- AI4S 论文案例:2 篇
- 热门百科词条:8 条
访问官网:hyper.ai
公开数据集精选
1.AISHELL-1 开源中文语音数据库
该数据集由 400 名来自中国不同口音地区的人参与录制。经过专业语音校对人员转写标注,并通过严格质量检验,此数据库文本正确率在 95% 以上。分为训练集、开发集、测试集。
直接使用:
https://hyper.ai/datasets/29344
2. AISHELL-2 中文语音数据库
希尔贝壳中文普通话语音数据库 AISHELL-2 包含 1,000 小时的语音时长。录音文本涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等 12 个领域。
直接使用:
https://hyper.ai/datasets/29347
3. AISHELL-3 高保真中文语音数据库
该数据集由 218 名来自中国不同口音区域的人员参与录制。由专业语音校对人员进行拼音和韵律标注,并通过严格质量检验,此数据库音字准确率在 98% 以上。
直接使用:
https://hyper.ai/datasets/29352
4. AISHELL-4 多通道中文会议语音数据库
AISHELL-4 是由 211 个录制的会议会议组成,每个会议会议包含 4 至 8 名发言者,总时长为 120 小时,可用于语音前端处理、语音识别等单独任务。
直接使用:
https://hyper.ai/datasets/29375
5. AISHELL-WakeUp-1 中英文唤醒词语音数据库
该数据集邀请了 254 名发言人参与录制,共有唤醒词语音近 400 万条,1561.12 小时。录音文本为「你好,米雅」、「hi, mia」唤醒词。此数据库经过专业语音校对人员转写标注,并通过严格质量检验,可用于声纹识别、语音唤醒识别等研究使用。
直接使用:
https://hyper.ai/datasets/29186
6. AISHELL-DMASH 中文普通话麦克风阵列家居场景语音数据库
AISHELL-DMASH 数据集是在两个不同房间的真实智能家居场景中记录的,该数据集包含 30,000 小时的语音数据。数据集由专业语音标注人员转录,单词准确率达 98%,可用于声纹识别、语音识别、唤醒词识别等研究。
直接使用:
https://hyper.ai/datasets/29380
7.DeepSymNet 深度符号网数据集
这是中国科学院半导体研究所的研究人员提出的一种名为 DeepSymNet 的全新符号网络来表示符号表达式,用于符号回归的符号网络。
直接使用:
https://hyper.ai/datasets/29321
8. Evol Instruct Chinese GPT4 文本数据集
该数据集是通过以下方式创建的:
(1) 将 Evol-instruct-70k 的英文问题翻译成中文;
(2) 请求 GPT4 生成中文答案。
直接使用:
https://hyper.ai/datasets/29318
ScienceAI 论文案例精选
1. 剑指全球第一大癌症,中国学者建立乳腺癌预后评分系统 MIRS
近日,中国学者采用神经网络模型,建立了一个预测乳腺癌预后和治疗的评分系统 MIRS,可用于指导乳腺癌患者治疗策略的制定。相关论文已发表于「iScience」期刊。
查看完整报道:
2. 中科院深圳先进院提出 SBeA,基于少样本学习框架进行动物社会行为分析
动物行为研究急需通过技术创新提升研究效率和准确性。基于此,SBeA (Social Behavior Atlas) 应运而生,由中国科学院深圳高新技术研究院开发,能够全面量化自由群居动物的行为,使用较少的标记帧数(约 400 帧)进行多动物三维姿态估计,通过双向迁移学习策略,在多动物身份识别方面的准确率超过 90% 。相关成果已发表于「Nature」期刊。
查看完整报道:
热门百科词条精选
- 每秒浮点运算次数 FLOPS
- 随机漫步 Random Walk
- 虚拟筛选 Virtual Screening
- 音乐信息检索 MIR
- 量子神经网络 Quantum Neural Network
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们!
新春到来之际,HyperAI超神经再次祝大家龙行大运,万事兴龙,合不龙嘴,其乐龙龙!新的一年,我们会给大家带来更多惊喜!
让我们龙年再见!
关于 HyperAI超神经 (hyper.ai)
HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
- 为 1200+ 公开数据集提供国内加速下载节点
- 收录 300+ 经典及流行在线教程
- 解读 100+ AI4Science 论文案例
- 支持 500+ 相关词条查询
- 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅: