码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • librispeech 的train-clean-100--简单记录笔记


    1. LibriSpeech :
      1. 是一个阅读语音语料库,基于 LibriVox 的公共领域有声读物。 其目的是实现自动语音识别 (ASR) 系统的训练和测试
      2. 语料库被分成了一些子集,名称中带有“clean”的子集被认为比其他音频和美国英语口音更“干净”(至少平均而言)。 该分类是使用非常粗糙的自动化手段获得的,不应被认为是完全可靠的。 子集是不相交的,即每个说话者的音频都被分配给一个子集。
      3. 语料库的架构:
        1. * dev-clean, test-clean - 包含“干净”语音的开发和测试集。
        2. * train-clean-100 - 训练集,大约 100 小时的“干净”语音
        3. * train-clean-360 - 训练集,大约 360 小时的“干净”语音
        4. * dev-other, test-other - 开发和测试集,语音被自动选择为更具“挑战性”的识别
        5. * train-other-500 - 大约 500 小时的训练集,包含未被归类为“干净”的语音
        6. * intro - subset  仅包含一些读者的 LibriVox 介绍免责声明的子集
        7. * mp3  - 语料库所基于的原始 MP3 编码音频
        8. * texts - 语料库中音频所对应的文本
    2. train-clean-100的目录架构:

    1. 19:说话人id
    2. 198:说话人阅读的文章章节
    3. *.flac:音频
    4. 19-198.trans.txt:包含来自相应章节的文本
  • 相关阅读:
    Three.js初识:渲染立方体、3d字体、修改渲染背景颜色
    「BUAA OO Pre」 Pre 2总结回顾概览
    16、监测数据采集物联网应用开发步骤(12.1)
    分布式事务。seata主线版本1.6.0-SHAPSHOT,Springboot2.7.6,AT与TCC模式。小白入门必看,0-1过程,代码全。
    Flink SQL系列之:解析Debezium数据格式时间字段常用的函数
    流行框架:OkHttp配置
    【GNS3 GraduProj】SSH远程登录达成
    【C语言】学生宿舍信息管理系统
    图纸透明加密:保护机械图纸安全的新方法
    Java中对象的打印
  • 原文地址:https://blog.csdn.net/weixin_45647721/article/details/127712078
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号