CTC模型

发布于 2020-02-29 10:43:06
关注者
0
被浏览
910
1 个回答
  • 面试哥
    面试哥 2020-02-29
    为面试而生,有面试问题,就找面试哥。

    CTC的全称是Connectionist Temporal Classification,中文翻译大概是连接时序分类。它要达到的目标就是直接将语音和相应的文字对应起来,实现时序问题的分类。 用公式来描述的话,CTC的公式推导如下:

    在基于CD-DNN-HMM架构的语音识别声学模型中,训练DNN通常需要帧对齐标签。在GMM中,这个对齐操作是通过EM算法不断迭代完成的。

    E-step:估计(重估)GMM参数

    M-step:使用BW(Baum-Welch算法)对齐

    此外对于HMM假设一直受到诟病,等到RNN出现之后,使用RNN来对时序关系进行描述来取代HMM成为当时的热潮。

    随着神经网络优化技术的发展和GPU计算能力的不断提升,最终使用RNN和CTC来进行建模实现了end-to-end语音识别的声学模型。

知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看