Kaldi的英⽂缩写
lang
language,语⾔
⽰例:data/lang
Language directory
bg
binary-grammar,⼆阶语⾔模型
⽰例:data/lang_test_bg_5k
Language directory used for test, with big dictionary of 5000 words
⽤于解码测试的语⾔⽬录,其字典为包含5000个单词的⼤字典
tg
triple-grammar,三阶语⾔模型
⽰例:data/lang_test_bd_tg
Language directory used for test, big dictionary, triple-grammar
⽤于解码测试的语⾔⽬录,⼤字典,三阶语⾔模型
fg
four-grammar,四阶语⾔模型
⽰例:data/lang_test_bd_fg
Language directory used for test, big dictionary, four-grammar
⽤于解码测试的语⾔⽬录,⼤字典,四阶语⾔模型
bd
big dict,⼤字典
⽰例:data/lang_test_bd_tgpr
Language directory used for test, big dictionary, pruned triple-grammar
⽤于解码测试的语⾔⽬录,⼤字典,裁剪过的三阶语⾔模型
pr
pruned,裁剪过的
⽰例:data/lang_test_tgpr_5k
Language directory used for test, with dictionary of 5000 words, pruned triple-grammar
⽤于解码测试的语⾔⽬录,其字典为包含5000个单词的⼤字典,裁剪过的三阶语⾔模型DAE
Denoising Auto Encoder
降噪⾃动编码器,常作为DNN的前端,⽤于降噪
⽰例:thchs30/local/dae
hires
high resolution
⾼分辨率,⾼维数,通常表⽰40维的MFCC特征
⽰例:data/train_hires
sp
speed perturb,速度扰动,通常表⽰通过速度扰动进⾏增⼴过的数据集
silence phone,静⾳⾳素
nosp
no silence phone,⽆静⾳⾳素,通常⽤于⾳素集中没有静⾳⾳素的语⾔⽬录
⽰例:data/lang_nosp
nodup
no duplex,⽆重复的,⽂本⽆重复,通常表⽰已经将训练集相同标注的语句去除
⽰例:data/train_nodup
2y、7d
数字+字母形式的调优版本,字母可省略。通常出现在kaldi/egs/*/local/{nnet3,chain}/tuning⽬录以及相关⽬录中。
a, b,..., z
1a, 1b,..., 1z
...
⽰例:
1. swbd/s5c/local/chain/tuning/run_tdnn_blstm_a.sh
TDNN-BLSTM的基线模型
2. swbd/s5c/local/chain/tuning/run_tdnn_blstm_2y.sh
TDNN-BLSTM的调优模型,版本为2y
3. swbd/s5c/local/chain/tuning/run_tdnn_blstm_7d.sh
TDNN-BLSTM的调优模型,版本为7d
4. exp/chain/tri6_7d_tree
版本为7d的调优模型所使⽤的决策树⽬录
5. data/lang_chain_2y
版本为2y的Chain调优模型所使⽤的语⾔⽬录
sw1
Switchboard 1
因为Switchboard由多个部分组成,⽽kaldi/egs/swbd⽰例只使⽤了Switchboard-1 Phase 1,因此相关数据集、转录等缩写为sw1。
⽰例:
1. data/lang_nosp_sw1_tg
语⾔⽬录,不包含静⾳⾳素,其中三阶语⾔模型使⽤Switchboard 1转录训练
2. exp/tri1/graph_nosp_sw1_tg
解码图⽬录,不包含静⾳⾳素,其中三阶语⾔模型使⽤Switchboard 1转录训练
fsh
fisher,egs/fisher_english⽰例及其相关数据
⽰例:data/lang_fsh_sw1_tg
语⾔⽬录,其中三阶语⾔模型使⽤fisher_english和Switchboard 1的转录进⾏训练得到xent
Cross Entropy,交叉熵,通常表⽰Chain模型的交叉熵正则化
⽰例:xent_regularize=0.1,交叉熵正则化系数
egs正则化的英文
examples,⽰例,通常表⽰Kaldi脚本⽰例
例如:kaldi/egs⽬录
examples,样本,通常表⽰训练样本
例如:exp/chain/tdnn_blstm_a/egs⽬录
eg
example,样本,通常表⽰训练样本
⽰例:
1. --frames-overlap-per-eg 0
训练样本之间重叠(重复)的帧数为0
2. --frames-per-eg 50
⼀个训练样本包含50帧
si
speeker independent,说话⼈⽆关,即没有进⾏说话⼈⾃适应训练(SAT)
⽰例:steps/align_si.sh
说话⼈⽆关的对齐

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。