tensorflow ctc_beam_search_decoder

tensorflow ctc_beam_search_decoder 

以lstm 获得的ocr结果为例,为了方便讨论,假设被识别的符号只有3个类,图片是 宽*高=10*3,即time step 是3,特征数是10。通过lstm,乘以weight matrix 加bias后的结果shape是[time_step,num_calss]=[3,3],假设值为

[

[0.1,0.8,0.1],

[0.6,0.3,0.1],

[0.1,0.7,0.2],

]

这结果的意思是,time_step 1 认为二号符号的概率最高为0.8,time_step 2 认为一号符号的概率最高为0.6,time_step 3 认为二号符号的概率为最高为0.7.

如果假设1,2,3号符号分别为a,b,c则用bean decoder 解出来的序列为2,1,2即b,a,b.


我知道,以上说法有问题,因为ctc_beam_decoder解出的序列长度是不定的,而上述方法解出的序列长度与time_step 相等,不知ctc_beam_decoder 如何决定序列长度的?

你可能感兴趣的:(tensorflow)