資源簡介
語音識別MFCC特征提取matlab代碼。
「梅爾倒頻譜系數」(Mel-scale Frequency Cepstral Coefficients,簡稱MFCC),是最常用到的語音特征,此參數考慮到人耳對不同頻率的感受程度,因此特別適合用在語音辨識。
代碼片段和文件信息
function?ccc?=?mfcc(x)
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%?????????????????function?ccc=mfcc(x);
%對輸入的語音序列x進行MFCC參數的提取,返回MFCC參數和一階
%差分MFCC參數,Mel濾波器的階數為24
%fft變換的長度為256,采樣頻率為8000Hz,對x?256點分為一幀
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
bank=melbankm(24256800000.5‘m‘);
%?歸一化mel濾波器組系數
bank=full(bank);
bank=bank/max(bank(:));
%?DCT系數12*24
for?k=1:12
??n=0:23;
??dctcoef(k:)=cos((2*n+1)*k*pi/(2*24));
end
%?歸一化倒譜提升窗口
w?=?1?+?6?*?sin(pi?*?[1:12]?./?12);
w?=?w/max(w);
%?預加重濾波器
xx=double(x);
xx=filter([1?-0
- 上一篇:精確計算24節氣的c++類
- 下一篇:超簡單的ntrip客戶端C語言實現.docx
評論
共有 條評論