我的面试全记录
我报的是电院周正老师组,初试在组是排得挺靠前,不过院里的笔试考得很差。以下是我的面试全过程,保证内容真实可靠。授权《北邮[wiki]考研[/wiki]指南》使用。转载请注[wiki]明[/wiki]出处。
我自己:老师们好,这是我的成绩单.
周老师:北邮电院毕业的?
我自己:嗯,去年6月份毕业的。
周老师:去年考了吗?
我自己:考了,英语41,没过线囧
周老师:报哪了,总分多少?
我自己:去年报的是多媒体,总分也没过线,300出头
周老师:这半年在哪工作?
我自己:没找工作,一直复习考研......
周老师:也就是说这多花这一年考研就只是英语长了13分,其它科都差不多嘛
我自己:囧......
周老师:院里面的这个笔试你只考了30多分,也太低了,可能会影响录取的
我自己:囧......(慌)
周老师:你是不是对[wiki]数字信号处理[/wiki]不感兴趣?
我自己:也不是......
周老师:毕设做的什么?
我自己:做的是说话人识别,做了一个完整的系统
张老师:做到什么程度,识别效果怎么样?
我自己:做了一个30多个人的样本库,能达到95%以上的识别率
张老师:有这么高识别率??
我自己:是的,当时答辩的时候做过现场演示的。
周老师:随便说什么都能识别吗?
我自己:不是,我做的是跟文本相关的说话人识别,当时规定说的是一个短小的句子“北京 欢迎您”
张老师:对方言和不同口音的识别怎么样?
我自己:只要识别时跟训练模板时的口音一样就能达到很好的识别率
周老师:使用了什么技术来进行识别的?
我自己:我是用MATLAB做的整个系统(真是答非所问囧)
周老师:我是问你用了什么语音处理技术!(老师有点急了)
我自己:囧......(我也开始吞吐,还好调整得比较快),是提取语音信号的MEL倒谱作为识别的依据。
周老师:MEL倒谱是怎么回事?
我自己:先对语音信号作离散付利页变换,这就到了频域,然后取LOG,再作付利页反变换倒回时域,就得到了这一段语音的MEL倒谱。
周老师:为什么这样就能识别说话人?
我自己:(终于渐渐进入状态了)人说话是声带振动作为声源,经过声道后发出,实际就是声源与声道特性的卷积,而经过在频域取LOG再倒回时域,实质就是解卷积,这样,MEL倒谱就能代表不同的声道特性从而识别出不同的说话人。
周老师:那你说说卷积是怎么回事?
我自己:卷积是两个信号的反绉,移位,相乘,累加。(赞自己一下)
周老师:为何语音是声源跟声道的卷积?
我自己:一个输入信号通过一个线性系统,输出就是输入信号和系统冲激响应的卷积。
周老师:为什么?
我自己:(茫然)囧......
周老师:为什么输出是输入信号和系统冲激响应的卷积?
我自己:把[wiki]时间[/wiki]分成足够小的段,输入信号有顺序逐个分段进入系统,相当于多个冲激进入系统,其输出就应该是多个冲激响应以各时段的输入幅度为加权系数加权累加,这正好就是离散卷积。(再赞自己一下)
周老师:在频域呢?
我自己:是相乘。
周老师:(不说话)
我自己:(赶紧补充)在频域输出信号的付利页变换等于输入信号的付利页变换与系统函数的乘积。
周老师:为什么是乘积?
我自己:(茫然)系统函数是冲激响应的付利页变换,时域的卷积就是频域的乘积......
周老师:(继续发难)为什么时域的卷积就是频域的乘积?
我自己:(快招架不住了,急中生智)这就是付利页变换的奥妙之处吧......(寒自己一下,这种话也说得出来)
周老师:(笑)
周老师:一个M点的信号跟一个N点的信号卷积结果是多少点的?
我自己:(犹豫)M+N-1吧,不太记得了。
周老师:还让你记对了,知道为什么吗?
我自己:(两手在空中比划)这是一个M长的信号,这是一个N长的信号,它们移位相乘加权累加,减去头尾,所以是N+M-1
周老师:你基本概念掌握得还不错啊,怎么卷面的DSP才考那么点分?
我自己:囧......我考试时比较紧张......
周老师:好了,晚上等消息吧
我自己:谢谢老师 zan! 顶 顶!!! 每天有份好心情