最近上映的《无所不能》是一部印度电影,电影的男主人公是个盲人,他的工作是配音演员,能够惟妙惟肖地模仿不同的人。这个特长不仅能让他帮邻居家的小孩模仿家长给老师打电话、模仿大明星打电话哄妻子开心,最后也成为了他为妻子复仇的重要手段。
跟指纹一样,每个人的声音也具有独特的特点,也被称作声纹(voice print)。人类语言的产生是大脑语言中枢与发音器官共同产生的复杂过程,由于发声器官(包括舌头、口腔结构、鼻腔、声带等)形态上存在个体差异,这些器官的差异结合起来就会形成每个人独特的声纹图谱。不仅人有声纹,动物也有声纹,有的科学家就通过动物的独特声纹对野生动物进行跟踪辨别。但与指纹不同的是,指纹是固定的,十个手指就有十个固定的纹路。但是声纹却有一套独特的规律,所以声纹识别就是要根据一个人所说的话,总结出一套这个人声音特有的物理特征,以这个“标尺”来判断新的声音资料。
通过复杂的计算,人工智能正在试图帮助人们对声音进行识别,但人类本身从很小的时候就可以对熟悉的声音进行分别。人类对于同类的声音,尤其是包含着情绪信息的声音特别敏感,多个大脑区域与人声加工和语言情绪加工有着密切关系。
语言是人类社会性发展非常重要的内容,不到一个月的婴儿就已经开始学习语言了。三个月的婴儿听到人声时,就已经出现跟成人类似的大脑活动,不到一岁的婴儿,就已经出现了对于悲伤人声加工的神经加工分化。研究发现,人们只要通过六句话,就可以掌握一个人的声音规律,然后将这个规律扩展到新的话语中,根据规律进行身份确认。
正因为可以通过语音判断人的身份,因此录音可以成为法庭证据。但是“耳证”也有出错的时候。虽然我们能够通过语音辨别他人,但有时候也会“听错人”。
一方面是由于人的声音特点并不特别稳定,生理的变化(比如变声器)、病理改变,甚至心理的状态的不同,都会改变人的声纹;伪装与修饰也可以改变声纹,就如同在电影中男主人公做的一样。
另一方面,人们对于声音的再认可会出现错误。在研究中,被试者先听到声音,有些很容易辨别、有些不容易分辨。在一周之后,对他们进行声音再认的测试:能不能正确指认听到的是哪个声音。结果发现,人们常会弄混那些典型的声音,换句话说声音分辨率不高的声音并不会被准确的指认出来。语音识别的个体差异也非常大,有些人更善于通过声音进行身份辨别。
男性与女性之间也存在语音识别的差异,女性总体来说比男性更擅长分辨语音。同时也存在说者性别与听者性别的交互影响:男性更容易根据语音辨别其他男性,而女性辨认男性和女性语音的能力差不多。
在电影里,主人公用伪装后的声音,骗过了很多人。这两年大热的节目《声临其境》中演员们也有高超的技巧,改变了自己的声音,变成了另外的角色。除了本身的技巧之外,也与听众的期望有关系——我期望听到某个人的声音,就会更容易认为听到了这样的声音。这可能是因为语言的内容、说话时的画面等等,都会对人们产生影响。
甚至发音时的口型对于听到的声音都有所产生影响。在一个实验里,当人们听到“ba”的声音,但看到“ga”的口型,人们感觉自己“听到”的不是“ba”也不是“ga”,而成了“da”。这个现象叫做麦古现象(mcgurk effect),说明我们对于声音感知和判断并不全是真实世界的反应。
作者中国科学院心理研究所王日出