听觉系统与鸡尾酒会问题
基本信息
- 作者: [美] 约翰·C.米德尔布鲁克斯(John C.Middlebrooks) 尤纳森·Z.西蒙(Jonathan Z.Simon) 阿瑟·N.波珀(Arthur N.Popper) 理查德·R.费伊(Richard R.Fay)
- 出版社:机械工业出版社
- ISBN:9787111668978
- 上架时间:2020-12-16
- 出版日期:2020 年12月
- 开本:16开
- 页码:262
- 版次:1-1
- 所属分类:计算机 > 人工智能 > 综合

编辑推荐
听觉系统与鸡尾酒会问题
The Auditory System
at the Cocktail Party
[美]约翰·C. 米德尔布鲁克斯(John C. Middlebrooks)
尤纳森·Z. 西蒙(Jonathan Z. Simon)
阿瑟·N. 波珀(Arthur N. Popper)
理查德·R. 费伊(Richard R. Fay) 编著
许家铭 石晶 徐波?译
内容简介
目录
译者序
前言
第1章 解析听觉场景的耳和脑机制 1
1.1 引言 1
1.2 一些关键概念 2
1.3 本书概述 2
1.4 耳和脑 4
参考文献 5
第2章 听觉客体的形成和选择 6
2.1 引言 6
2.1.1 鸡尾酒会:令人困惑的混合声音和受限的加工容量 7
2.1.2 基于客体的注意 8
2.1.3 异构化而非层次化加工 9
2.1.4 历史笔记 9
2.2 解析声学场景:听觉客体形成 11
2.2.1 局部频谱时间线索支持“音节层面”的客体形成 11
2.2.2 高阶特征将音节联结成“流” 12
2.2.3 开放问题 13
2.3 聚焦注意:选择什么去加工 14
前言
本书内容是由2013年在美国马里兰州巴尔的摩举行的耳鼻喉科研究协会冬季会议上的主席研讨会“鸡尾酒会场景下的耳与大脑”(Ears and Brains at the Cocktail Party)发展而来的。在本书中,作者描述了听觉系统擅长将感兴趣的信号与干扰声分离的条件以及该问题不可解决的条件,这一切都是在试图理解这些成功和失败背后的神经机制。第1章整体介绍了本书内容,对鸡尾酒会问题进行了概述,并将这一问题置于听觉神经科学更广泛的探讨和分析中。第2章进一步阐述了听觉客体的关键概念,可以将其视为外部听觉声源与目标选择和注意执行单元之间的感知关联。第3章强调了较低层次下将信号与噪声进行分离的挑战,并考虑了可以克服这些挑战的机制。同时,第3章中也介绍了能量掩蔽和信息掩蔽之间的区别。接下来,第4章通过专注于混叠语音掩蔽问题来扩展信息掩蔽的概念。
计算模型能够使鸡尾酒会问题的基本科学理解得以形式化,同时能够在解决实际工程问题中生成一些应用了生物学原理的算法。第5章考虑了面向鸡尾酒会问题建立有效计算模型的挑战。随后,第6章考虑了声源空间分离对于流分离的重要性,并回顾了空间流分离的心理物理学和生理学基础。接下来,第7章回顾了实验人类听觉神经科学领域的新发展。
通常,婴幼儿和儿童不会出现在鸡尾酒会中。但是,在类似的听觉场景如嘈杂的游乐园或拥挤的教室中很容易在声学上变得复杂。年幼的听者只能用还未成熟的听觉系统和尚未固化的语言识别能力来理解这些场景。第8章考虑了人类面对鸡尾酒会问题时发育的多个阶段和层次。接下来,第9章认为老年人在语言技能和知识存储方面的成熟可以一定程度上补偿外周和中枢听觉系统的衰退。最后,第10章探讨听觉损伤的后果和对听力恢复(至少部分恢复)的尝试。
在鸡尾酒会以及其他日常复杂听觉场景中的成功交流依赖于听觉系统的所有资源,包括从听觉外周的基本编码机制到高阶整合加工。本书旨在从各个层次对这些听觉资源进行探索,包括正常成年人的、早期发育的、老化的以及病变的听觉系统。
约翰·C. 米德尔布鲁克斯(John C. Middlebrooks),美国加利福尼亚州欧文市
尤纳森·Z. 西蒙(Jonathan Z. Simon),美国马里兰州学院公园市
阿瑟·N. 波珀(Arthur N. Popper),美国马里兰州学院公园市
理查德·R. 费伊(Richard R. Fay),美国伊利诺伊州芝加哥市
媒体评论
◎ 党建武,天津大学智能与计算学部教授,天津市认知计算与应用重点实验室主任
日本北陆先端科学技术大学院大学兼职教授,中国计算机学会语音对话与听觉专业组主任
本书对近年来鸡尾酒会问题相关的听觉心理学、生理学和认知神经科学的最新研究进展进行了仔细的梳理和系统性的组织,无论从投入精力还是难度上看,这在听觉研究领域都是一项大工程,是一件可喜可贺的大事。通览全书将使你对听觉客体、选择注意、能量掩蔽、信息掩蔽等概念,以及听觉流形成和听觉场景分析计算框架等,形成一个深入全面的认识。重新审视目前语音工程中的基本模块和系统框架,将会激发出新的思想火花和有效的解决思路。
◎ 吴玺宏,北京大学教授,信息科学技术学院副院长,智能科学系主任,言语听觉研究中心主任
听觉处理是言语认知的重要基础,对语音识别、语音增强和认知科学的发展具有重要作用,而鸡尾酒会场景的听觉处理技术是其中具有挑战性的难题。本书从信号层和神经认知层等多个不同的维度,详细阐述了听觉形成的机理和听觉场景的计算框架,以及针对鸡尾酒会问题的详细解决思路,对选择注意、信息掩蔽等现象也进行了深入分析,将能够帮助研究人员系统性地掌握听觉处理的理论与方法,对从事听觉处理技术、语音识别技术、认知科学等方面的研究具有重要的参考价值。译者在该领域有很高的造诣,对原文中的原理性描述,尤其是涉及认知科学的听觉场景计算方法,均能够以准确易懂的方式进行阐述。
◎ 陶建华,中国科学院自动化研究所研究员,模式识别国家重点实验室副主任
中欧信息自动化应用数学联合实验室中方主任,国家杰出青年科学基金获得者,国家万人计划领军人才