基本信息
内容简介
作译者
近几年来,他主要从事自然语言处理的理论与方法、机器翻译、人机对话系统等技术的研究和教学工作,作为项目负责人承担国家自然科学基金项目、国家“863”项目、国家支撑计划项目和国际合作项目等10余项,在Machine Translation,IEEE TASLP,ACM TALIP等国内外重要学术刊物和会议上发表论文60作篇,获多项国家发明专利。现任国际信息联合会(IFIP)人机交互技术委员会委员,亚洲自然语言处理联合会(AFNLP)执行理事,中国人工智能学会理事及自然语言处理专业委员会副主任,中国中文信息学会理事,中国科学院研究生院兼职教授,清华大学中国语言文学系讲座教授,山东大学兼职教授和北京邮电大学兼职教授,以及多个国际、国内学术期刊的编委,若干国际、国内学术会议的程序委员会主席、委员等职务。
目录
1.1 基本概念
1.1.1 语言学与语音学
1.1.2 自然语言处理
1.1.3 关于“理解”的标准
1.2 自然语言处理研究的内容和面临的困难
1.2.1 自然语言处理研究的内容
1.2.2 自然语言处理涉及的几个层次
1.2.3 自然语言处理面临的困难
1.3 自然语言处理的基本方法及其发展
1.3.1 自然语言处理的基本方法
1.3.2 自然语言处理的发展
1.4 自然语言处理的研究现状
第2章 预备知识
2.1 概率论基本概念
2.1.1 概率
2.1.2 最大似然估计
2.1.3 条件概率
2.1.4 贝叶斯法则
2.1.5 随机变量
书摘
1.1基本概念
1.1.1语言学与语音学
我们知道,语言作为人类特有的用来表达情感,交流思想的工具,是一种特殊的社会现象,由语音、词汇和语法构成。语音和文字是构成语言的两个基本属性,语音是语言的物质外壳,文字则是记录语言的书写符号系统〔黄伯荣等,1991〕。
根据《现代语言学词典》〔克里斯特尔,2002〕的定义,语言学(linguistics)是指对语言的科学研究。作为一门纯理论的学科,语言学在近期获得了快速发展,尤其从20世纪60年代起,已经成为一门知晓度很高的广泛教授的学科。
根据语言学家的注意中心和兴趣范围,语言学可以区分为一些不同的分支,例如,历时语言(diachronic linguistics)或称历史语言学(historical linguistics)、共时语言学(synchronic linguistics)、一般语言学(descriptive linguistics)、理论语言学(theoretical linguistics)、描述语言学(descriptive linguistics)、对比语言学(contrastive linguistics)或类型语言学(typological linguistics)、结构语言学(structural linguistics)等。
语音学(phonetics)是研究人类发音特点,特别是语音发音特点,并提出各种语音描述、分类和转写方法的科学。语音学一般有三个分支:①发音语音学(articulatory),研究发音器官是如何产生语音的;②声学语音学(acoustic phonetics),研究口耳之间传递语音的物理属性;③听觉语音学(auditory phonetics),研究人通过耳、听觉神经和大脑对语音的知觉反应。仪器语音学(instrumendal phonetics)则是利用各种物理设备,如测量气流或分析声波的仪器等,来研究上述三个问题的任一方面〔克里斯特尔,2002〕。
……