基本信息

编辑推荐
---------------------------7891598 - 基于深度学习的自然语言处理---------------------------
(1)自然语言处理是人工智能领域的一个重要的研究方向,有着巨大的应用需求,但是由于自然语言具有歧义性、动态性和非规范性,同时语言理解通常需要丰富的知识和一定的推理能力,存在极大的挑战。深度学习技术为解决NLP问题提供了一种可能的思路,已成为有效推动自然语言处理技术发展的变革力量。
(2)本书的作者和译者都是国内外NLP领域非常活跃的青年学者,他们关注的方法和技术代表和预示着目前和未来NLP领域的趋势。
(3)本书系统阐述将深度学习技术应用于自然语言处理的方法和技术,深入浅出地介绍了深度学习的基本知识及各种常用的网络结构,并重点介绍了如何使用这些技术处理自然语言。
内容简介
计算机书籍
---------------------------8077118 - 自然语言处理中的贝叶斯分析(原书第2版)---------------------------
本书涵盖了流利阅读NLP中贝叶斯学习方向的论文以及从事该领域的研究所需的方法和算法。这些方法和算法部分来自于机器学习和统计学,部分是针对NLP开发的。我们涵盖推理技术,如马尔科夫链、蒙特卡罗抽样和变分推理、贝叶斯估计和非参数建模。为了应对该领域的快速变化,本书新版增加了一个新的章节,关于贝叶斯背景下的表现学习和神经网络。我们还将介绍贝叶斯统计的基本概念,如先验分布、共轭性和生成式建模。最后,我们回顾了一些基本的NLP建模技术,如语法建模、神经网络和表示学习,以及它们在贝叶斯分析中的应用。
---------------------------7891598 - 基于深度学习的自然语言处理---------------------------
本书重点介绍了神经网络模型在自然语言处理中的应用。首先介绍有监督的机器学习和前馈神经网络的基本知识,如何将机器学习方法应用在自然语言处理中,以及词向量表示(而不是符号表示)的应用。然后介绍更多专门的神经网络结构,包括一维卷积神经网络、循环神经网络、条件生成模型和基于注意力的模型。最后讨论树形网络、结构化预测以及多任务学习的前景。
作译者
---------------------------7891598 - 基于深度学习的自然语言处理---------------------------
约阿夫o戈尔德贝格(Yoav Goldberg)
以色列巴伊兰大学计算机科学系高级讲师,曾任Google Research研究员。他于2011年获得本·古里安大学博士学位。他曾经担任EMNLP、EACL等重要国际会议领域主席,在自然语言处理领域发表论文50余篇,并多次获得*佳论文以及杰出论文奖。同时他也是自然语言处理领域*级期刊《Computational Linguistics》的编辑部成员。他的研究方向包括面向自然语言处理的机器学习方法,结构预测,句法与词法分析等。近几年,他专注于神经网络模型,在基于深度学习的自然语言处理方法上作出了重要贡献,同时他也是主流深度学习工具包DyNet的主要研发者之一。
译者和主审简介
车万翔,博士,哈尔滨工业大学教授,博士生导师,斯坦福大学访问学者。研究方向为自然语言处理。在CoNLL、SANCL、SemEal等国际评测获得过冠军。任ACL、COLING、EMNLP等国际会议领域主席。负责研发的语言技术平台(LTP)已被600余家单位共享,并授权给百度、腾讯、华为等公司使用。曾获黑龙江科技进步一等奖、技术发明二等奖;汉王青年创新奖一等奖;钱伟长中文信息处理科学奖等奖项。2017年所主讲的《Python语言程序设计》课程获国家精品在线开放课程。
郭江,博士,毕业于哈尔滨工业大学社会计算与信息检索研究中心,就读期间先后于美国普林斯顿大学以及约翰·霍普金斯大学进行访问研究,现为美国麻省理工学院计算机科学与人工智能实验室博士后研究员。研究领域主要为自然语言处理与机器学习。在人工智能,自然语言处理等领域国际重要会议及期刊(如ACL, EMNLP, AAAI, IJCAI, JAIR等)上发表论文10余篇。
张伟男,哈尔滨工业大学计算机学院社会计算与信息检索研究中心,博士/讲师/硕导。在ACL、AAAI、IJCAI及IEEE TKDE等CCF A类国际会议及国际*级期刊发表论文多篇。中国中文信息学会(CIPS)信息检索专委会委员、青年工作委员会委员,中国人工智能学会(CAAI)青年工作委员会委员。曾获黑龙江省科技进步一等奖、中国人工智能学会*佳青年成果奖、中国人工智能学会"合创杯"第二届全国青年创新创业大赛三等奖。
刘铭,博士,哈尔滨工业大学副教授,博士生导师,美国南加州大学访问学者。研究领域包括文本挖掘、命名实体识别、实体链接等。先后主持国家自然科学基金、中国博士后科学基金特别资助、腾讯-CCF犀牛鸟创意基金等多项基金项目。 在人工智能、数据挖掘、自然语言处理等领域国际期刊和会议上发表论文20余篇(如TKDE、TOIS、IJCAI、ACL、ICDE等)。获黑龙江省科学技术一等奖一项, 获哈尔滨市科技成果一项。
主审:刘挺
刘挺,哈尔滨工业大学教授,社会计算与信息检索研究中心主任,国家"万人计划"科技创新领军人才。多次担任国家863重点项目总体组专家、基金委会评专家。中国计算机学会理事,中国中文信息学会常务理事、社会媒体处理专委会(SMP)主任,曾任国际*级会议ACL、EMNLP领域主席。主要研究方向为人工智能、自然语言处理和社会计算,是国家973课题、国家自然科学基金重点项目负责人。主持研制"语言技术平台LTP"、"大词林"等科研成果被业界广泛使用。曾获国家科技进步二等奖、省科技进步一等奖、钱伟长中文信息处理科学技术一等奖等。
目录
7891598 - 基于深度学习的自然语言处理 - 9787111593737 - 机械工业出版社 - 定价 69
8077118 - 自然语言处理中的贝叶斯分析(原书第2版) - 9787111669579 - 机械工业出版社 - 定价 89
---------------------------8077118 - 自然语言处理中的贝叶斯分析(原书第2版)---------------------------
译者序
第2版前言
第1版前言
第1版致谢
第1章 基础知识 1
1.1 概率测度 1
1.2 随机变量 2
1.2.1 连续随机变量和离散随机变量 2
1.2.2 多元随机变量的联合分布 3
1.3 条件分布 4
1.3.1 贝叶斯法则 5
译者序
---------------------------7891598 - 基于深度学习的自然语言处理---------------------------
自然语言处理(Natural Language Processing,NLP)主要研究用计算机来处理、理解以及运用人类语言(又称自然语言)的各种理论和方法,属于人工智能领域的一个重要研究方向,是计算机科学与语言学的交叉学科,又常被称为计算语言学。随着互联网的快速发展,网络文本尤其是用户生成的文本呈爆炸性增长,为自然语言处理带来了巨大的应用需求。同时,自然语言处理研究的进步,也为人们更深刻地理解语言的机理和社会的机制提供了一种新的途径,因此具有重要的科学意义。
然而,自然语言具有歧义性、动态性和非规范性,同时语言理解通常需要丰富的知识和一定的推理能力,这些都给自然语言处理带来了极大的挑战。目前,统计机器学习技术为以上问题提供了一种可行的解决方案,成为研究的主流,该研究领域又被称为统计自然语言处理。一个统计自然语言处理系统通常由两部分组成,即训练数据(也称样本)和统计模型(也称算法)。
但是,传统的机器学习方法在数据获取和模型构建等诸多方面都存在严重的问题。首先,为获得大规模的标注数据,传统方法需要花费大量的人力、物力、财力,雇用语言学专家进行繁琐的标注工作。由于这种方法存在标注代价高、规范性差等问题,很难获得大规模、高质量的人工标注数据,由此带来了严重的数据稀疏问题。其次,在传统的自然语言处理模型中,通常需要人工设计模型所需要的特征以及特征组合。这种人工设计特征的方式,需要开发人员对所面对的问题有深刻的理解和丰富的经验,这会消耗大量的人力和时间,即便如此也往往很难获得有效的特征。
近年来,如火如荼的深度学习技术为这两方面的问题提供了一种可能的解决思路,有效推动了自然语言处理技术的发展。深度学习一般是指建立在含有多层非线性变换的神经网络结构之上,对数据的表示进行抽象和学习的一系列机器学习算法。该方法已对语音识别、图像处理等领域的进步起到了极大的推动作用,同时也引起了自然语言处理领域学者的广泛关注。
深度学习主要为自然语言处理的研究带来了两方面的变化:一方面是使用统一的分布式(低维、稠密、连续)向量表示不同粒度的语言单元,如词、短语、句子和篇章等;另一方面是使用循环、卷积、递归等神经网络模型对不同的语言单元向量进行组合,获得更大语言单元的表示。除了不同粒度的单语语言单元外,不同种类的语言甚至不同模态(语言、图像等)的数据都可以通过类似的组合方式表示在相同的语义向量空间中,然后通过在向量空间中的运算来实现分类、推理、生成等各种任务并应用于各种相关的任务之中。
虽然将深度学习技术应用于自然语言处理的研究目前非常热门,但是市面上还没有一本书系统地阐述这方面的研究进展,初学者往往通过学习一些在线课程(如斯坦福的CS224N课程)来掌握相关的内容。本书恰好弥补了这一不足,深入浅出地介绍了深度学习的基本知识及各种常用的网络结构,并重点介绍了如何使用这些技术处理自然语言。
本书的作者Yoav Goldberg现就职于以色列巴伊兰大学,是自然语言处理领域一位非常活跃的青年学者。Goldberg博士期间的主要研究方向为依存句法分析,随着深度学习的兴起,他也将研究兴趣转移至此,并成功地将该技术应用于依存句法分析等任务。与此同时,他在理论上对词嵌入和传统矩阵分解方法的对比分析也具有广泛的影响力。另外,他还是DyNet深度学习库的主要开发者之一。可见,无论在理论上还是实践上,他对深度学习以及自然语言处理都具有非常深的造诣。这些都为本书的写作奠定了良好的基础。
由于基于深度学习的自然语言处理是一个非常活跃的研究领域,新的理论和技术层出不穷,因此本书很难涵盖所有的最新技术。不过,本书基本涵盖了目前已经被证明非常有效的技术。关于这方面的进展,读者可以参阅自然语言处理领域最新的论文。
我们要感谢对本书的翻译有所襄助的老师和学生。本书由哈尔滨工业大学的车万翔、郭江、张伟男、刘铭四位老师主译,刘挺教授主审。侯宇泰、姜天文、李家琦、覃立波、宋皓宇、滕德川、王宇轩、向政鹏、张杨子、郑桂东、朱海潮、朱庆福等对本书部分内容的初译做了很多工作,机械工业出版社华章公司策划编辑朱劼和姚蕾在本书的整个翻译过程中提供了许多帮助,在此一并予以衷心感谢。
译文虽经多次修改和校对,但由于译者的水平有限,加之时间仓促,疏漏及错误在所难免,我们真诚地希望读者不吝赐教,不胜感激。
车万翔
2017年10月于哈尔滨工业大学
前言
---------------------------8077118 - 自然语言处理中的贝叶斯分析(原书第2版)---------------------------
第2版前言
Bayesian Analysis in Natural Language Processing, Second Edition
没想到本书会如此迅速地发行第2版。最近几年,自然语言处理领域的快速而令人兴奋的发展要求进行各种更新,本书第2版应运而生。
第2版主要增加的内容是第9章,该章重点介绍自然语言处理(特别是在贝叶斯情景下)中的表征学习与神经网络。本章的撰写是基于这样的观察:在过去5年左右的时间里,自然语言处理中的大部分文献都使用神经网络。因此,本书需要解决一些基本问题。使更新内容适应本书的贝叶斯“使命”(结合自然语言处理背景)并不容易,我是否完成了这一使命将由读者来判断。
第2版除了引入新的章节外,还修正了一些印刷错误,并将一些附加内容整合到各章中。
一些人为本书第2版提供了帮助。非常感谢Trevor Cohn、Marco Damonte、Jacob Eisen-stein、Lea Frermann、Annie Louis、Chunchuan Lyu、Nikos Papasarantopoulos、Shashi Nara-yan、Mark Steedman、Rico Sennrich和Ivan Titov的帮助和评点。还要感谢我的学生和博士后,他们在本书新内容的某些方面教给我的知识比我教给他们的更多。
谢伊·科恩
爱丁堡
2019年2月
第1版前言
Bayesian Analysis in Natural Language Processing, Second Edition
当撰写涉及两个领域(贝叶斯统计和自然语言处理)交叉的主题时,需要考虑焦点和视角。本书旨在为在研究生求学期间和我具有相同处境的人编写,采取一种相当实用的视角。在研究生求学期间,我已经对自然语言处理中的问题和机器学习的基本原理有所了解,我想以纯抽象的方式来学习更多关于贝叶斯统计的知识,尤其是与自然语言处理最相关的部分。因此,本书就是从这种角度出发,提供有关计算语言学家将贝叶斯方法应用于工作时所需掌握的关键技术、术语和模型的抽象信息。
因此,本书的大部分章节比较简洁,且与贝叶斯统计的其他应用相关。只有最后一章为语法模型提供一些具体的自然语言处理应用,这些模型主要(但不完全)用于自然语言处理。
在理想情况下,本书面向的读者应该已经对自然语言处理中的统计建模有一定了解,并且希望对贝叶斯技术在自然语言处理中的具体应用有更深入的了解。做出更多关注贝叶斯自然语言处理数学层面的决策的动机很简单,因为大部分计算语言学家在他们的研究生生涯或其他阶段很早就接触到了自然语言处理的基本核心术语、自然语言处理所预测的语言结构及其背后的一些语言动机。特别是计算语言学家在研究中经常需要学习贝叶斯统计思想或掌握其他统计工具,因此他们有时会对贝叶斯统计产生误解,且缺失全局观。本书试图向读者提供一些缺失的细节。
媒体评论
---------------------------8077118 - 自然语言处理中的贝叶斯分析(原书第2版)---------------------------
自然语言处理在20世纪80年代中期经历了深刻变革,开始大量使用语料库和数据驱动技术对语言进行分析。自那时起,统计技术在自然语言处理中的应用在多个方面得到发展。其中的一个例子发生在2000年左右,那时自然语言处理引入了成熟的贝叶斯机制。这种针对自然语言处理的贝叶斯方法已经可以解决频率学派方法的各种缺点,特别是在没有目标预测示例的无监督情况下进行统计学习更能弥补频率学派方法的不足。
本书对基于贝叶斯分析进行自然语言处理需掌握的概念、理论知识和算法进行了深入浅出的介绍,讲解了常见的推断技术(马尔可夫链蒙特卡罗采样和变分推断)、贝叶斯估计和非参数建模等。特别是为应对领域的快速发展,第2版新增了第9章“表征学习与神经网络”。此外,还介绍贝叶斯统计中的基本概念,如先验分布、共轭和生成建模。最后,本书回顾自然语言处理中的一些基本建模技术(包括语法建模、神经网络和表征学习)以及它们在贝叶斯分析中的应用。