基本信息
- 原书名:R for Marketing Research and Analytics
- 作者: (美)克里斯·查普曼(Chris Chapman) (美)埃里亚·麦克唐奈·费特(Elea McDonnell Feit)
- 译者: 林荟
- 丛书名: 数据科学与工程技术丛书
- 出版社:机械工业出版社
- ISBN:9787111549901
- 上架时间:2016-9-29
- 出版日期:2016 年10月
- 开本:16开
- 版次:1-1
- 所属分类:计算机 > 软件与程序设计 > 综合 > 高级程序语言设计
教材 > 计算机教材 > 本科/研究生 > 计算机专业教材 > 计算机专业课程 > 程序设计

内容简介
目录
译者序
前言
第一部分 R语言基础知识
第1章 欢迎使用R2
1.1 R是什么2
1.2 为什么用R2
1.3 为什么不用R3
1.4 什么时候用R4
1.5 如何使用本书4
1.6 关键点6
第2章 R综述7
2.1 开始7
2.2 R用途快速指南8
2.3 R命令基础11
2.4 基础对象12
2.5 数据框21
2.6 载入和存储数据24
2.7 编写函数*27
2.8 清理30
译者序
本书有以下特点:
这是第一本成功介绍将一些现代统计分析技术应用到市场研究分析的书。它不同于之前那些介绍市场分析中用到的传统多元技术的书。虽然近年来有几本和模型应用相关的非常优秀的书籍问世,如James、Witten、Hastie 和Tibshirani的《统计学习导论》,Kuhn 和Johnson的《应用预测建模》,但是这些书并不是专门针对市场研究的。本书的针对性是其一大优点。
作者并非从学术的角度解决一些虚假的市场问题。书中的例子都是现实市场分析中经常遇到的问题。作者使用的是模拟数据集,乍一看让人感觉本书可能会脱离实际,毕竟用一些伪造的数据可以很容易给出模型效果很好的假象。其实不是这样的。由于两位作者在此之前都有着数十年的商业分析从业经验,因此书中数据集的抽取都非常巧妙,能够很好地反映作者在实践中遇到的真实问题。
除了传统的多元模型之外,书中还介绍了近年来逐渐流行的贝叶斯方法。虽然贝叶斯方法在市场分析中当前还不是主流,但我相信该方法的应用会越来越广泛。书中还专门介绍了相对较新的分析技术,如随机森林和朴素贝叶斯。
作者还在适当的地方对模型的应用进行了延伸。比如在讲到因子分析时,作者讨论了如何使用因子分析结果来绘制消费者“认知图”,这在很多讨论因子分析的文献中极少看到。这也充分反映了作者丰富的实践经验,以及本书以具体实践为导向的特点。
本书覆盖的方法比较全面。基本涉及了市场分析中从初级数据探索到高级数据建模过程中可能用到的各种技术。
本书没有很多数学公式,深入浅出。这使得本书适合于那些没有很强的数学基础但又想学习一些高级分析方法的市场研究人员。
对于R新手来说,本书是一本很好的入门指南。和单纯的R指南不同,本书提供了一个应用的语境,使得读者能够在应用中学习,极大地增强了学习效果。本书不仅讲到了基本的R数据操作,还介绍了一些常用的有效可视化方法。
书中没有过多介绍现在流行的有效机器学习模型,关于这点,之前讲到的两本书《统计学习导论》和《应用预测建模》是极好的补充,如果能系统学习这3本书,就具备成为一个数据科学家的硬性技术条件了。
机械工业出版社的王春华编辑对本书的翻译工作给予了支持和帮助。在此对所有为本书中文版问世做出努力的人表示感谢!限于译者水平,书中难免有错误和不妥之处,恳请读者批评指正。
—林荟
前言
R是市场分析师的绝佳选择。它拟合统计模型的能力无与伦比,对于大型和小型数据集,它可扩展,能以不同形式分析来自不同系统的数据。R生态系统包括大量现存以及正在兴起的统计方法和可视化技术。但是R在市场营销中的应用程度不如其在统计、计量经济、心理和生物信息领域。希望通过大家的努力能改变现状!
本书是为两类人设计的:想要学习R的市场研究从业人员和分析师,想要了解如何将R应用于市场营销的其他领域的学生和研究人员。
阅读本书需要哪些预备知识?很简单,对R在市场营销中的应用感兴趣,对基础统计模型(如线性回归)有概念性的了解,并且愿意亲自动手实践学习。本书对已有一定编程经验并希望学习R的分析师特别有帮助。我们会在第1章中介绍另外一些使用R的原因(以及一些可能不需要使用R的原因)。
动手实践部分非常重要。我们将在前7章循序渐进地介绍(相关知识)并且让读者自行实践书中的案例(代码);本书不是食谱类型的参考书。我们会在第一部分花一些时间(尽量少)介绍R基础知识,然后在第二部分介绍现实中的市场营销问题以及如何应用R。第三部分包含一些高阶市场营销问题。每章都展示了R的分析能力。希望读者在每章中都能学到新鲜有趣的知识。
本书有如下特点:
本书围绕市场营销组织内容。不是给出泛泛的示例,而是结合介绍的方法给出市场营销案例。
我们假定读者有基础统计知识和少量的数学知识。本书是为分析实践者设计的,因此并不会过多地介绍方程和统计模型背后的数学细节(但我们会给出相应参考书目)。
这是一本讲解统计概念和R代码的教科书。它旨在让读者明白我们在干什么以及学会如何避免在应用统计和R时的问题。对比市面上其他参考书和“食谱类”指南,我们的目标在于让本书具有可读性并且能够满足不同读者的需求。
应用章节阐明了渐进的建模过程。我们并没有提供“答案”,而是展示一个分析师在现实工作中可能按何种方式逐步展开分析。其中比较了不同模型的统计可靠性和实用性。
可视化内容是核心分析的一部分。我们并没有将可视化当作独立的话题,而是相信它是数据探索和建模的一个部分。
你从中学到的不仅仅是R。除了核心模型外,本书还涵盖了一些或许对有经验的分析师来说也很陌生的有用模型,如结构方程模型、交易分析。
本书同时介绍了传统方法和贝叶斯方法。核心模型和传统(频率学派)模型一起介绍。但在后面的章节中会介绍线性模型和联合分析中的贝叶斯方法。
大部分分析用模拟数据实践R,并额外提供了关于市场数据结构的信息。根据个人意愿,可以改变模拟数据,看其对统计模型的影响。
在合适的时候我们会给出选学的编程内容或模型知识,读者可根据自身情况选择阅读或跳过。这些小节用* 标注。
本书没有包括什么?首先,本书介绍R在市场营销中的应用但并不讲述市场营销方面的研究。我们会讨论很多市场营销话题但会忽略R中那些重复用到相同分析方法的话题。如前所述,我们从概念上介绍统计模型且并不关注数学细节。由于篇幅原因,本书省略了一些复杂的话题,包括顾客终身价值模型和计量经济时间序列模型。总之,本书全面展示了市场营销研究示例和分析方法。如果掌握了本书,你将能在许多市场营销领域应用R。
为什么我们可以教这些知识?从1997年开始,我们使用R及其前身S语言近30年,这是我们主要的分析平台。我们用R做各种市场分析,从简单的数据总结到复杂的分析(需要自己编写成千上万行的代码)和新模型。
我们也有丰富的R教学经验。本书源自于笔者在美国营销协会(AMA)、埃默里大学市场营销学院和高级研究方法论坛(ART Forum)几年来的课程讲义。我们也在Sawtooth软件会议上和沃顿商学院对学生和业界人士进行R教学。感谢许多学生的反馈意见,我们相信他们的经验会对你们有益。
关于下载数据
本书对应的.R代码文件中的下载数据使用的是短链接地址,如“http://goo.gl/UDv12g” 。在一些国家和地区可能无法访问该链接,会出现这样的错误提示:“Error in file(file, "rt"): cannot open the connection”。如果出现这种情况,请尝试对应的完整链接地址,如“http://r-marketing.r-forge.r-project.org/data/rintro-chapter2.csv”。下面是短链接和对应完整链接的表格。
序言
我们非常高兴看到本书中文版面世。本书英文版的主要目的是深入介绍R在市场研究中的应用。中文版是本书英文版之外的第一个版本,中文版和英文版上市的时间只相隔1年,所以书中的知识都是最新的。感谢译者的翻译!
R的应用在不断飞速发展。如本书第1章提到的,在写书时已经有6000多个R包可供使用。时至今日,R包的数目已经增长到8000个—平均每天增加3个包以上。与此同时R在市场营销方面的学术论文、会议报告以及工业界的使用也在不断增长。R的前景非常广阔,现在是时候学习这门语言了。
我们特别感谢本书的译者林荟和所有为本书中文版问世做出努力的人!我们还要感谢机械工业出版社的工作人员。如果本书能对你们有所帮助,便是对所有这些努力最好的回报。
最重要的是,希望你们能像我们一样喜欢R并且将其用于自己的工作。学习R这样的语言并不容易,我们希望本书能使你的学习轻松些,帮助中国的市场营销人员掌握R。
—Chris Chapman,Elea McDonnell Feit
2016年2月