基本信息
- 作者: [美]马克·J.班纳特(Mark J. Bennett)德克·L.胡根(Dirk L. Hugen)
- 丛书名: 数据科学与工程技术丛书
- 出版社:机械工业出版社
- ISBN:9787111658214
- 上架时间:2020-7-5
- 出版日期:2020 年7月
- 开本:16开
- 页码:324
- 版次:1-1
- 所属分类:计算机 > 软件与程序设计 > 综合 > 高级程序语言设计

编辑推荐
基于R语言的
金融分析
Financial Analytics with R
Building a Laptop Laboratory for Data Science
[ 美 ] 马克·J. 班纳特(Mark J. Bennett)
德克·L. 胡根(Dirk L. Hugen) 著
朱轩彤 董宁 岳蕾 吕指臣 译
内容简介
目录
前言
第1章 分析性思维 1
1.1 什么是金融分析 1
1.2 什么是数据科学笔记本电脑实验室 2
1.3 什么是R语言,如何将其用于专业分析领域 4
1.4 习题 5
第2章 统计计算使用的R语言 6
2.1 R语言入门 6
2.2 语言功能:函数、赋值、参数和类型 9
2.3 语言功能:绑定和数组 11
2.4 错误处理 14
2.5 数字、统计和字符函数 15
2.6 数据帧和输入/输出 16
2.7 列表 17
2.8 习题 19
第3章 金融统计学 20
3.1 概率 20
3.2 排列组合 21
3.3 数学期望 27
前言
电子表格软件的出现使分析师们的分析性思维提升到了新的层级。活生生的手工计算不再仅限于一个维度。每一行或每一列都可以显示一个时间维度、一个生产类别或一个业务场景。自动化的依赖功能使修改变得非常容易。现在,基于大型计算机分析程序的电子表格可以用来制作更复杂、更持久的分析产品的原型。
有了R语言和Python这样的现代编程语言,如今一个熟练的分析师可以用雅虎或其他免费历史报价服务等资源,设计其分析逻辑,这大大减少了他们的工作量。有人说Python的语法非常简洁,以至于实现与Java程序相同的功能,代码行数仅为Java的四分之一。我们怀疑R语言与之类似。一个小型的金融实验室可以建立在一台笔记本电脑上,几周内花费不到200美元,能根据需要模拟多个市场变量。或者,通过具有更多驱动空间的高端笔记本电脑,能以前所未有的规模装载整个市场10~20年的历史数据。
实验室一旦建成,人们就可以开始进行深刻理解。“知识发现”曾经是人类成长过程中的一个术语。现在我们讨论的是计算机自动化。“知识发现”似乎是一个大胆的术语,对于计算机程序所能创造的任何东西来说,都有点过于雄心勃勃。例如,计算机科学领域中,计算机协会(ACM)有一个名为知识发现和数据挖掘(KDD)的特殊兴趣小组。但几乎没有人会挑战其中的“数据挖掘”部分。毕竟,对于统计学家和计算机科学家来说,掌握数据就是他们的工作。但是用机器发现知识,自动分析数据,这会是真的吗?在现在看来,这似乎有点夸张了。然而,我们再体验一遍本书描述的算法,很快就意识到,使用数据科学技术的这些程序,不仅可以自动进行非常烦琐的计算,而且可以对人类思维水平产生积极、深刻的影响。
也许人们可以用体育运动来类比这种体验。在许多运动中,我们都用防守来保护我们现在的位置,防止对手再得分。进攻是一种按顺序运用运动专长,从而能多得分的能力。KDD的数据挖掘部分可以被认为是防守,即运动中纪律性更强、组织更严密的一方。只要成功一次就是有效的,如伸出手来阻挡传球,投一个曲线球来防止击球手在球场上连续传球。另一方面,“知识发现”是一种进攻性的技能,它超越了所需和预期的数据分析,类比于体育运
动,是创造性的一方。在进攻方面,只有一系列的比赛都成功才能取得进步,如足球比赛需要全配合进球得分,或者棒球在三次出局得分之前连续三次击垒。进攻成功的可能性较小。
因此,在KDD模型和体育运动的类比中,数据挖掘是防御,知识发现是进攻。实现知识发现虽然罕见,却会产生惊人的影响。知识发现可以像人类的想法一样强大,并能进一步增强它们。例如,我们可能会发现有一种公开交易的股票具有独特的理想属性。KDD领域触及了这些机器在计算机科学的所有进步中所能做到的极限。
1968年,在好莱坞电影和小说《太空漫游》中,作者Arthur C. Clarke预测了自动推理、自然语言语音识别、视频通话和面部识别等技术。HAL9000计算机控制着飞往木星的飞船,同时与宇航员Frank Poole博士进行对话和下棋,并监控着300多名宇航员的生活状况。从那时起,计算机科学,特别是模拟科学,在许多领域对研究和发现过程产生了巨大的影响,并有效地实现了许多科幻小说的目标。除此之外,还有计算生物学、计算宇宙学和计算语言学等领域也取得了长足的发展,如图1所示。
本书关注的是计算机模拟技术。计算机模拟技术已经取得了巨大的成功,现在已被广泛接受,它是除了理论和物理实验之外的第三种科学方法。运用书中知识可以帮助我们建立一个金融模拟实验室。本书是芝加哥大学格雷厄姆学院分析学硕士项目的研究生财务分析课程和艾奥瓦大学蒂皮商学院财务系的本科生投资课程的研究材料。也可作为具有良好数学背景和计算机科学背景的高等院校本科生的教材。
想要更好地理解本书,读者最好学习过统计分析、概率和统计等课程,或者了解本书所涉及的数学统计知识,大部分所需资料都已在正文和附录中介绍。读者最好具备本科水平的微积分、线性代数和计算机科学背景,熟悉一种或多种程序设计语言,如C、C++、Java、C#、Python或Matlab。但读者无须具备财务背景。当然,任何关于R语言的经验都是有用的。
比起用电子表格,用R语言构建的计算机模拟金融可能更复杂、更具挑战性。当定量优化器的逻辑从周围的程序代码中即时显示时,可以更好地控制和定制定量优化器。我们的读者需要更多的计算机科学知识来构建更鲁棒和复杂的平台,以及深入理解编译器和运行时系统。但当完成这些后,金融分析的构建者、运营商或学生会逐渐认识到用设计语言进行统计模拟的优势。构建模拟器和从观察模拟中获得的见解将有助于加深对未来专业领域的理解。那些观点,现在看来是关于机器的,但是对于人们来说却总是关于学习的。
图1来自计算生物学、计算宇宙学和计算语言学的样本图像
数据科学涉及统计和计算模型的研究。在这本书中,意味着我们正在释放金融市场中存在的经济价值。数据工程是在计算机上把文件、程序逻辑、测试和持续改进等实现应用于大型数据集的模型的过程。每章末尾的习题将引导我们利用之前章节中的数据科学原理来构建和设计我们的金融实验室。
做这些练习时,可能需要不时地安装各种R语言包。通过互联网,读者可找到加载R语言包、排除故障的正确说明。涉及的语言包、条件和用例太多,在此无法一一说明。
为便于我们了解逻辑和数据,习题有不同的侧重。新的内容都建立在对前期知识的理解之上,以适应我们进行财务分析所需的复杂程度。
媒体评论
——Joseph M. Hilbe, 亚利桑那州立大学
“这是一站式的解决方案,涵盖你使用R语言进行金融分析所需要知道的一切知识。这本书将R语言培训和金融分析相关问题解决方案有机结合,还结合了近期极端金融事件的例子,如房贷危机和欧元危机。本书提供了很多相关代码,如计算夏普比率或实现贝叶斯推理的函数,并回答你在尝试编程时可能遇到的许多问题。无论你的目标是什么,这本书都会帮助你成为一个更好的实践者/学生/分析师/企业家。”
——Carrie Shaw, Quandl公司
“这本书对于初学者来说是不寻常的,对于把R语言当作一个通用的数字处理工具来说也是不寻常的。这也是少数真正为非统计学家和非程序员编写的R语言教程之一。 对于STEM学生来说,学习一种编程语言是有益的,R语言也是一种可行的编程语言。这本书是实现这一目标的最佳选择。”
Robert W. Hayden, 美国数学协会评论(www.maa.org)