基本信息
编辑推荐
与其在茫茫表格中搜索数字,不如将数据图形化,让复杂数据关系一目了然。本书是数据分析和可视化入门首-选,以功能强大的R语言为工具,教你创建各种实用的数据图形,掌握高亮数据中的重要关系和趋势、简化数据形式、突出重点数字等技能。本书适合所有需要数据分析的读者,也可作为统计课程的补充教材,无需数学、统计学或计算机编程背景。
R语言基本知识
创建单变量图,如饼图、箱线图、直方图等
创建双变量图,如散点图、折线图、高密度图等
创建多变量图,如散点图矩阵、三维图、树状图、热图等
配套视频讲解,并可下载App观看AR视频:https://h5.arbook.io/zhuanlan.html?book_id=30&status=bookdetail
内容简介
作译者
【译者简介】
王洋洋
计算机硕士,狂热的数据爱好者。现为云网络安全领域大数据工程师,熟练多种编程语言、大数据技术、机器学习深度学习算法、设计模式等。业余喜欢打羽毛球、练瑜伽,古筝业余3级水平。
目录
第一部分 开始使用 R
第1章 R 基础 2
1.1 下载软件 2
1.2 尝试一些简单的任务 2
1.3 用户界面 5
1.4 安装包:GUI 界面 6
1.5 数据结构 6
1.6 样本数据集 7
1.7 工作目录 9
1.8 将数据导入 R 9
1.8.1 命令行输入 10
1.8.2 使用数据编辑器 11
1.8.3 从外部文件读取 13
1.9 获取脚本 18
1.10 用户自定义函数 20
1.11 开始令人享受的事 21
第2章 R 图概述 24
2.1 图表导出 24
2.2 探索性图表和展示性图表 25
前言
谚语说:“一图胜千言。”有时,一张图也胜过很多数据。相比口头描述细微差别或者辨别成列数字间的关系,通过观察图片或图表更容易把握数据间的复杂关系。本书主要介绍如何使用图形化方法来理解复杂的数据,该方法强调重要的关系和趋势,简化数据形式,并且使大量数据一目了然。
目标读者
任何需要分析数据和可视化数据的人,都能从本书中受益。然而,我的主要目的是使更广泛的人群理解图形数据分析,特别是那些没有太多(或任何)R 相关经验,但又需要或想要创建各种类型的图表来理解重要数据的人。这些人可能来自商业、媒体、平面艺术、社会科学或者健康科学领域,真的需要分析数据,但可能并没有高等数学和计算机编程的背景。虽然本书专为自学设计,但也可作为初中级统计课程或研究的补充材料。
本书使用的工具是R。这不是一本关于R 的内容全面的教材。许多计算机课程和图书都试图告诉你借助一种语言或工具可能做的每一件事。对于曾经想按此方式学习的大多数人来说,这种方式令人感到十分烦恼和无聊。本书将把重点放在理解数据分析的图形元素和如何使用R 生成本书讨论的各种图形,也将展示如何使用R 的一些内置资源来获得帮助,很多其他内容则留给你继续探究。你应该有台可用的计算机,用它可轻松完成一些工作,如发送电子邮件、浏览互联网,或者使用文字处理软件、电子表格等应用程序。熟悉基本的统计知识有利于理解本书的一些主题,但对于大多数主题,这并不是必需的。
为什么选择R
小数据量的图表可以手工制作,但是利用计算机技术会更高效、准确地分析数据,生成有吸引力的图形。对于大批量数据来说,手工处理实际上是不可能的。而运用计算机软件,即使是针对非常大的数据量,也可以生成复杂的图形。
实际上,开源软件已经实现了该技术,只要拥有一台计算机。“开源”指的是所有人均可获取项目的源代码,可检查、使用、自由修改或增加源代码。
开源软件产品可提供免费下载给任何有需要的人。或许你会怀疑免费的东西质量不高,但我向你保证,一些自由软件遵循了最高的专业标准。
本书选用的R 语言是一种编程语言,是一个统计、数学和绘图程序集合,已经被世界各地数百万人使用,包括科学、商业和媒体等领域的许多专业人士。在网站、主要报纸和其他出版物上,你可能见过由R 制作的图形。你也将能够制作出这种专业的数据图表,因为R 可运行在Windows、Mac 或Linux 操作系统上,而现在的PC 和笔记本无非就这几类系统!
如何使用本书
要想从本书获益,你需要动手制作大量图表。为此,阅读本书时,你最好坐在计算机前操作书中给出的所有命令。而且为帮助你提升水平,许多章节除示例以外还提供了练习,比如优化示例代码或将不同的数据集制成另外一张图。最好先做完这些练习再进入下一主题。
排版约定
本书使用了下列排版约定。
· 楷体
表示新术语。
· 等宽字体(constant width)
表示程序片段,以及正文中出现的变量、函数名、数据库、数据类型、环境变量、语句和关键字等。
· 加粗等宽字体(constant width bold)
表示应该由用户输入的命令或其他文本。