基本信息
- 作者: [美] 迈克尔·弗里曼(Michael Freeman), 乔尔·罗斯(Joel Ross)[美] 贾里德· P. 兰德(Jared P. Lander)
- 丛书名: 数据科学与工程技术丛书
- 出版社:机械工业出版社
- ISBN:9782001061555
- 上架时间:2020-1-6
- 出版日期:2019 年11月
- 开本:16开
- 页码:732
- 版次:1-1
- 所属分类:计算机 > 数据库 > 数据库存储与管理

编辑推荐
---------------------------数据科学之编程技术:使用R进行数据清理、分析与可视化---------------------------
数据科学之编程技术
使用R进行数据清理、分析与可视化
[ 美 ] 迈克尔·弗里曼(Michael Freeman) 乔尔·罗斯(Joel Ross)著
华盛顿大学华盛顿大学
张燕妮 译
Programming Skills for Data Science
Start Writing Code to Wrangle, Analyze, and Visualize Data with R
---------------------------R语言:实用数据分析和可视化技术(原书第2版)---------------------------
资深数据专家凝炼数十年教学和实践经验,全面阐释如何使用R语言20%的功能完成80%的现代数据工作
内容简介
计算机书籍
---------------------------数据科学之编程技术:使用R进行数据清理、分析与可视化---------------------------
本书围绕使用R进行数据科学编程所需的实际步骤展开,介绍了有关该主题的工具和技术的整个系统。书中共分为六大部分。第一部分介绍了如何下载和安装书中涉及的各种软件;第二部分介绍了项目管理的基础技术,包括跟踪代码的版本并生成文档;第三部分介绍了R编程语言,它是整本书使用的主要开发语言;第四部分介绍了如何在R中加载、格式化、遍历和重塑数据;第五部分介绍了数据科学中数据可视化的原则以及如何利用R构建数据可视化;第六部分介绍了如何用两种不同的方法创建交互平台来分享自己的观点,以及如何拓展自己的知识。
---------------------------R语言:实用数据分析和可视化技术(原书第2版)---------------------------
本书借鉴数据科学家Jared P. Lander在R语言上丰富的教学经验,通过大量实例,详细讲解R语言的核心功能。对于刚接触统计程序和模型的人,本书的内容组织结构使得学习R语言相当简单和直观。本书主要介绍R语言中20%的核心功能,但是这20%的功能足以让你解决80%的现代数据分析。
书中每一章都是从基础知识开始,提供大量的实例和代码。你将学习下载和安装R语言;设置和使用R语言环境;掌握基本的程序编写,数据导入、操作和可视化;完成几个测验。然后在此基础上,你将构建几个完整的模型,包括线性和非线性模型,学习数据挖掘技术。接着你将在代码中学习使用LaTeX,RMarkdown和Shiny等R语言包。
目录
---------------------------数据科学之编程技术:使用R进行数据清理、分析与可视化---------------------------
译者序
序
前言
第一部分 开始
第1章 设置计算机2
1.1 设置命令行工具3
1.1.1 Mac上的命令行3
1.1.2 Windows上的命令行3
1.1.3 Linux上的命令行3
1.2 安装git3
1.3 创建GitHub账户4
1.4 选择一个文本编辑器4
1.4.1 Atom4
1.4.2 Visual Studio Code5
前言
---------------------------数据科学之编程技术:使用R进行数据清理、分析与可视化---------------------------
将数据转换为有意义的信息需要一种能力,即清晰且可再现地清理、分析和可视化数据。这些技能是数据科学领域的基础,该领域增强了我们对从疾病传播到种族不平等等问题的整体理解。而且,研究人员和专业人员通过编程与数据进行交互,能够快速发现并沟通数据中通常难以检测的模式。理解了如何编写代码来处理数据之后,有助于人们使用新的、更大规模的方式进行信息处理。
自由、开源软件的存在,使得任何人都可以在计算机上使用这些工具。本书的目的是教人们如何通过编程探讨数据集中所隐藏的问题。
本书目的
本书围绕使用R进行数据科学编程所需的实际步骤展开。全书着眼于该主题,介绍了有关该主题的工具和技术的整个生态系统。虽然编写代码是成为数据科学家(以及本书)的核心部分,但获得更多的基础技能也是这个过程中必不可少的。数据科学要安装和配置软件以编写、执行和管理代码,跟踪项目版本变动,利用计算机科学的核心概念来理解如何完成给定任务,访问并处理各种不同来源的数据,利用可视化手段来揭示数据中的模式,构建与他人共享观点的应用程序。本书的目的是帮助人们在这些领域打下坚实基础,以便能进入数据科学领域(或将数据科学引入他们工作的领域中)。
本书读者
本书是为那些没有编程或数据科学经验的人编写的,但是它对那些活跃在该领域的人也很有帮助。本书最初是为了支持华盛顿大学信息学本科学位课程而编写的,因此(毫不奇怪)它非常适合有兴趣进入数据科学领域的大学生。我们相信任何需要与数据打交道的人都可从本书中学到如何再现地分析、可视化以及创建报告。
如果你有意从事数据科学,或者你经常使用数据并希望通过编程技术从数据中获取信息,那么这本书正适合你。
本书结构
本书分为6个部分,每个部分的要点如下。
第一部分:开始
本部分讲述了下载和安装本书其他部分所需软件的步骤。更具体地说,第1章详细介绍了如何安装文本编辑器、Bash终端、R解释器和RStudio程序。然后,第2章描述了如何使用命令行进行基本的文件系统浏览。
第二部分:项目管理
本部分介绍了项目管理的基础技术,包括跟踪代码的版本和生成文档。第3章介绍了用于逐行跟踪代码变化的git软件,以及流行的代码托管和协作服务GitHub。然后,第4章描述了如何使用Markdown生成结构和样式良好的文档,这些文档用于共享和展示数据。
第三部分:R的基本技能
媒体评论
---------------------------数据科学之编程技术:使用R进行数据清理、分析与可视化---------------------------
Michael Freeman和Joel Ross为立志从事数据科学的新手提供了学习基本编程技能的权威资源。
——Jared Lander,丛书编辑
本书包括可将不同领域的原始数据转换成有价值的情报所需的基础技术,涉及的科学领域涵盖从城市规划到精密医学,即使是没有编程或者数据科学经验的新手也可学习。
Michael Freeman与Joel Ross这两位专家从安装和配置可用来解决专业级数据科学问题的工具开始讲解,这些工具包括广泛使用的R语言、RStudio集成开发环境和Git版本控制系统。他们在书中解释了如何将数据清理成可用的格式,以及如何分析和可视化数据,以便让他人了解你所揭示的规律。紧接着,本书还讲述了以新方式、大规模探索数据的强大的R语言编程技能。全书通篇使用的实例和真实练习可帮助读者快速分析自己的数据集,并获取可付诸实际的答案。
本书内容包括:
? 安装完整的数据科学环境,包括R和RStudio
? 使用GitHub对数据科学项目进行托管、管理和协作
? 掌握R语言基础:语法、编程概念和数据结构
? 为了成功分析,加载、格式化、探索并重构数据
? 与数据库和Web API进行交互
? 生成吸引人的、交互式的、准确和直观的可视化表示
? 与其他数据科学团队成员顺利合作