基本信息
- 原书名:Introducing Data Science: Big Data, Machine Learning, and More, Using Python Tools
- 作者: (法)戴维·西伦(Davy Cielen)
- 译者: 王艳
- 丛书名: 数据科学与工程技术丛书
- 出版社:机械工业出版社
- ISBN:9787111578260
- 上架时间:2017-8-17
- 出版日期:2017 年8月
- 开本:16开
- 版次:1-1
- 所属分类:计算机 > 软件与程序设计 > Python
教材

内容简介
作译者
Arno Meysman,企业家及数据科学家。作为数据科学家,Arno兴趣爱好广泛,致力于医学分析、零售和游戏分析。他认为将数据的洞察分析与想象相结合,将在很大程度上帮助我们更好地改善这个世界。
Mohamed Ali,企业家及数据科学咨询顾问。他的兴趣集中在两个领域:数据科学及可持续发展的项目。
目录
前言
关于本书
关于作者
关于封面插图
第1章 大数据世界中的数据科学1
1.1 数据科学和大数据的好处和用途2
1.2 数据种类3
1.2.1 结构化数据3
1.2.2 非结构化数据3
1.2.3 自然语言数据4
1.2.4 计算机数据4
1.2.5 图类数据5
1.2.6 音频、视频和图像数据5
1.2.7 流数据6
1.3 数据科学过程6
1.3.1 设置研究目标6
1.3.2 检索数据6
1.3.3 数据准备7
1.3.4 数据探索7
译者序
数据科学的理论基础包括统计学、机器学习、数据可视化以及某一特定领域的知识。其研究内容包括数据科学基础理论、数据预测模型、数据计算以及数据管理。研究过程包括:数据的获取;对数据集的观测,并发现整体特征;进行数据分析,例如使用数据挖掘技术;发现数据规律,并完成数据预测。
本书第1、2章介绍了数据科学的理论背景和框架,为本书其他章节的学习提供了基础。第3~5章介绍了将机器学习应用在不同的大数据集上的案例。第6~9章介绍了数据科学中一些有趣的主题,如NoSQL数据库、文本挖掘等。在阅读本书前,建议读者对SQL、Python、HTML5以及统计或机器学习有一些了解。本书作者Davy Cielen、Aron D. B. Meysman和Mohamed Ali具有丰富的大数据及数据科学经验,他们分别在比利时和英国联合创立了两家数据科学公司,专注于大数据处理及数据科学相关的研究,并为很多大公司提供数据科学领域的咨询工作。
本书由多位译者联合翻译,其中,王艳翻译了前言、第2、4章和附录D;王丽娜翻译了第1章和第5章;刘义翻译了第3、8章以及附录C;于晨昕翻译了第6、7章以及附录A和附录B;陈南翻译了第9章。感谢机械工业出版社华章公司的编辑在翻译过程中提出的诸多宝贵建议。由于译者的水平及经验有限,难免存在错误和纰漏,恳请广大读者指正。
译者
2017年3月
前言
当谈到原始计算时,人类的大脑只能引领我们走到目前的境地。现在,我们每天都接收到海量的数据,人脑分析已经无法跟上大数据时代信息所包含的潜在内容,我们已掌握的知识更难以满足人类的好奇心。因此,我们利用机器为我们做一部分工作,比如:模式识别,创建连接,以及为人类的众多问题探寻答案。
对知识永无止境的探索是人类的基因,依赖计算机为人类完成一些力所能及的工作是我们的使命。
致谢
非常感谢Manning出版社所有参与本书制作的人员,在你们的帮助下本书得以顺利出版。
感谢Ravishankar Rajagopalan对本书的书稿做了全面细致的技术校对,感谢Jona-than Thoms和 Michael Roberts给了许多专业的建议。另外感谢众多的评审人员,他们在本书的制作过程中提供了许多极有价值的意见反馈,他们是:Alvin Raj, Arthur Zubarev, Bill Martschenko, Craig Smith, Filip Pravica, Hamideh Iraj, Heather Campbell, Hector Cuesta, Ian Stirk, Jeff Smith, Joel Kotarski, Jonathan Sharley, J鰎n Dinkla, Marius Butuc, Matt R. Cole, Matthew Heck, Meredith Godar, Rob Agle, Scott Chaussee, Steve Rogers。
首先,我想感谢我的妻子Filipa,她给了我灵感和动力,让我得以战胜所有的困难。感谢她在我的职业生涯和创作这本书的过程中,始终陪伴在我身边。感谢她担负起家庭的重担,当我不在的时候独自照顾我们的小女儿,让我有了充裕的时间去追求我的目标并实现抱负。谨以此书向我的妻子致敬,非常感谢她为我们的小家庭所做的无私奉献。
同时,我想感谢我的女儿Eva以及我未出生的儿子,他们给了我极大的欢乐并让我笑口常开。他们活泼有趣、充满爱心,是上帝送给我的最好的礼物,也是我所期望的最完美的小孩,和他们在一起总是充满了乐趣。
特别要感谢我的父母,谢谢他们对我长期以来的支持。他们无尽的爱和鼓励让我从容完成了这本书,实现了人生的一个阶段目标,并继续我人生新的旅程。
同时,真诚地感谢同我一起共事的小伙伴们,谢谢大家齐心协力,一起攻坚了一个又一个难题。特别要感谢Mo和Arno,他们给了我最有力的支持和很好的建议。非常感激大家在本书的创作过程中付出的时间和精力,你们棒极了!没有你们,我可能都不会写这本书。
最后,真诚地感谢每一位支持我、理解我的朋友们。我常常忙得没有空闲时间,谢谢你们的关爱和一如既往的支持,让我能够专心创作并完成这本书。
Davy Cielen
非常感谢我的家庭和我的朋友们,他们在我完成本书的过程中,给了我一如既往的支持和鼓励。外面的新鲜事物很多,能在家完成这本书的创作真的很不容易,谢谢大家!特别要感谢我的父母,我的兄弟Jago,还有我亲爱的女朋友Delphine。不管我有什么疯狂的想法和离奇的举动,你们一直坚守在我身边,不离不弃。
同时,谢谢我的教母,还有我的教父,他正在与癌症作斗争,但他们的积极乐观让生活充满了希望。
还要感谢我的朋友们,他们给我买啤酒。也谢谢我女朋友Delphine的父母,她的兄弟Karel和未过门的妻子Tess,谢谢你们的热情款待和美味佳肴。
大家为了美好的生活而努力奋斗着。
最后并且是最重要的一点,我想谢谢本书的合著者也是我的铁哥们Mo,以及本书的另一位合著者Davy,谢谢你们深刻的洞察和独特见解。为了成为一名企业家和数据科学家,我们每天共享跌宕起伏的人生,这是一段多么精彩的旅程,我相信我们的未来会更精彩。
Arno D. B. Meysman
首先最重要的一点是我要感谢我的未婚妻Muhuba,谢谢她的爱、理解、关心和包容。最后,感谢Davy和Arno,和他们一起度过了很多开心时光并让我们的创业梦想成真。他们坚持不懈的奉献是我完成本书至关重要的资源。
Mohamed Ali