少数派 | Matrix : 数据分析必读书目:从入门到精通,都给你安排好了!

本文转自: https://sspai.com/post/89657
仅做个人收藏,版权归原作者所有

作为在数据分析这行待了十多年的老油条,老李坚信,要想成为一名好的数据分析师,书本与实践结合才是硬道理!今天,老李就拿出自己私藏多年的宝藏书单,供大家参考。这里面有我的启蒙书,有读了N遍的经典,还有最近正在膜拜的好书,也有朋友推荐的我的to read list。

以下书籍浅入深,适合不同程度水平的知友参考。

1、入门/科普:

初入门,需要先理解数据分析的思维,并在分析问题时逐渐转变,然后慢慢掌握数据分析的思路、方法和流程。

a.《谁说菜鸟不会数据分析》

经典入门书,涵盖了一到两年的数据分析人员的大部分工作,包括excel技巧、可视化入门、数据分析方法、数据分析方法论、数据处理入门等。隔段时间翻一翻,温故而知新,理解会更深刻。

b.《左手数据,右手图表》

这本书主要是excel的进阶技巧,主要围绕业务,学习制作动态图表,对excel技能提升有很大帮助。书中大篇幅都是案例,会涉及可视化的知识,如何选用图表,模仿着做一遍会有很大提升。

这两本书看一本就行。主要掌握数据分析的思维,会用Excel做简单的分析。

c.《深入浅出》数据系列

《深入浅出数据分析》

入门级别,比较简单,但基本的内容涉及全面,讲解的比较清晰。到这个层面一般要看SQL、数理统计类的专业知识,还有以下两本是同一系列。

《深入浅出统计学》《深入浅出SQL》

d.《Python数据科学手册》

每章介绍一到两个Python数据科学中的重点工具包。适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。对于需要处理大量数据的人而言,这是一本非常有价值的工作书,可以有效率地处理每天面对的问题,像是操作、转换,以及清理数据、可视化不同形式的数据,建立统计学或机器学习的模型等等。

e.《R语言实战》

全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。
 

2、进阶类:

以上偏向技能类。数据分析和挖掘除了对数据分析有一定系统性的认知,更重要的事业务的理解,你需要积累一些实践经验,然后根据业务疏通这些知识/经验,做出严谨有价值的分析报告。

a.《精益数据分析》

主要讲了不同的公司怎么样用数据搭建分析框架,能够将不同的指标运用到现实,对于道德问题提供解决方案。

d.《用数据讲故事》

通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。

f.《数据分析,企业的贤内助》

类似“洗脑式”的书籍(无贬义),以场景和案例入手,站在企业角度、业务角度来叙述数据分析的重要性,挺有道理的,能让你更加坚定数据分析这条路。详细描述了数据分析的整个流程,从方案确定、数据采集、处理、分析、呈现有全面展示。

e.《机器学习实战》

用简单的语言把复杂难懂的机器学习算法解释清楚了,它将机器学习的基础理论与日常数据分析的实际工具相结合。使用灵活的Python编程语言来构建实现数据分类、预测、建议以及汇总和简化等更高级功能的算法的程序。

c.《数据挖掘技术:应用于市场营销、销售与客户关系管理

如何利用最新的数据挖掘方法和技术来解决常见的业务问题。比如提高营销活动的响应率,识别新的客户群并估算信用风险。此外,它涵盖更多高级主题,如准备分析数据以及为公司数据挖掘创建必要的基础架构。

3、高级篇:

当进入高级的时候,这个时候看书已经比之前有了很大的变化了,个人建议如下:并不是看单本书,而是学会快速的看书,因为每本书中可能只有几个模型或者几个点对你有借鉴,那么只精读那几处,速读其他部分;要有自己的理论框架,也就是学会业务建模;要看业务书,并且能够把业务书的知识,固化成可以量化、可以监控的数据模型,和流程模型(这个是高级别很重要的一点,因为要能够快速的切入一个领域,并且能够用数据找到可以优化的办法)。

下面按主题来推荐一些书籍:

a. 用户和整体框架:

《增长黑客》:创业公司的用户与收入增长秘籍。

这本书偏互联网行业,但是顺着同样的思路,去分析每个阶段的用户,并进行运营。

b.数据化运营

《数据化管理》:洞悉零售及电子商务运营。

如果你的数据分析站到了一定高度,尤其是管理,强烈推荐看。能够把数据化管理推行下去,能够帮助提升公司整个的管理水平,也是数据部门对公司的贡献之一。

c.商品管理的书

《品类管理》:教你如何进行商品梳理。

零售业是数据分析应用的大行业,这本书集合了很多传统零售业的经验,从里面学到很多分析模型。

d.供应链

《供应链管理》:高成本、高库存、重资产的解决方案,刘宝红。

他的书可以多看几便,可以加深对企业供应链的认识。

4.大数据

大数据书不算是严格的数据分析实操类书籍,但在当今社会,“大数据”一定是一种趋势,且仍算在数据范畴中。个人认为,这些书籍能帮助我们扩宽视野和思路。

a.《决战大数据》:大数据的关键思考

作者是淘宝大数据专家-车品觉,他的访谈博客也建议大家看一下,淘宝大数据不是盖的。

b.《大数据之路:阿里巴巴大数据实践》

它山之石,可以攻玉,大公司实践的书可以多读,笔者专门为这本书写过两篇读书心得,里面有很多的干货,可以起到开阔视野的作用,对实际工作有借鉴意义,值得精读。

1

c.《机器学习在线:解析阿里云机器学习平台》

1

读这本书是因为《大数据之路:阿里巴巴大数据实践》,里面对于阿里的机器学习平台一笔带过,正好看到阿里新出版了这本书就顺便看了,其实这本书可以叫作平台使用说明书,虽然没有介绍具体的算法,但图文并茂的介绍了如何基于阿里机器学习平台进行挖掘,里面的流程设计和体验感觉不错,企业内要推广机器学习的确需要类似的利器,能较大的降低门槛,笔者会专门写篇文章来介绍,里面还是能看出很多的门道。

d.数据仓库工具箱(第3版):维度建模权威指南》

1

读这本书还是因为《大数据之路:阿里巴巴大数据实践》,因为阿里介绍他们主要使用维度建模,因此还是想系统的理解一下,以前实践做的多,理论的少,现在回过头来还是有更多的感悟,它的维度建模的方法的确不错,但感觉部分翻译有些问题,有些没图示的长段表达有问题。

e.《企业IT架构转型之道(阿里巴巴中台战略思想与架构实战)》

公司同事贴出了这本书,正好看到就去读了,虽然里面大数据中台基本没讲,但其中台的思想的确到处都适用,前面几个关于中台价值和意义的章节写得特别好,说出了我想说但说不出来的感觉,比如很多人质疑建模的价值,你看了会有信心的。

1

f.《我的互联网方法论》

大佬的书读一读总会有启示,本书来回表达了一个核心观点,杀毒软件免费模式改变整个杀毒行业生态,最终赢得客户,是一种破坏性创新。

1

 

说到大数据不得不提一下python,这可能是你学习大数据最简单的一门语言,虽然学好python不等于学好大数据,但是也算从0到0.5的突破了。