对照Excel,零基础学Python数据分析txt电子书

简介: 本书主要介绍如何使用Python处理Excel数据。本书内容分为三大部分:第一部分主要介绍数据分析的概念和Python基础;第二部分通过蜂蜜电商数据分析案例详细介绍数据分析的技术要点,包括读写Excel文件所需的xlwings库和openpyxl库、数据分析的pandas核心库,以及数据可视化常用的Matplotlib库和Seaborn库;第三部分包括个人消费贷款数据分析和螺蛳粉连锁店销售数据分析

第1章

数据分析基础知识

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析与汇总,以便理解与利用,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息并形成结论而对数据加以详细研究和概括总结的过程。数据分析的数学基础在20世纪早期就已经确立,但一直受限于工具,直到计算机的出现,数据分析的实践才具有可能性,并得以推广。因此现代的数据分析是数学与计算机科学相结合的产物。

1.1

为什么要做数据分析

数据分析的目的是把隐藏在大量看起来杂乱无章的数据中的信息集中和提炼出来,从而找出研究对象的内在规律,供企业参考,以避免决策的盲目性和自发性。但是需要注意的是,数据分析只是根据过往的经验进行统计分析,不能作为决策时的绝对依据,因为过往的经验基于的是过去的形势,而决策只能依据当前形势,如果不看当前形势是否发生了变化,仅凭过往经验去决策,很容易犯错。从这一点来说,数据分析只能辅助决策,作为决策的参考,而决策本身必须根据自身情况和当前形势来确定。

一个人在做决策时常常需要回答3个问题。

我是谁?明确自己的定位,能做什么,不能做什么。明确自己的能力,能力必须匹配你所能做的事情。

我要做什么?根据自己的能力选择自己的方向和目标,相信读者也听过这句名言:“选择比努力更重要。”

我应该怎么做?明确了自己的能力,选择了自己的方向和目标后,就要考虑如何落实了。

企业在做决策时也需要面对类似的3个问题。

企业的业务方向是什么,能力如何?明确企业是做什么的,以及在行业的地位和现有的实力,能做什么不能做什么。

企业当前要做什么?明确企业是要延续现有的业务,还是开启新业务,新旧业务的前景如何,机遇和挑战各自是什么。

企业应该怎么开展后续的业务?明确企业现在存在的问题,以及如何改正。如果要开启新业务,那么应如何开展,如何规避风险、提高效益等。

总的来说,数据分析的作用主要是分析现状、分析具体问题和预测未来,从而达到辅助决策的目的。

1.1.1 分析现状

数据分析的一个重要目标是对现状进行分析,让企业知道现今的状况如何,一般的现状又分为以下两方面。

● 企业整体运营的情况,一般通过财务报表进行分析,比如资产负债表、损益表和现金流量表三大报表,这些是企业运营中最重要的报表,借助它们可以从整体上分析企业运营的情况。

● 企业的业务往往是由各种业务组成的,这些业务错综复杂,甚至彼此存在关联。因此还需要分析企业的业务构成,还有它们的变化趋势以及关联度,这样才能动态且准确地掌握企业运营情况。比如旧业务是持续兴旺,还是快速衰败;新业务是在萌芽阶段,还是在快速崛起或者已经处于成熟阶段,如果可以使用数据分析的方法去监控这些数据,就很有利于企业对业务进行调整。

一般来说可以分析企业的日报、旬报、月报、季报和年报等,从不同的时间维度来监控企业运营的情况以做出相应的决策。

1.1.2 分析具体问题

一般来说,进行整体分析后,对数据的分析会集中在业务问题上,比如分析哪些产品是人们喜欢的,哪些产品是人们不喜欢的。通过数据分析,对于人们喜欢但供应不足的产品,应该考虑增加供应;对于人们不喜欢但供应过多的产品,应该考虑减少供应。这样的分析对于管理人员也是有用的,比如在一个项目中,个人的能力肯定是参差不齐的,那么就要分析哪些员工能力强,可以多委派些工作,哪些员工能力弱,需要培训和改进,从而提高团队的整体能力,减少项目的风险。

1.1.3 预测未来

对现有业务的分析,有时还需要预测未来的情况。比如奶茶业,受地域位置的影响,北京的奶茶业肯定是很难和广州的奶茶业相比的,因为广州位于亚热带,气温高、夏季时间长,人们对奶茶的需求更大;同时,奶茶业也受季节的影响,冬天喝冷饮的人总体较少。用历年的销售数据来预测未来什么产品应该减少,什么产品应该增加,甚至对应的产品应该减少多少或增加多少等,都需要进行数据分析,才能做出更为准确和合理的判断,以指导企业的规划。

版权:人民邮电出版社