在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,...
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
本书共包含13章,第一部分介绍NumPy和pandas的基本内容;第二部分介绍pandas库中的4类操作,包括索引、分组、变形和连接;第三部分介绍基于pandas库的4类数据,包括缺失数据、文本据、分类数据和时间序列数据,并介绍这4类数据的处理方法;第四部分介绍数据观测、特征工程和性能优化的相关内容。本书以丰富的练习为特色,每章的最后一节为习题,同时每章包含许多即时性的习(练一练)。读者可通过这些练习将对数据科学的宏观认识运用到实践中。
pandas数据处理与分析是2022年由人民邮电出版社出版,作者耿远昊。
版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《pandas数据处理与分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。