首页计算机书籍计算机语言《Python 3爬虫、数据清洗与可视化实战》零一 韩要宾 黄园园著
zouzhang

文档

256

关注

0

好评

0
PDF

《Python 3爬虫、数据清洗与可视化实战》零一 韩要宾 黄园园著

阅读 582 下载 0 大小 22.24M 总页数 214 页 2022-11-22 分享
价格:¥ 10.00
下载文档
/ 214
全屏查看
《Python 3爬虫、数据清洗与可视化实战》零一 韩要宾 黄园园著
还有 214 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 214 页,下载后文档不带www.pdfdz.com水印,支持完整阅读内容。
2、古籍基本都为PDF扫描版,所以文档不支持编辑功能,即不支持文档内文字的复制粘贴。
3、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
4、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
5、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
内容简介本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。本书共分11章,6个核心主题:其一是Pythor基础入门,包括环境配置、基本操作、数据类型、语句和函数:其二是Pyho爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击:其三是Python数据库应用,包括MongoDB、MyL在Python中的连接与应用;其四是数据清洗和组织,包括NumPy数组知识、pandas数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用:其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程:最后是数据可视化,包括Matplotlib和Pyecharts两个库的使用,涉及饼图、柱形图、线图、词云图、地图等图形,帮助读者进入可视化的殿堂。本书以实战为主,适合Python初学者及高等院校的相关专业学生,也适合Python培训机构作为实验教材使用。,。,。图书在版编目(CP)数据Python3爬虫、数据清洗与可视化实战/零一,韩要宾,黄园园著.一北京:电子工业出版社,2018.3ISBN978-7-121-33359-0I.①P…Ⅱ.①零…②韩…③黄…Ⅲ.①软件工具一程序设计V.①TP311.561中国版本图书馆CIP数据核字(2017第321885号策划编辑:张慧敏责任编辑:牛勇印刷:三河市良远印务有限公司装订:三河市良远印务有限公司出版发行:电子工业出版社北京市海淀区万寿路173信箱邮编:100036开本:787×9801/16印张:13.25字数:200千字版次:2018年3月第1版印次:2018年3月第1次印刷印数:3000册定价:49.00元凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888,88258888。质量投诉请发邮件至zlts@phei,侵权举报请发邮件至dbqq@phei。本书咨询联系方式:010-51260888-819,faq@phei。Python是一种解释型、面向对象的动态数据类型高级程序设计语言。从20世纪90年代初Python语言诞生至今,它逐渐被广泛应用于各个领域,比如桌面应用开发、游戏开发、Wb开发、网络爬虫、数据统计分析、自然语言处理、机器学习、深度学习、人工智能等。由于Pyho语言的简捷性、易读性及可扩展性,在国外用Pythor进行科学计算的研究机构日益增多。一些知名大学甚至采用Python语言教授程序设计课程,例如麻省理工学院的计算机科学及编程导论课程。在数据科学领域,Python的发展势头十分迅猛。一方面,Python拥有各种开源的网络爬虫框架,可以帮助数据科学家快速收集数据;另一方面,Pytho在机器学习和深度学习方面有很多成熟的拓展包,可以帮助数据科学家完成各类数据分析任务,无论是简单的线性回归,还是复杂的深度学习网络构建。Stack Overflow最新调查显示,Python已经成为快速发展的主流编程语言,也是高收入国家网民访问Stack Overflow网站过程中,点击量最高的标签。由此可见,Python将必成为各个领域的程序员需要掌握的技能之一。黄志洪著名数据分析网站炼数成金创始人我最早是通过《电商数据分析一淘宝实战》一书接触零一的。在该书中,他用相当多的实务案例来告诉读者如何在电商的环境中,用数据做决策,从实践中学知识,令我印象深刻。后来通过CDA的活动认识了零一,发现他是一名数据分析爱好者。在跟他的谈话中,提到的更多的是实务的应用,令我钦佩不已。人工智能的先驱者吴恩达曾说过,一家人工智能的公司必须具备三种能力:其一是有策略的数据采集,其二是集中式的数据仓库及统一的数据分析平台,最后是无所不在的自动化应用。零一的这本书就是教你如何系统化地采集数据、储存数据及应用数据。这本书教大家如何利用Python撰写爬虫程序、清洗和组织数据、解析网页的内容,并将数据储存于数据库中。本书巨细无遗,帮助大家节省时间,是值得一读的好书!李御玺(Yue-Shi Lee)台湾大学资讯工程博士铭传大学资讯工程学系教授
返回顶部