Hadoop大数据分析技术在线阅读
会员

Hadoop大数据分析技术

迟殿委 陈鹏程主编
开会员,本书免费读 >

计算机网络编程语言与程序设计7万字

更新时间:2023-07-17 19:54:51 最新章节:11.3.5 数据可视化开发

立即阅读
加书架
下载
听书

书籍简介

伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。
品牌:清华大学
上架时间:2022-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

迟殿委 陈鹏程主编
主页

最新上架

  • 这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、
    于君泽 曹洪伟 李伟山 秦金卫 陈龙泉计算机23.3万字
  • 会员
    本书从零开始,介绍了Python编程语言的基础知识。全书共17章,第1-9章介绍了Python的语言基础;第10-13章介绍了与Python编程相关的拓展知识;第14-16章介绍了3个实战项目;第17章介绍了初学者如何利用当下最热门的AI工具ChatGPT学习Python编程。
    袁昕 贾炜编著计算机8.8万字
  • 会员
    本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti
    (英)马杜苏丹·孔达计算机27.5万字
  • 会员
    本书是一份旨在帮助Java求职者在面试中脱颖而出的重要指南。本书涵盖Java并发编程的多个关键主题,如并发原理和线程安全、并发关键字原理、并发锁和死锁、并发容器和工具、并发线程池以及并发设计与实战等。本书的特色在于将“大厂”“名企”的面试问题和实践经验相结合,不仅对面试问题和面试官心理进行深度剖析,还对面试问题解答和相关技术点进行详细介绍,这样更有利于读者全面理解相关知识点和技术,并能够在实际工作
    吴晓勇 梁建全编著计算机17.6万字
  • 会员
    本书是作者转战中国市场和美国市场、操盘上市公司和投资公司、从事管理咨询和管理教育30多年来的商业智慧结晶。面对纷繁复杂、动荡多变、竞争激烈的市场环境,全书展示了作者具有独立性、前瞻性和系统性的思考成果,为处于转型升级关键时刻的中国化妆品企业乃至所有消费品企业的企业家、创业者和管理者提供了有针对性、战略性和可操作性的创新思路和营销建议。本书将顾客需求洞察看作是企业经营的起点和基础,将顾客需求洞察分为
    王茁编著计算机30.9万字
  • 会员
    本书介绍了Docker和Kubernetes的相关知识,可以帮助读者快速了解并熟练配置Kubernetes。本书共分为16章。首先介绍了Docker基础和Docker进阶;然后介绍了Kubernetes的基础操作,包括部署Kubernetes集群、升级Kubernetes、创建及管理Pod等;之后重点介绍了存储管理、密码管理、Deployment、DaemonSet及其他控制器、探针、Job、服务
    段超飞编著计算机8.6万字
  • 会员
    本书主要探讨高并发场景下系统设计的原理和实践案例,帮助读者系统、快速地理解高并发系统的设计原理与相关实践,以及掌握解决高并发场景下可能遇到的各种问题的方法。本书共6章。第1章介绍高并发系统的发展历史、设计难点和基本设计原则,以及度量指标;第2~4章介绍有助于提升高并发系统可用性的3种方法—系统容错、冗余和分片;第5章从提升高并发系统性能的角度讲解并发与异步的原理和实践技巧;第6章从系统运维和团队流
    唐扬计算机11.4万字
  • 会员
    为了帮助服务器开发人员更好地理解服务器框架的设计与开发,本书从零开始,详细阐述游戏服务器设计与开发的流程和技术点,包括网络通信、分布式架构设计、内部RPC通信、数据管理、多线程管理,并从实践的角度出发,配合详细的源码,帮助广大游戏服务器开发人员,或正在考虑从事游戏服务器开发的人员,更加系统地学习服务器架构的设计与开发。本书实用性强,既可以帮助想从事服务器开发的人员快速学习相关知识,又可以帮助服务器
    王广帅编著计算机13.8万字
  • 会员
    本书分为9篇,共35章。第1篇主要介绍基本配置;第2篇主要介绍用户及权限管理;第3篇主要介绍网络相关配置;第4篇主要介绍存储管理;第5篇主要介绍系统管理;第6篇主要介绍软件管理;第7篇主要介绍安全管理;第8篇主要介绍容器管理;第9篇主要介绍自动化管理工具ansible的使用。
    段超飞计算机12.4万字