您当前的位置:首页 > hadoop

Hadoop高级编程——构建与实现大数据解决方案(Professional Hadoop Solutions ) 高清晰PDF 中英文版

中文书名:高级编程——构建与实现大数据解决方案C6Alinux系统宝典
原书名:Professional Hadoop Solutions C6Alinux系统宝典
原出版社: Wrox C6Alinux系统宝典
作者: [美]Boris Lublinsky    Kevin T. Smith    Alexey Yakubovich    C6Alinux系统宝典
译者: 穆玉伟 靳晓辉 C6Alinux系统宝典
出版社:清华大学出版社 C6Alinux系统宝典
ISBN:9787302369066C6Alinux系统宝典
上架时间:2014-7-17C6Alinux系统宝典
出版日期:2014 年7月C6Alinux系统宝典
开本:16开C6Alinux系统宝典
页码:425C6Alinux系统宝典
版次:1-1C6Alinux系统宝典

C6Alinux系统宝典

如果你已经准备好要充分实施大规模可扩展性数据分析工作,那么需要知道如何利用Hadoop技术。这本《Hadoop高级编程——构建与实现大数据解决方案》可以帮助你做到这一点!本书关注用于构建先进的、基于Hadoop的企业级应用的架构和方案,并为实现现实的解决方案提供深入的、代码级的讲解。《Hadoop高级编程——构建与实现大数据解决方案》还会带你领略数据设计以及数据设计如何影响实现。本书解释了MapReduce的工作原理,并展示了如何在MapReduce中重新定制特定的业务问题。在整本书中,你将会发现深入的Java代码示例,这些代码示例可以直接使用,它们均源自于已经成功地构建和部署的应用程序。C6Alinux系统宝典

作译者C6Alinux系统宝典

Boris Lublinsky是诺基亚的一名资深架构师,他在诺基亚积极参与了无数聚焦于技术架构、面向服务架构(Service-Oriented Architecture,SOA)和集成项目等企业级应用的所有阶段。他也是诺基亚架构委员会的一名活跃会员。Boris是多家行业杂志中80多篇出版物的作者,同时也是Service-Oriented Architecture and Design Strategies (Indianapolis: Wiley, 2008)一书的合著者。此外,他是InfoQ在SOA和大数据领域的一名编辑,并经常在行业会议上演讲。在过去的两年里,他参与了多个基于Hadoop和Amazon Web Services (AWS)应用的设计和实现。他现在是芝加哥地区Hadoop用户组的活跃成员、工作组织者和撰稿人。C6Alinux系统宝典

Kevin T. Smith是Novetta Solutions公司应用事业解决方案(ASM)部门的技术解决方案和推广总监,他提供策略性的技术领导并为客户开发创新性的、聚焦于数据的、高度安全的解决方案。他经常在技术会议上演讲,是无数Web服务、云计算、大数据和网络安全相关技术文章的作者。他撰写了很多技术书籍,包括Applied SOA: Service-Oriented Architecture and Design Strategies (Indianapolis: Wiley, 2008)、The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management (Indianapolis: Wiley, 2003)、Professional Portal Development with Open Source Tools (Indianapolis: Wiley, 2004)、More Java Pitfalls (Indianapolis: Wiley, 2003)以及其他书籍。C6Alinux系统宝典

Alexey Yakubovich是Hortonworks的一名系统架构师。他在Hadoop/Big Data环境中为不同的公司和项目工作了5年:PB量级存储、流程自动化、自然语言处理(Natural Language Processing,NLP)、来自移动设备的数据流的数据科学和社交媒体。更早些时候,他工作于SOA、Java 2企业版(J2EE)、分布式应用和代码生成等技术领域。他通过解决Hilbert第一问题的最后部分获得了数学博士学位。他是MDA OMG工作组的一名成员,并参与和出席美国芝加哥地区的Hadoop用户组。C6Alinux系统宝典

目录C6Alinux系统宝典
《Hadoop高级编程——构建与实现大数据解决方案》 C6Alinux系统宝典
第1章 大数据和Hadoop生态系统 1 C6Alinux系统宝典
1.1 当大数据遇见Hadoop 2 C6Alinux系统宝典
1.1.1 Hadoop:直面大数据的挑战 3 C6Alinux系统宝典
1.1.2 商业世界中的数据科学 4 C6Alinux系统宝典
1.2 Hadoop生态系统 6 C6Alinux系统宝典
1.3 Hadoop核心组件 7 C6Alinux系统宝典
1.4 Hadoop发行版 9 C6Alinux系统宝典
1.5 使用Hadoop开发企业级应用 10 C6Alinux系统宝典
1.6 小结 14 C6Alinux系统宝典
第2章 Hadoop数据存储 15 C6Alinux系统宝典
2.1 HDFS 15 C6Alinux系统宝典
2.1.1 HDFS架构 15 C6Alinux系统宝典
2.1.2 使用HDFS文件 19 C6Alinux系统宝典
2.1.3 Hadoop特定的文件类型 21 C6Alinux系统宝典
2.1.4 HDFS联盟和高可用性 26 C6Alinux系统宝典
2.2 HBase 28 C6Alinux系统宝典
2.2.1 HBase架构 28 C6Alinux系统宝典
2.2.2 HBase结构设计 34 C6Alinux系统宝典
2.2.3 HBase编程 35C6Alinux系统宝典

2.2.4 HBase新特性 42 C6Alinux系统宝典
2.3 将HDFS和HBase的组合用于高效数据存储 45 C6Alinux系统宝典
2.4 使用Apache Avro 45 C6Alinux系统宝典
2.5 利用HCatalog管理元数据 49 C6Alinux系统宝典
2.6 为应用程序选择合适的Hadoop数据组织形式 51 C6Alinux系统宝典
2.7 小结 53 C6Alinux系统宝典
第3章 使用MapReduce处理数据 55 C6Alinux系统宝典
3.1 了解MapReduce 55 C6Alinux系统宝典
3.1.1 MapReduce执行管道 56 C6Alinux系统宝典
3.1.2 MapReduce中的运行时协调和任务管理 59 C6Alinux系统宝典
3.2 第一个MapReduce应用程序 61 C6Alinux系统宝典
3.3 设计MapReduce实现 69 C6Alinux系统宝典
3.3.1 将MapReduce用作并行处理框架 70 C6Alinux系统宝典
3.3.2 使用MapReduce进行简单的数据处理 71 C6Alinux系统宝典
3.3.3 使用MapReduce构建连接 72 C6Alinux系统宝典
3.3.4 构建迭代式MapReduce应用程序 77 C6Alinux系统宝典
3.3.5 是否使用MapReduce 82 C6Alinux系统宝典
3.3.6 常见的MapReduce设计陷阱 83 C6Alinux系统宝典
3.4 小结 84 C6Alinux系统宝典
第4章 自定义MapReduce执行 85 C6Alinux系统宝典
4.1 使用InputFormat控制MapReduce执行 85 C6Alinux系统宝典
4.1.1 为计算密集型应用程序实现InputFormat 87 C6Alinux系统宝典
4.1.2 实现InputFormat以控制Map的数量 93 C6Alinux系统宝典
4.1.3 实现用于多个HBase表的InputFormat 99 C6Alinux系统宝典
4.2 使用自定义RecordReader以自己的方式读取数据 102 C6Alinux系统宝典
4.2.1 实现基于队列的RecordReader 102 C6Alinux系统宝典
4.2.2 为XML数据实现RecordReader 105 C6Alinux系统宝典
4.3 使用自定义输出格式组织输出数据 109 C6Alinux系统宝典
4.4 使用自定义记录写入器以自己的方式写入数据 119 C6Alinux系统宝典
4.5 使用组合器优化MapReduce执行 121 C6Alinux系统宝典
4.6 使用分区器控制Reducer执行 124 C6Alinux系统宝典
4.7 在Hadoop中使用非Java代码 128 C6Alinux系统宝典
4.7.1 Pipes 128 C6Alinux系统宝典
4.7.2 Hadoop Streaming 128 C6Alinux系统宝典
4.7.3 使用JNI 129 C6Alinux系统宝典
4.8 小结 131 C6Alinux系统宝典
第5章 构建可靠的MapReduce应用程序 133 C6Alinux系统宝典
5.1 单元测试MapReduce应用程序 133 C6Alinux系统宝典
5.1.1 测试Mapper 136 C6Alinux系统宝典
5.1.2 测试Reducer 137 C6Alinux系统宝典
5.1.3 集成测试 138 C6Alinux系统宝典
5.2 使用Eclipse进行本地应用程序测试 139 C6Alinux系统宝典
5.3 将日志用于Hadoop测试 141 C6Alinux系统宝典
5.4 使用作业计数器报告指标 146 C6Alinux系统宝典
5.5 MapReduce中的防御性编程 149 C6Alinux系统宝典
5.6 小结 151 C6Alinux系统宝典
第6章 使用Oozie自动化数据处理 153 C6Alinux系统宝典
6.1 认识Oozie 154 C6Alinux系统宝典
6.2 Oozie Workflow 155 C6Alinux系统宝典
6.2.1 在Oozie Workflow中执行异步操作 159 C6Alinux系统宝典
6.2.2 Oozie的恢复能力 164 C6Alinux系统宝典
6.2.3 Oozie Workflow作业的生命周期 164 C6Alinux系统宝典
6.3 Oozie Coordinator 165 C6Alinux系统宝典
6.4 Oozie Bundle 170 C6Alinux系统宝典
6.5 用表达式语言对Oozie进行参数化 174 C6Alinux系统宝典
6.5.1 Workflow函数 175 C6Alinux系统宝典
6.5.2 Coordinator函数 175 C6Alinux系统宝典
6.5.3 Bundle函数 175 C6Alinux系统宝典
6.5.4 其他EL函数 175 C6Alinux系统宝典
6.6 Oozie作业执行模型 176 C6Alinux系统宝典
6.7 访问Oozie 179 C6Alinux系统宝典
6.8 Oozie SLA 180 C6Alinux系统宝典
6.9 小结 185 C6Alinux系统宝典
第7章 使用Oozie 187 C6Alinux系统宝典
7.1 使用探测包验证位置相关信息的正确性 187 C6Alinux系统宝典
7.2 设计基于探测包的地点正确性验证 188 C6Alinux系统宝典
7.3 设计Oozie Workflow 190 C6Alinux系统宝典
7.4 实现Oozie Workflow应用程序 193 C6Alinux系统宝典
7.4.1 实现数据准备Workflow 193 C6Alinux系统宝典
7.4.2 实现考勤指数和聚类探测包串Workflow 201 C6Alinux系统宝典
7.5 实现 Workflow行为 203 C6Alinux系统宝典
7.5.1 发布来自java动作的执行上下文 204 C6Alinux系统宝典
7.5.2 在Oozie Workflow中使用MapReduce作业 204 C6Alinux系统宝典
7.6 实现Oozie Coordinator应用程序 207 C6Alinux系统宝典
7.7 实现Oozie Bundle应用程序 212 C6Alinux系统宝典
7.8 部署、测试和执行Oozie应用程序 213 C6Alinux系统宝典
7.8.1 部署Oozie应用程序 213 C6Alinux系统宝典
7.8.2 使用Oozie CLI执行Oozie应用程序 215 C6Alinux系统宝典
7.8.3 向Oozie作业传递参数 218 C6Alinux系统宝典
7.9 使用Oozie控制台获取Oozie应用程序信息 221 C6Alinux系统宝典
7.9.1 了解Oozie控制台界面 221 C6Alinux系统宝典
7.9.2 获取 Coordinator作业信息 225 C6Alinux系统宝典
7.10 小结 227 C6Alinux系统宝典
第8章 高级Oozie特性 229 C6Alinux系统宝典
8.1 构建自定义Oozie Workflow动作 230 C6Alinux系统宝典
8.1.1 实现自定义Oozie Workflow动作 230 C6Alinux系统宝典
8.1.2 部署Oozie自定义Workflow动作 235 C6Alinux系统宝典
8.2 向Oozie Workflow添加动态执行 237 C6Alinux系统宝典
8.2.1 总体实现方法 237 C6Alinux系统宝典
8.2.2 一个机器学习模型、参数和算法 240 C6Alinux系统宝典
8.2.3 为迭代过程定义Workflow 241 C6Alinux系统宝典
8.2.4 动态Workflow生成 244 C6Alinux系统宝典
8.3 使用Oozie Java API 247 C6Alinux系统宝典
8.4 在Oozie应用中使用uber jar包 251 C6Alinux系统宝典
8.5 数据吸收传送器 256 C6Alinux系统宝典
8.6 小结 263 C6Alinux系统宝典
第9章 实时Hadoop 265 C6Alinux系统宝典
9.1 现实世界中的实时应用 266 C6Alinux系统宝典
9.2 使用HBase来实现实时应用 266 C6Alinux系统宝典
9.2.1 将HBase用作图片管理系统 268 C6Alinux系统宝典
9.2.2 将HBase用作Lucene后端 275 C6Alinux系统宝典
9.3 使用专门的实时Hadoop查询系统 295 C6Alinux系统宝典
9.3.1 Apache Drill 296 C6Alinux系统宝典
9.3.2 Impala 298 C6Alinux系统宝典
9.3.3 实时查询和MapReduce的对比 299 C6Alinux系统宝典
9.4 使用基于Hadoop的事件处理系统 300 C6Alinux系统宝典
9.4.1 HFlame 301 C6Alinux系统宝典
9.4.2 Storm 302 C6Alinux系统宝典
9.4.3 事件处理和MapReduce的对比 305 C6Alinux系统宝典
9.5 小结 305 C6Alinux系统宝典
第10章 Hadoop安全 307 C6Alinux系统宝典
10.1 简要的历史:理解Hadoop安全的挑战 308 C6Alinux系统宝典
10.2 认证 309 C6Alinux系统宝典
10.2.1 Kerberos认证 310 C6Alinux系统宝典
10.2.2 委派安全凭据 318 C6Alinux系统宝典
10.3 授权 323 C6Alinux系统宝典
10.3.1 HDFS文件访问权限 323 C6Alinux系统宝典
10.3.2 服务级授权 327 C6Alinux系统宝典
10.3.3 作业授权 329 C6Alinux系统宝典
10.4 Oozie认证和授权 329 C6Alinux系统宝典
10.5 网络加密 331 C6Alinux系统宝典
10.6 使用Rhino项目增强安全性 332 C6Alinux系统宝典
10.6.1 HDFS磁盘级加密 333 C6Alinux系统宝典
10.6.2 基于令牌的认证和统一的授权框架 333 C6Alinux系统宝典
10.6.3 HBase单元格级安全 334 C6Alinux系统宝典
10.7 将所有内容整合起来——保证Hadoop安全的最佳实践 334 C6Alinux系统宝典
10.7.1 认证 335 C6Alinux系统宝典
10.7.2 授权 335 C6Alinux系统宝典
10.7.3 网络加密 336 C6Alinux系统宝典
10.7.4 敬请关注Hadoop的增强功能 336 C6Alinux系统宝典
10.8 小结 336 C6Alinux系统宝典
第11章 在AWS上运行Hadoop应用 337 C6Alinux系统宝典
11.1 初识AWS 338 C6Alinux系统宝典
11.2 在AWS上运行Hadoop的可选项 339 C6Alinux系统宝典
11.2.1 使用EC2实例的自定义安装 339 C6Alinux系统宝典
11.2.2 弹性MapReduce 339 C6Alinux系统宝典
11.2.3 做出选择前的额外考虑 339 C6Alinux系统宝典
11.3 理解EMR-Hadoop的关系 340 C6Alinux系统宝典
11.3.1 EMR架构 341 C6Alinux系统宝典
11.3.2 使用S3存储 343 C6Alinux系统宝典
11.3.3 最大化EMR的使用 343 C6Alinux系统宝典
11.3.4 利用CloudWatch和其他AWS组件 345 C6Alinux系统宝典
11.3.5 访问和使用EMR 346 C6Alinux系统宝典
11.4 使用AWS S3 351 C6Alinux系统宝典
11.4.1 理解桶的使用 352 C6Alinux系统宝典
11.4.2 使用控制台浏览内容 354 C6Alinux系统宝典
11.4.3 在S3中编程访问文件 355 C6Alinux系统宝典
11.4.4 使用MapReduce上传多个文件到S3 365 C6Alinux系统宝典
11.5 自动化EMR作业流创建和作业执行 367 C6Alinux系统宝典
11.6 管理EMR中的作业执行 372 C6Alinux系统宝典
11.6.1 在EMR集群上使用Oozie 372 C6Alinux系统宝典
11.6.2 AWS 简单工作流 374 C6Alinux系统宝典
11.6.3 AWS数据管道 375 C6Alinux系统宝典
11.7 小结 376 C6Alinux系统宝典
第12章 为Hadoop实现构建企业级安全解决方案 377 C6Alinux系统宝典
12.1 企业级应用的安全顾虑 378 C6Alinux系统宝典
12.1.1 认证 380 C6Alinux系统宝典
12.1.2 授权 380 C6Alinux系统宝典
12.1.3 保密性 380 C6Alinux系统宝典
12.1.4 完整性 381 C6Alinux系统宝典
12.1.5 审计 381 C6Alinux系统宝典
12.2 Hadoop安全没有为企业级应用原生地提供哪些机制 381 C6Alinux系统宝典
12.2.1 面向数据的访问控制 382 C6Alinux系统宝典
12.2.2 差分隐私 382 C6Alinux系统宝典
12.2.3 加密静止的数据 383 C6Alinux系统宝典
12.2.4 企业级安全集成 384 C6Alinux系统宝典
12.3 保证使用Hadoop的企业级应用安全的方法 384 C6Alinux系统宝典
12.3.1 使用Accumulo进行访问控制保护 385 C6Alinux系统宝典
12.3.2 加密静止数据 394 C6Alinux系统宝典
12.3.3 网络隔离和分隔方案 395 C6Alinux系统宝典
12.4 小结 397 C6Alinux系统宝典
第3章 Hadoop的未来 399 C6Alinux系统宝典
13.1 使用DSL简化MapReduce编程 400 C6Alinux系统宝典
13.1.1 什么是DSL 400 C6Alinux系统宝典
13.1.2 Hadoop的DSL 401 C6Alinux系统宝典
13.2 更快、更可扩展的数据处理 412 C6Alinux系统宝典
13.2.1 Apache YARN 412 C6Alinux系统宝典
13.2.2 Tez 414 C6Alinux系统宝典
13.3 安全性的改进 415 C6Alinux系统宝典
13.4 正在出现的趋势 415 C6Alinux系统宝典
13.5 小结 416 C6Alinux系统宝典
附录 有用的阅读 417C6Alinux系统宝典

Hadoop 专业解决方案 (英文版) [Wrox] Professional Hadoop Solutions (E-Book)C6Alinux系统宝典

☆ 图书概要:☆C6Alinux系统宝典

If you're ready to make the most out of massively scalable analytics, you need to know how to take advantage of Hadoop technologies. With this guide, you'll learn how! It focuses on the architecture and approaches for building advanced, Hadoop-based enterprise applications, taking a deeper, code-level dive into delivering real-world solutions. It also walks you through the data design and how it impacts implementation. It explains how MapReduce works, and shows you how to reformulate specific business problems in MapReduce. Throughout the pages, you'll find in-depth Java code examples that you can use, derived from applications that have been successfully built and deployed.C6Alinux系统宝典

Hadoop高级编程——构建与实现大数据解决方案(Professional Hadoop Solutions ) 高清晰PDF 中英文版 百度网盘下载:C6Alinux系统宝典

------------------------------------------分割线------------------------------------------C6Alinux系统宝典

免费下载地址在 C6Alinux系统宝典

用户名与密码都是C6Alinux系统宝典

具体下载目录在 /2015年资料/8月/13日/Hadoop高级编程——构建与实现大数据解决方案/C6Alinux系统宝典

下载方法见 C6Alinux系统宝典

------------------------------------------分割线------------------------------------------C6Alinux系统宝典



沪ICP备10206494号-4