初级培训目标
学员通过HCIA-Big Data认证,将证明您已经系统掌握常用且重要的大数据组件技术原理与架构,能够运用华为大数据解决方案FusionInsight HD进行海量数据的导入和导出、分布式文件系统HDFS的基础操作、分布式数据库HBase客户端及表操作、分布式数据仓库Hive的常用HQL语句查询,以及了解典型场景的综合应用等。使您具备大数据售前、大数据售后技术支持、大数据项目管理、大数据运维管理、大数据开发、大数据分析等岗位所必备的知识和技能
初级课程大纲
l 大数据行业与技术趋势
l HDFS分布式文件系统技术
l MapReduce和YARN分布式计算引擎技术
l Spark基于内存的分布式计算技术
l Kerberos&LDAP技术及应用
l HBase分布式数据库
l Hive数据仓库工具
l Loader数据转换
l Flume海量日志聚合
l Solr数据搜索
l Kafka订阅消息系统
l Zookeeper集群分布式锁设施
l FusionInsight HD集成设计
l FusionInsight HD安装部署
中级培训目标
学员通过HCIP-Big Data Developer认证,将证明您深入理解大数据平台与技术及应用,掌握大数据平台和关键组件的开发流程、接口,掌握典型场景的开发方法,胜任大数据开发者工作岗位。
中级课程大纲
l FusionInsight应用开发指导
l HDFS 开发应用
l Hive 开发应用
l Solr 开发应用
l Kafka开发应用
l Streaming 开发应用
l Flume 开发应用
l Oozie 开发应用
高级培训目标
学员通过HCIE-Big Data V1.0认证,将证明您系统理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。
高级课程大纲
l 分布式数据库架构
l FusionInsight LibrA 基本组件简介
l FusionInsight LibrA 产品特性和关键技术
l FusionInsight LibrA 配套工具集
l FusionInsight LibrA 安全管理
l FusionInsight LibrA 数据库管理系统并发控制
l FusionInsight LibrA 数据库性能监控
l FusionInsight LibrA 数据迁移
l FusionInsight LibrA SQL 介绍
l FusionInsight LibrA 数据库设计
l FusionInsight LibrA 应用程序开发指导
l FusionInsight LibrA 基本操作、语法
l FusionInsight LibrA 性能优化
l 网络 KPI 数据栅格化处理
l 重点区域数据分析
l 流动人口常驻地分析
l 数据挖掘预备知识,数据和属性类型
l 数据的统计描述
l 数据预处理
l 数据仓库介绍
l 分类和回归,决策树回归、梯度提升树回归、线性回归
l 决策树算法(ID3,C4.5,CART算法)
l 朴素贝叶斯算法
l 组合分类(装袋、提升、随机森林)
l 多层前馈神经网络、神经网络多分类、逻辑回归
l 支持向量机算法
l 聚类分析-K均值算法、K中心点算法
l PAM算法、CLARA算法、CLARANS算法
l 离群点概念及其检测方法、基于PCA的异常检测
l 关联规则挖掘步骤、方法及Apriori算法、FP-Growth、PrefixSpan
l FusionInsight Miner介绍
l 银行定期存款业务预测
l 商品批发商客户分群
l 鲍鱼生长年龄预测
l 词频、逆文档评频率
l 信用欺诈、电影推荐
l 词频、逆文档评频率
l 隐含狄利克雷分布
l 文本抽样排序、国民幸福指数