大数据(BIG DATA)是近几年来非常火热的名词,大数据是一个比较抽象的概念。麦肯锡给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据研究的意义在于,经过对数据的处理和分析,最终达到对实际工作产生指导,从而能转换为实际生产力,最终实现增值。
大数据处理的流程包括:数据收集、数据存储、数据建模、数据分析、数据变现。
- 讲师简介 -
高扬,一线互联网公司(上市公司)大数据专家,高校研究生事业导师。
主编《白话大数据与机器学习》、《白话深度学习与Tensorflow》、《数据科学家养成手册》等多部著作。
2010年后一直专注于数据库、大数据、数据挖掘、机器学习、人工智能等相关领域的研究。擅长传统机器学习、深度学习、数据建模、关系型数据库应用以及大数据框架等的应用。
高老师主编的三部书籍
- 课程内容 -
本次课程从大数据开发基础技术讲起,逐步讲解大数据的每一个技术步骤。深入浅出的讲解每个技术的原理和功能,保证零基础的同学也能学懂学会,有基础的同学融会贯通更加深入理解。课程全程使用Python语言,和linux shell脚本。
接着进入大数据结合人工智能的实践部分,MNIST手写板和DeepQA聊天机器人两个实践课题,让你动手做出一个人工智能的小作品。
第一章:大数据框架技术基础入门
1、集群技术1(服务器与集群)
- Ubuntu安装
- Hadoop原理
- Hadoop安装
- HDFS原理
- HDFS基本操作 for Shell
2、集群技术2(分布式计算)
- HDFS基本操作 for Python
- MapReduce原理
- MapReduce Sample
3、集群技术3(数据仓储)
- Hive原理/安装
- MySQL for Metadata
- Hive基础操作
4、集群技术4(NOSQL数据库)
- HBase原理/安装
- HBase基础操作
5、集群技术5(内存集群技术)
- Spark安装
- SparkSQL使用
- Scala基础
- SQL Join原理与优化
6、集群技术6(机器学习)
- Mahout安装
- Mahout使用 Sample
- Spark MLLib安装
- Spark MLLib使用 Sample
第二章:大数据在人工智能中的实践
7、深度学习1 (循环神经网络)
- 神经元
- 激励函数
- BP神经网络
- 梯度下降
- MNIST手写板案例-全连接BP神经网络
8、深度学习2 (卷积神经网络)
- 卷积层
- 池化层
- MNIST手写板案例-卷积网络
- 过拟合与防范
- 欠拟合与防范
9、深度学习3 (循环神经网络)
- 循环神经网络
- LSTM单元结构
- DeepQA聊天机器人的训练
- 梯度消失/爆炸问题
10、深度学习4 (深度学习扩展知识)
- 对抗学习GAN
- 二元极小极大博弈
- 纳什均衡
- Sample for Python
- 相关模型介绍
- 深度残差网络
- R-CNN
- 开课时间 -
1、直播时间为:10月14日至11月19日,10月21日22日暂停一周(每周六、周日19点到21点);
2、一年内可以免费回看视频。
- 课程特点 -
- 循序渐进,由浅入深、循序渐进、由理论到实践
- 学有所成,理论实践操作相结合,软件安装与应用演示,落地项目实践
- 课件公开,面向学员公开课程的课件和源代码,随时回顾
- 答疑无忧,学员加入微信群,群内和讲师实时互动答疑
- 限量优惠&福利 -
1、新用户限量 200张 50元优惠券;
2、平台老学员(公开课除外),可直接领取 150元优惠券。
PS:以上优惠券,均遵从先到先得的原则!
3、现在购课立即赠送 100G大数据资料礼包。
Hadoop学习资料包▼
HBASE学习资料包▼
Hive学习资料包▼
Linux基础资料包▼
Python学习资料包▼
扫码添加 极值学员-邓老师(jizhidata)
领取优惠券和100G资料
▼
- 掌握大数据基础技术
- 了解大数据在深度学习的应用
- 零基础计算机相关专业学生
- 有编程基础相关工作和研究人员