带学Python数据分析中级带打Kaggle比赛

手把手教你打Kaggle比赛

默认教学计划
24人加入学习
(0人评价)
价格 ¥899.00
教学计划
承诺服务
课程介绍

- 开课目的 -

在众多领域中:网站建设、人工智能、机器学习、数据挖掘、数据分析、云计算、网络爬虫等都离不开python的身影。Python在编程语言中排名前5,是非常受欢迎的编程语言。
Python数据分析师人才缺口大!IT时代逐渐被DT时代取代,用理性的数据分析代人工的经验分析成为主流,数据分析人才的供给指数仅为0.05,属于高度稀缺。
本课程是Python数据分析中级课程,要求学员具有Python基础,有概率论的基础。课程将通过概率论的知识分析数据的特征,根据机器学习方法建立合适模型,最后通过kaggle竞赛实践,带领同学们学习数据分析的方法与编程实现!

如果没有Python基础,建议先学习基础课程:http://edu.mathor.com/course/137

 

某名企高管曾说:“写上参加过Kaggle比赛,我会看简历。 得过一次10%,我会给电话面试。 得过2次或者以上10%,我会给on site面试。 得过一次前10,我们会谈笑风生。”

 

- kaggle竞赛介绍-

 

Kaggle 是全球首屈一指的数据科学、机器学习竞赛和分享平台。很多大公司作为出题方,会将问题和相关数据放在平台上形成一个竞赛,所有的 Kaggle 用户都可以参加,获胜的团队或个人既能拿到高额奖金,又能获得奖牌,对于新手还能收获实战经验。如果能在 Kaggle 竞赛中获得一个不错的排名的话,对于自身履历或面试还是有很大帮助的。但由于竞争激烈,想在榜单上拿到一个较高的排名并不容易。

 

Kaggle 网站的比赛根据不同人群可以分为两大类

面向初学者

Getting Started:让初学者体会机器学习的比赛

Playground:有趣的比赛,主要看创意,而非解决具体的研究问题

面向竞赛者

Recruitment:赞助商为招聘数据科学家而设立的比赛

Featured:为解决商业问题设立的有奖金的比赛

Research:解决学界前沿问题设立的比赛

 

- 课程目录 (拟定)-

【概率论与数理统计篇】

    1. 概率论的基本概念

        1.1 随机试验

        1.2 样本空间、随机事件

        1.3 频率与概率

        1.4 等可能概型(古典概型)

        1.5 条件概率

        1.6 独立性

        1.7 案例分析及作业

    2. 随机变量及其分布

        2.1 随机变量

        2.2 离散型随机变量及其分布律

        2.3 随机变量的分布函数

        2.4 连续型随机变量及其概率密度

        2.5 随机变量的函数的分布

        2.6 案例分析及作业

    3. 多维随机变量及其分布

        3.1 二维随机变量

        3.2 边缘分布

        3.3 条件分布

        3.4 相互独立的随机变量

        3.5 两个随机变量的函数的分布

        3.6 案例分析及作业

    4. 随机变量的数字特征

        4.1 数学期望

        4.2 方差

        4.3 协方差及相关系数

        4.4 矩、协方差矩阵

        4.5 案例分析及作业

    5. 大数定律及中心极限定理

        5.1 大数定理

        5.2 中心极限定理

        5.3 案例分析及作业

    6. 样本及抽样分布

        6.1 随机样本

        6.2 抽样分布

        6.3 案例分析及作业

    7. 参数估计

        7.1 点估计

        7.2 基于截尾样本的最大似然估计

        7.3 估计量的评选标准

        7.4 区间估计

        7.5 正态总体的均值与方差的区间估计

        7.6  0-1分布参数的区间估计

        7.7 单侧置信区间

        7.8 案例分析及作业

    8. 假设检验

        8.1 假设检验

        8.2 正态总体均值的假设检验

        8.3 正态总体方差的假设检验

        8.4 置信区间与假设检验之间的关系

        8.5 样本容量的选取

        8.6 分布拟合检验

        8.7 秩和检验

        8.8 案例分析及作业

【机器学习篇】

    9. 回归分析(Regression Analysis

        9.1 算法简介及数学原理

        9.2 实训:基于回归分析预测房价及变化趋势问题

        9.3 课后作业及讲解

    10. 逻辑回归(Logistic Regression

        10.1 算法简介及数学原理

        10.2 实训:基于逻辑回归预测泰坦尼克号乘客存活率

        10.3 课后作业及讲解

    11. 决策树(Decision Tree

        11.1 算法简介及数学原理

        11.2 实训:基于决策树算法对男女性别进行分类

        11.3 课后作业及讲解

    12. 人工神经网络(Artificial Neural Network

        12.1 算法简介及数学原理

        12.2实训:基于BP人工神经网络对MNIST数据集进行识别和预测

        12.3 课后作业及讲解

    13. k近邻分类(k Nearest Neighbor)

        13.1 算法简介及数学原理

        13.2 实训:基于k近邻分类对小麦种子进行分类

        13.3 课后作业及讲解

    14.  聚类分析(Cluster Analysis)

        14.1 算法简介及数学原理

        14.2 实训:基于聚类分析对鸢尾花(iris)数据集分类

        14.3 课后作业及讲解

【Kaggle进阶篇】

    15. Kaggle数据分析美国城市的空气质量

        15.1问题背景与分析

        15.2分析方法与过程

        15.3编程操作

        15.4课外延伸

        15.5小结与课后作业

    16. Kaggle数据分析美国市民收入情况

        16.1问题背景与分析

        16.2分析方法与过程

        16.3编程操作

        16.4课外延伸

        16.5小结与课后作业

    17. Kaggle数据分析不同国家葡萄酒质量

        17.1问题背景与分析

        17.2分析方法与过程

        17.3编程操作

        17.4课外延伸

        17.5小结与课后作业

    18. Kaggle数据分析华盛顿共享单车租赁情况

        18.1问题背景与分析

        18.2分析方法与过程

        18.3编程操作

        18.4课外延伸

        18.5小结与课后作业

    19. Kaggle数据分析电影大数据评分情况

        19.1问题背景与分析

        19.2分析方法与过程

        19.3编程操作

        19.4课外延伸

        19.5小结与课后作业

    20. 期末考试

        20.1问题背景与分析

        20.2分析方法与过程

        20.3.编程操作

        20.4课外延伸

        20.5小结与课后作业

 

- 讲师简介 -

张阳阳

清华大学博士生,研究方向:人工智能、机器学习、深度学习和数据挖掘,擅长数据可视化、软件编程、算法研发、网页开发、数值计算和仿真模拟等,擅长Python、MATLAB、C、JavaScript、R等编程语言,经常参加数学建模、Kaggle、ACM、SAS等比赛,曾荣获80多项奖项。曾作为 Python 课程讲师,有 4 年多的教学经验,教学幽默风趣,深入浅出。

2019年kaggle Data松暨清华-新南威尔士中澳国际数据科学大赛二等奖

 

- 报名基础 -

 

1、学习过基础的概率论知识
2、有Python基础编程能力
3、学习过数值计算工具及绘图工具

 

 

- 授课方式 -

10月14日开课

1、本次课程为录播课,定时发布视频,群里主讲老师和助教实时答疑。

2、本次课程配套习题和习题讲解课。

 

服务步骤 -

      第一步扎实基础,同学们先学习完成Python基础课程,本课程学习到第8节就具备了初步打比赛的基础。

      班主任督促同学们完成课程学习,完成课程配套作业。

 

      第二步小试牛刀,完成基础课程的学习以后,同学们可以自由组队,开始接触比赛题目,到Kaggle竞赛官网,浏览题目。

      班主任统计同学们的组队情况,老师推荐简单练手题目,开始熟悉竞赛。

 

      第三步系统到第14节课,根据课程知识点找对应的比赛开练,边打比赛边学习知识。主要做老师后面课程的题目,找到自己不懂的地方,以便上课时找到不足之处。

      班主任督促同学继续打比赛提交比赛作品,老师会帮助同学们翻译和分析题目。

 

      第四步组队打正式比赛,通过练习,组队开始打最新的比赛,成绩优秀可以获得很高额的奖金。

      班主任会定时发布比赛信息,正式的比赛我们是不提供思路指导的,请同学遵守竞赛规则,自己发挥。

 

- 限量优惠 -

前100人可领取300元优惠券,先到先得!

其中报名过Python基础与数据分析入门课的同学,可以优惠400元

 

- 购课福利 -

1、购买后领取 10个G的 Python 资料大礼包 

2、购买后邀请加入讲师学员私密答疑群 

3、购买后赠送原价499的R语言课:http://edu.mathor.com/course/156

4、听完前两节课后,不满意可退款

 

扫码添加“雨祯老师”领优惠券和资料

 

课程目标
  • 学习Python数据分析
  • 打Kaggle比赛
适合人群
  • 大学生、研究生
  • 教师和工作人员

授课教师

软件工程师、人工智能工程师

课程特色

下载资料(2)
视频(1)