本套课程来自北京尚学堂2019年最新大数据课程,大数据+机器学习+平台架构,2019年3月份开课,1903期,包含全套课程视频、资料、笔记、源码、课件等,共72G。课程官方售价10000元以上。文章底部附加下载地址,如链接失效,可评论告知。
课程文件目录:北京尚学堂_1903期_大数据_全套视频教程(视频、源码、课件) [72G]
01_第一阶段 linux和高并发【北京尚学堂·百战程序员】
01_LINUX【北京尚学堂·百战程序员】
01linux_系统安装
02视频
01linux-install.mp4
02linux-start-config.mp4
03linux-clone-config.mp4
04linux-command.mp4
05linux-filesystem.mp4
06linux-filesystem-command.mp4
07linux-cat-less-more-head-tail.mp4
01资料.rar
03笔记.rar
04代码.rar
05能力提升.rar
02linux_使用和脚本编程
02视频
08linux-grep-regx-cut-sort-wc.mp4
09linnux-sed-awk.mp4
10linux-user.mp4
11linux-src-install.mp4
12linux-rpm-yum-install.mp4
13linux-yum-install.mp4
14linux-shellscript.mp4
15linux-shellscript.mp4
16linux-shellscript.mp4
17linux-shellscript.mp4
01资料.rar
03笔记.rar
04代码.rar
05能力提升.rar
02_高并发负载均衡_LVS【北京尚学堂·百战程序员】
02视频
01高并发负载均衡-lvs-介绍.mp4
02高并发负载均衡-网络介绍.mp4
03高并发负载均衡-lvs-模式.mp4
04高并发负载均衡-lvs-DR-install.mp4
01资料.rar
03笔记.rar
04代码.rar
05能力提升.rar
03_高并发负载均衡_nginx【北京尚学堂·百战程序员】
02视频
05高并发负载均衡-ha.mp4
06高并发负载均衡-keepalived.mp4
07高并发负载均衡-介绍.mp4
08高并发负载均衡-nginx-conf.mp4
09高并发负载均衡-nginx-proxy.mp4
10高并发负载均衡-session一致性.mp4
01资料.rar
03笔记.rar
04代码.rar
05能力提升.rar
02_第二阶段 hadoop体系之离线计算(最新更新Hadoop3)【北京尚学堂·百战程序员】
01_hadoop【北京尚学堂·百战程序员】
01hadoop历史、hadoop存储模型、架构模型、读写流程、伪分布式安装
02 视频
01讨论.mp4
02历史.mp4
03存储和架构模型.mp4
04持久化.mp4
05读写流程.mp4
06伪分布式.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
02全分布式安装、hadoop 高可用
02 视频
01全分布安装.mp4
02高可用ha.mp4
03联邦.mp4
04高可用搭建理论.mp4
05高可用搭建实操.mp4
06单词统计1.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
03hdfs api使用,MAPREDUCE框架
02 视频
01单词统计2.mp4
02mr1.mp4
03mr2.mp4
04jobtracker与resourcemanager.mp4
05高可用搭建环境配置.mp4
06高可用搭建实操.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
04单词统计项目,源码解释
02 视频
01mrsource1.mp4
02mr源码2.mp4
03mrsource3.mp4
04mrsource4.mp4
05reduce源码.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
05mapreduce案例一,二,三
02 视频
01tq1.mp4
02tq2.mp4
03fd.mp4
04pagerank1.mp4
05pagerank2.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
06mapreduce案例四,五,六
02 视频
01tfidf.mp4
02itemcf.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
02_ hive数据仓库【北京尚学堂·百战程序员】
1. hive架构、搭建、sql语法、函数
03视频
01. hive介绍及架构设计.mp4
02. hive搭建模式及单节点搭建.mp4
03. hive多节点搭建及DDL操作.mp4
04. hive内部表、外部表及静态分区.mp4
05. hive DML、Serde.mp4
06. hive beeline、jdbc.mp4
07. hive函数.mp4
01资料.rar
02笔记.rar
04代码.rar
05作业.rar
2. hive分区、分桶、安全认证、优化
03视频
01. hive复习.mp4
02. hive作业及hive参数.mp4
03. hive动态分区及分桶.mp4
04. hive lateral view、视图、索引.mp4
05. hive运行方式及GUI接口.mp4
06. hive权限管理.mp4
07. hive优化.mp4
01资料.rar
02笔记.rar
04代码.rar
05作业.rar
03_hbase-NOSQL【北京尚学堂·百战程序员】
1. hbase介绍、搭建及Java api
03视频
01. hive高可用及压缩存储.mp4
02. hive复习.mp4
03. hbase简介.mp4
04. hbase数据模型.mp4
05. hbase架构设计.mp4
06. hbase standalone模式安装.mp4
07. hbase完全分布式安装.mp4
08. hbase javaapi.mp4
01资料.rar
02笔记.rar
04代码.rar
05作业.rar
2. hbase表设计、protobuffer、MR整合、优化
03视频
01. hbase复习及通话记录表设计.mp4
02. hbase javaapi2.mp4
03. hbase用户角色表、部门表设计.mp4
04. hbase protobuffer.mp4
05. hbase与MapReduce整合.mp4
06. hbase优化设计.mp4
01资料.rar
02笔记.rar
04代码.rar
05作业.rar
04_zookeeper【北京尚学堂·百战程序员】
分布式协调架构
02视频
01zk介绍.mp4
02zk安装.mp4
03zk源语命令.mp4
04zk源语命令2.mp4
05zk.mp4
05zk_api.mp4
06分布式协调案例.mp4
01资料.rar
03笔记.rar
04代码.rar
05习题.rar
05_redi-内存数据【北京尚学堂·百战程序员】
01基础语法与数据类型
02视频
01REDIS_介绍.mp4
02String1.mp4
03string2.mp4
04list1.mp4
05list2set.mp4
06sortedset.mp4
07rdb.mp4
01资料.rar
03笔记.rar
04代码.rar
05习题.rar
02架构模型
02视频
01redismode1.mp4
02redismode2.mp4
03redis-cluster.mp4
01资料.rar
03笔记.rar
04代码.rar
05习题.rar
06_cdh【北京尚学堂·百战程序员】
01CDH_clouderaManager使用_hue
02 视频
01CDH介绍.mp4
02CDH框架原理.mp4
03CDH安装-基础.mp4
04安装CDH.mp4
05安装CDH.mp4
06CDH使用.mp4
01 资料.rar
03 笔记.rar
02CDH_clouderaManager使用_impala_oozie
02 视频
07HUE.mp4
08HUE.mp4
09impala.mp4
10impala原理.mp4
11imala使用.mp4
12oozie.mp4
01 资料.rar
03 笔记.rar
07_es-搜索引擎【北京尚学堂·百战程序员】
lucene与倒排索引 引擎安装 curl命令 项目案例
02 视频
01lucene_介绍.mp4
02lucene介绍2.mp4
03el安装.mp4
04curl命令.mp4
05搜索项目1.mp4
06搜索项目2.mp4
01资料.rar
03笔记.rar
04代码.rar
05作业.rar
08_总结【北京尚学堂·百战程序员】
03视频
01. 大数据知识整体复习.mp4
02. HDFS复习.mp4
03. HDFS复习2.mp4
04. MapReduce与YARN复习.mp4
05. Hive复习.mp4
06. Hbase复习.mp4
01资料.rar
02笔记.rar
04代码.rar
05作业.rar
JAVA300集简介.pdf
python400集介绍.pdf
03_第三阶段 spark体系之分布式计算【北京尚学堂·百战程序员】
01_storm【北京尚学堂·百战程序员】
01 应用场景 架构模型 伪分布式与全分布式搭建
02 视频
01框架介绍.mp4
02单词计数练习.mp4
03分组策略.mp4
04分组策略练习.mp4
05伪分布式.mp4
01 资料.rar
03 笔记.rar
04 代码.rar
05作业.rar
02 异步与同步时时分析框架与源码和实例
02 视频
01全分布.mp4
02drpc.mp4
03kafka.mp4
04flume+kafka+storm.mp4
05电信项目1.mp4
01 资料.rar
03 笔记.rar
04 代码.rar
05作业.rar
03容错 事务和项目案例
02 视频
01电信项目2.mp4
02acktransaction.mp4
01 资料.rar
03 笔记.rar
04 代码.rar
05作业.rar
02_Scala【北京尚学堂·百战程序员】
1.Scala语言特点,基础用法,类型推断,函数式编程,特质特性,模式匹配,样例类,偏函数
03. 视频
01-Scala简介+环境配置.mp4
02-Scala类和对象.mp4
03-Scala 简单语法.mp4
04-Scala方法定义.mp4
05-Scala方法和函数.mp4
06-Scala 字符串+Array+List.mp4
07-Scala Set+Map+Tuple.mp4
08-Scala Trait+Match+Case Class+偏函数.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
2.Scala隐式转换类型,Actor通信模型,Actor通信模型案例,Scala版本Spark-WordCount
03. 视频
01-复习+隐式转换.mp4
02-Actor通信模型.mp4
03-SparkWordCount.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
03_Spark【北京尚学堂·百战程序员】
1.初识Spark,Spark编程核心RDD,Spark算子类别详解,Spark算子Java+Scala 版本实现
03. 视频
01-Spark 初始.mp4
02-Spark 核心RDD.mp4
03-Spark-Scala算子.mp4
04-Spark-Java算子.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
2.Spark持久化算子,Spark集群搭建,Spark基于Yarn任务提交,Spark基于Standalone+Yarn任务提交流程详解
02. 视频
01-复习.mp4
02-持久化算子cache+persist.mp4
03-持久化算子-checkpoint.mp4
04-Spark Standalone集群搭建.mp4
05-Spark基于standalone 和基于Yarn 任务提交.mp4
06-Spark 基于Standalone client和cluster模式提交任务.mp4
07-Spark 基于Yarn-client模式提交任务.mp4
08-Spark 基于Yarn-cluster模式提交任务.mp4
09-Spark join+leftOuterJoin+rightOuterJoin+intersection+substract+mapPartitions.mp4
10-Spark java算子 distinct+corgroup.mp4
01. 资料.rar
03. 笔记.rar
04. 代码.rar
05. 作业.rar
3.SparkRDD的宽窄依赖,pipeline计算模型,资源调度与任务调度过程,PVUV案例,Spark任务提交参数详解
03. 视频
01-复习.mp4
02-RDD的宽窄依赖.mp4
03-Spark计算模式+stage.mp4
04-Spark 任务切分+task发送 .mp4
05-Spark 资源调度和任务调度+算子.mp4
06-scala算子repartition+coalesce+mapPartitionWithIndex,countByKey,countByValue.mp4
07-PV,UV.mp4
08-Spark Submit 提交任务参数.mp4
09-Spark Master启动.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
4.Spark源码之Master启动、Driver注册、Application注册、Master划分资源、Executor启动、任务调度
03. 视频
01-复习.mp4
02-Spark Submit 提交任务向Master申请启动Driver.mp4
03-Spark Driver 启动向Master注册Application.mp4
04-Spark Master为当前application划分资源.mp4
05-Spark Master发送消息启动Executor.mp4
06-任务调度.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
5.广播变量,累加器原理,SparkWEBUI,SparkMasterHA搭建,Spark日志管理配置,SparkShuffle详解
03. 视频
01-复习.mp4
02-广播变量+累加器.mp4
03-Spark WEBUI.mp4
04-Spark 历史日志服务器配置.mp4
05-Spark Master HA.mp4
06-SparkMaster切换验证+pipelline验证+资源调度结论验证.mp4
07-Spark Shuffle两种Manager.mp4
08-Spark Shuffle文件的寻址+内存管理.mp4
09-Spark Shuffle调优.mp4
10-Spark Shuffle源码.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
6.初识SparkSQL,SparkSQL加载DataFrame方式,Spark on Hive配置,UDF函数
03. 视频
01-Spark 复习.avi
02-SparkSQL初始.avi
03-SparkSQL 读取json格式的文件加载DataFrame.avi
04-SparkSQL 读取json格式的数据注意点.mp4
05-SparkSQL 读取json格式的DataSet加载成DataFrame.mp4
06-SparkSQL 读取普通RDD加载DataFrame+读取parquet格式数据+读取MySQL数据加载DataFrame.mp4
07-Spark 本地操作Hive数据+读取Hive中的数据 1.6和2.0不同.mp4
08-SparkSQL UDF函数.mp4
bandicam 2018-11-15 16-31-22-012-1.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
7.SparkSQL之UDAF函数详解,开窗函数,初始SparkStreaming,SparkStreaming读取数据详细过程原理及算子操作
02. 视频
01-复习.mp4
02-UDAF.mp4
03-over开窗函数.mp4
04-SparkStreaming初始.mp4
05-SparkStreaming 读取socket数据 +注意点+foreachRDD算子.mp4
06-updateStateByKey+reduceByKeyAndWindow.mp4
07-transform算子+saveAsTextFile 保存.mp4
08-SparkStreaming Driver HA.mp4
01. 资料.rar
03. 笔记.rar
04. 代码.rar
05. 作业.rar
8.Kafka分布式消息系统原理,SparkStreaming与Kafka整合的问题及策略,手动维护kafka 消费者offset
03. 视频
01-复习.mp4
02-Kakfa 介绍.mp4
03-Kafka 使用.mp4
04-SparkStreaming+kafka Receiver 模式01.mp4
05-SparkStreaming + Receiver模式代码+SparkSteaming + Direct模式代码.mp4
06-SparkStreaming Direct模式代码+SparkSteaming+Kafka 2.3+ 改变,使用.mp4
07-SparkStreaming 手动维护消费者偏移量 + 配置参数 .mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
04_第四阶段 机器学习与数据挖掘【北京尚学堂·百战程序员】
01_python【北京尚学堂·百战程序员】
01. python介绍、安装、基础知识、函数、文件操作
03. 视频
01. python简介及安装.mp4
02. python基础语法.mp4
03. python基础语法及流程控制语句.mp4
04. python字符串及列表.mp4
05. Python元组及字典.mp4
06. Python函数.mp4
07. Python文件操作.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
02. Python类与对象、设计模式、异常、模块安装、numpy
03. 视频
01. Python复习及类与对象.mp4
02. python类与对象2.mp4
03. Python设计模式-单例模式.mp4
04. Python设计模式-工厂模式.mp4
05. Python模块.mp4
06. Python数据库操作.mp4
07. Python科学计算类库-numpy-01.mp4
08. Python科学计算类库-numpy-02.mp4
09. Python科学计算类库-numpy-03.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
02_机器学习【北京尚学堂·百战程序员】
1.线性回归原理及使用,贝叶斯原理使用,KNN算法及案例,KMeans原理及案例
03. 视频
01-线性回归初始.mp4
02-线性回归代码.mp4
03-贝叶斯公式.mp4
04-贝叶斯-拉普拉斯估计.avi
04-贝叶斯-拉普拉斯估计.mp4
05-垃圾邮件分类.avi
05-垃圾邮件分类.mp4
06-KNN分类算法原理+案例.avi
06-KNN分类算法原理+案例.mp4
07-KNN-数字分类.avi
07-KNN-数字分类.mp4
08-KMean-聚类算法.avi
08-KMean-聚类算法.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
2.KMeans数字聚类案例,KMeans微博聚类案例,逻辑回归算法原理,音乐分类案例及道路预测案例介绍
03. 视频
01-KMeans 数字聚类案例.avi
01-KMeans 数字聚类案例.mp4
02-Scala – Kmeans.avi
02-Scala – Kmeans.mp4
03-微博聚类案例01.mp4
04-微博聚类案例02.mp4
05–微博聚类代码.mp4
06-逻辑回归分类原理.mp4
07-音乐分类案例.mp4
08-道路预测原理.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
3.道路预测数据原理,数据集准备,逻辑回归损失函数公式推导,逻辑回归优化,ROC曲线与AUC面积
03. 视频
01-道路预测-准备数据集01.mp4
02-道路预测准备数据集02+训练模型+使用模型.mp4
03-数学公式.mp4
04-最大似然估计思想.mp4
05-逻辑回归损失函数推导.mp4
06-逻辑回归优化01.mp4
07-逻辑回归优化02.mp4
08-混淆矩阵+ROC曲线+AUC面积.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
4.推荐系统之协同过滤,App推荐原理,App推荐系统架构及数据清洗
03. 视频
01-复习.mp4
02-协同过滤.mp4
03-APP 推荐原理01.mp4
04-App 推荐原理02.mp4
05-App 推荐原理03.mp4
06-推荐系统架构+推荐系统数据模拟.mp4
07-推荐系统数据清洗.mp4
08-推荐系统数据清洗02.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
5.构建推荐系统训练集,Dubbo服务生成推荐列表,决策树和随机森林算法原理
03. 视频
01-构建推荐系统训练集.mp4
02-Dubbo服务Demo.mp4
03-App推荐列表生成.mp4
04-决策树原理.mp4
05-决策树+随机森林.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
尚学堂_软件开发常用词汇(北京尚学堂发布).pdf
05_第五阶段 大数据项目实战【北京尚学堂·百战程序员】
01_某大型网站日志分析系统【北京尚学堂·百战程序员】
1. 数据源讲解及数据收集
03视频
01. hbase补充:微博案例讲解.mp4
02. 项目需求分析.mp4
03. 项目数据介绍.mp4
04. 项目数据流图.mp4
05. js端数据来源设计.mp4
06. Java端数据来源设计.mp4
07. 日志数据发送到nginx,本地存储.mp4
01资料.rar
02笔记.rar
04代码.rar
2. flume、数据存储及ETL
03视频
01. flume介绍及搭建.mp4
02. flume source组件介绍.mp4
03. flume sink组件介绍.mp4
04. 日志数据通过flume发送到hdfs.mp4
05. ETL准备工作.mp4
06. ETL代码讲解.mp4
01资料.rar
02笔记.rar
04代码.rar
3. 利用MapReduce进行模块设计1
03视频
01. 项目模块设计思路.mp4
02. 新增用户指标mapper端编写.mp4
03. 新增用户指标reducer端编写.mp4
04. 新增用户指标runner编写.mp4
05. Mapreduce计算结果存储MySQL讲解.mp4
06. 新增用户指标运行.mp4
01资料.rar
02笔记.rar
04代码.rar
4. 利用MapReduce进行模块设计2
03视频
01. 活跃用户指标编写.mp4
02. 活跃用户指标编写2.mp4
01资料.rar
02笔记.rar
04代码.rar
5. sqoop讲解、hive进行模块设计、项目优化
03视频
01. hive与hbase整合.mp4
02. sqoop介绍安装及数据导入.mp4
03. sqoop数据导出.mp4
04. 用户浏览深度SQL分析.mp4
05. 项目优化.mp4
06. 项目架构设计及项目总结.mp4
01资料.rar
02笔记.rar
04代码.rar
尚学堂_软件开发常用词汇(北京尚学堂发布).pdf
02_Spark项目【北京尚学堂·百战程序员】
1.交通项目介绍,数据处理方式,数据模拟,卡扣监控业务分析,自定义累加器实现
03. 视频
01-复习.mp4
02-项目介绍+数据处理+脚本提交.mp4
03-模拟数据01.mp4
04-模拟数据+模拟数据导入Hive.mp4
05-卡扣监控分析.mp4
06-卡扣监控代码01.mp4
07-卡扣监控代码02.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
2.项目任务优化,车辆速度top10,卡扣车辆数top5,车辆轨迹,随机抽取车辆实现
03. 视频
01-复习+集群任务提交+使用广播变量+map类的Transformation类算子代替Join.mp4
02-车速最高的top5卡扣+每个卡扣车速top10车辆+碰撞分析.mp4
03-车辆轨迹+随机抽取车辆01.mp4
04-随机抽取车辆02.mp4
05-随机抽取车辆代码.mp4
06-Spark调优 资源调优+并行度调优.mp4
07-Spark代码调优.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
3.Spark 调优之资源、代码、并行度、数据本地化、堆外内存调优,Spark解决数据倾斜的对策
03. 视频
01-代码调优.mp4
02-Spark数据本地化调节+内存调节+shuffle调优.mp4
03-Spark 堆外内存调节+解决数据倾斜01.mp4
04-解决数据倾斜02.mp4
05-解决数据倾斜03.mp4
06-项目-卡扣流量转换率.mp4
07-项目-卡扣流量转换率代码.mp4
08-项目-区域道路车流量top3.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
4.项目业务之区域道路车流量top3,实时道路拥堵统计,PySpark开发环境准备与业务开发
03. 视频
01-区域道路车流量top3.mp4
02-实时统计道路拥堵情况.mp4
03-实时统计道路拥堵情况代码.mp4
04-pyspark 环境准备.mp4
05-pyspark-PVUV.mp4
06-pySpark-统计每个网址top3用户.mp4
01. 资料.rar
02. 笔记.rar
04. 代码.rar
05. 作业.rar
尚学堂_软件开发常用词汇(北京尚学堂发布).pdf
尚学堂_软件开发常用词汇(北京尚学堂发布).pdf
下载地址
VIP会员免费下载,如链接失效,可评论告知。