课程信息

16,374 次近期查看
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 1 门课程(共 4 门)
可灵活调整截止日期
根据您的日程表重置截止日期。
完成时间大约为20 小时
英语(English)

您将获得的技能

Relational AlgebraPython ProgrammingMapreduceSQL
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
第 1 门课程(共 4 门)
可灵活调整截止日期
根据您的日程表重置截止日期。
完成时间大约为20 小时
英语(English)

提供方

Placeholder

华盛顿大学

教学大纲 - 您将从这门课程中学到什么

内容评分Thumbs Up89%(2,830 个评分)Info
1

1

完成时间为 6 小时

Data Science Context and Concepts

完成时间为 6 小时
22 个视频 (总计 125 分钟), 4 个阅读材料, 1 个测验
22 个视频
Appetite Whetting: Extreme Weather2分钟
Appetite Whetting: Digital Humanities8分钟
Appetite Whetting: Bibliometrics4分钟
Appetite Whetting: Food, Music, Public Health5分钟
Appetite Whetting: Public Health cont'd, Earthquakes, Legal4分钟
Characterizing Data Science5分钟
Characterizing Data Science, cont'd5分钟
Distinguishing Data Science from Related Topics4分钟
Four Dimensions of Data Science6分钟
Tools vs. Abstractions7分钟
Desktop Scale vs. Cloud Scale5分钟
Hackers vs. Analysts2分钟
Structs vs. Stats5分钟
Structs vs. Stats cont'd5分钟
A Fourth Paradigm of Science3分钟
Data-Intensive Science Examples6分钟
Big Data and the 3 Vs5分钟
Big Data Definitions4分钟
Big Data Sources6分钟
Course Logistics7分钟
Twitter Assignment: Getting Started14分钟
4 个阅读材料
Supplementary: Three-Course Reading List10分钟
Supplementary: Resources for Learning Python10分钟
Supplementary: Class Virtual Machine10分钟
Supplementary: Github Instructions10分钟
2

2

完成时间为 5 小时

Relational Databases and the Relational Algebra

完成时间为 5 小时
24 个视频 (总计 122 分钟)
24 个视频
From Data Models to Databases4分钟
Pre-Relational Databases5分钟
Motivating Relational Databases3分钟
Relational Databases: Key Ideas4分钟
Algebraic Optimization Overview6分钟
Relational Algebra Overview4分钟
Relational Algebra Operators: Union, Difference, Selection6分钟
Relational Algebra Operators: Projection, Cross Product4分钟
Relational Algebra Operators: Cross Product cont'd, Join6分钟
Relational Algebra Operators: Outer Join4分钟
Relational Algebra Operators: Theta-Join4分钟
From SQL to RA6分钟
Thinking in RA: Logical Query Plans4分钟
Practical SQL: Binning Timeseries5分钟
Practical SQL: Genomic Intervals6分钟
User-Defined Functions3分钟
Support for User-Defined Functions4分钟
Optimization: Physical Query Plans5分钟
Optimization: Choosing Physical Plans4分钟
Declarative Languages5分钟
Declarative Languages: More Examples4分钟
Views: Logical Data Independence5分钟
Indexes6分钟
3

3

完成时间为 5 小时

MapReduce and Parallel Dataflow Programming

完成时间为 5 小时
26 个视频 (总计 122 分钟)
26 个视频
A Sketch of Algorithmic Complexity5分钟
A Sketch of Data-Parallel Algorithms5分钟
"Pleasingly Parallel" Algorithms4分钟
More General Distributed Algorithms4分钟
MapReduce Abstraction4分钟
MapReduce Data Model3分钟
Map and Reduce Functions2分钟
MapReduce Simple Example3分钟
MapReduce Simple Example cont'd3分钟
MapReduce Example: Word Length Histogram2分钟
MapReduce Examples: Inverted Index, Join6分钟
Relational Join: Map Phase4分钟
Relational Join: Reduce Phase4分钟
Simple Social Network Analysis: Counting Friends3分钟
Matrix Multiply Overview5分钟
Matrix Multiply Illustrated4分钟
Shared Nothing Computing4分钟
MapReduce Implementation5分钟
MapReduce Phases6分钟
A Design Space for Large-Scale Data Systems4分钟
Parallel and Distributed Query Processing5分钟
Teradata Example, MR Extensions5分钟
RDBMS vs. MapReduce: Features6分钟
RDBMS vs. Hadoop: Grep5分钟
RDBMS vs. Hadoop: Select, Aggregate, Join3分钟
4

4

完成时间为 3 小时

NoSQL: Systems and Concepts

完成时间为 3 小时
36 个视频 (总计 166 分钟)
36 个视频
NoSQL Roundup4分钟
Relaxing Consistency Guarantees3分钟
Two-Phase Commit and Consensus Protocols5分钟
Eventual Consistency4分钟
CAP Theorem4分钟
Types of NoSQL Systems4分钟
ACID, Major Impact Systems4分钟
Memcached: Consistent Hashing2分钟
Consistent Hashing, cont'd4分钟
DynamoDB: Vector Clocks5分钟
Vector Clocks, cont'd5分钟
CouchDB Overview4分钟
CouchB Views3分钟
BigTable Overview5分钟
BigTable Implementation5分钟
HBase, Megastore3分钟
Spanner5分钟
Spanner cont'd, Google Systems6分钟
MapReduce-based Systems5分钟
Bringing Back Joins4分钟
NoSQL Rebuttal4分钟
Almost SQL: Pig4分钟
Pig Architecture and Performance3分钟
Data Model3分钟
Load, Filter, Group5分钟
Group, Distinct, Foreach, Flatten5分钟
CoGroup, Join3分钟
Join Algorithms3分钟
Skew5分钟
Other Commands3分钟
Evaluation Walkthrough3分钟
Review6分钟
Context3分钟
Spark Examples5分钟
RDDs, Benefits6分钟
完成时间为 2 小时

Graph Analytics

完成时间为 2 小时
21 个视频 (总计 91 分钟)
21 个视频
Structural Analysis4分钟
Degree Histograms, Structure of the Web4分钟
Connectivity and Centrality4分钟
PageRank3分钟
PageRank in more Detail3分钟
Traversal Tasks: Spanning Trees and Circuits5分钟
Traversal Tasks: Maximum Flow1分钟
Pattern Matching6分钟
Querying Edge Tables4分钟
Relational Algebra and Datalog for Graphs4分钟
Querying Hybrid Graph/Relational Data3分钟
Graph Query Example: NSA6分钟
Graph Query Example: Recursion4分钟
Evaluation of Recursive Programs3分钟
Recursive Queries in MapReduce4分钟
The End-Game Problem3分钟
Representation: Edge Table, Adjacency List4分钟
Representation: Adjacency Matrix2分钟
PageRank in MapReduce5分钟
PageRank in Pregel5分钟

审阅

来自大规模数据处理:系统与算法的热门评论

查看所有评论

关于 大规模数据科学 专项课程

大规模数据科学

常见问题

还有其他问题吗?请访问 学生帮助中心