校内选拔赛

大数据理论知识
  • 大数据的框架与特点、数据科学的理论体系、数据科学在大数据分析中的应用、数据分析的类型、数据分析项目及项目管理、预处理及数据准备方法、统计分析方法、机器学习算法理论与应用、可视化分析法、大数据分析中常用分析工具、行业及应用。
大数据技术知识
  • Linux基础操作(开关机、用户权限、VIM编辑器等)
  • Mysql数据库(主键、协议、运算符、字段类型等)
  • Java语言(循环、运算符、流程控制、异常、数据结构等)
  • Python语言(循环、函数、lambda表达式、列表推导式、面向对象、Numpy、Matplotlib、Pandas等)
  • 大数据技术生态系统(Hadoop、Hive、Sqoop、Flume、HBase、Kafka、Zookeeper、Spark)
  • 机器学习(CNN、K-Means、SVM、神经网络、线性回归、随机森林、特征选择等)
大数据行业应用知识
  • 云计算技术及应用、移动互联浪潮下的变革与创新、基于互联网的产业创新、银行大数据挖掘智能应用与发展、工业互联网平台创新发展的重点和路径、医学人工智能原理及实践、智能时代的财务数字化转型

初赛

编程题(高职院校)
  • 面向对象三大特性、MySQL API 操作、实现简易登录系统验证、实现双色球机选功能、装饰器应用、进程通信
爬虫技术(高职院校/本科院校)
  • 爬取单页笑话信息、爬取电影网站信息、爬取图片信息、爬取电商网站信息、爬取音乐网站信息
大数据技术(高职院校/本科院校)
  • Hadoop安装部署(伪分布式)、Hadoop MapReduce WordCount、Hadoop Shell操作、Hive 安装部署、Hive DDL、DML操作、Hive HQL操作、Hive JDBC 连接方式、Sqoop 数据传递、Spark Shell操作、Spark 安装部署(Standalone伪分布式)、Spark SQL操作、PySpark SQL、DataFrame、RDD操作、Kafka 安装部署、Flume 传输数据给Kafka、Flume Agent配置、HBase 安装部署、HBase Shell操作、HBase 过滤器、Storm Shell操作、Storm Trident WordCount
可视化技术(高职院校/本科院校)
  • 折线图绘制、散点图绘制、柱状图绘制、饼状图绘制、雷达图绘制
算法(本科院校)
  • TF-IDF算法应用、决策树算法应用、逻辑回归算法应用、Spark MLlib ALS算法应用、Scikit-learn多元线性回归算法应用、TensorFlow实现五子棋人机交互游戏

赛前知识学习网站入口

章鱼大数据领会
CIO时代学APP