课程设计要求:
1、必须出勤,每次课程有老师考勤。缺勤一次扣5分。迟到与早退一次扣5分。
2、每个人一个题目,如果题目相同,实现方案不能相同。每人上交相应的课程设计说明书。按照给你们的课程设计模板来撰写与排版。上交时间为第20周的周四。
3、课程设计成绩评定
质量评价指标 | |||
评价项目 | 具体要求 | 满分 | 得分 |
学习态度 | 学习认真,态度端正,遵守纪律,出勤情况良好,能够独立完成设计工作。 | 20 | |
设计说明书质量 | 按期圆满完成规定的设计任务,工作量饱满,难度适宜;设计方案正确、表达清楚;设计思路、方法科学合理;图、表、文字表达准确规范,上交及时。 | 40 | |
答辩陈述 和回答问题 | 程序运行顺畅;陈述简明扼要,思路清晰,清楚流利,回答问题准确,基本概念清楚,有理有据,有一定深度。 | 40 | |
4、选题要求
Hadoop环境下基于决策树算法的网络入侵检测系统
● 入侵检测(应用领域)
● 决策树算法(解决问题的应用算法,hadoop中调用mahout,spark调MLlib)
● 数据集
archive.ics.uci.edu/ml/
aws.amazon/cn/public-data-sets/
www.kaggle/competitions
www.kdnuggets/datasets/index.html
kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
● 数据分布式存储(云系统搭建,数据加载Hbase,hive)
● 算法参数选择(参考论文中的设置)
● 数据调用(编程)
● 算法处理数据(云web要有任务过程)
● 算法结果保持(云端保存)
● 系统优化(包括数据处理,数据库优化,算法效率优化)
hbase官方文档参考书:
《spark高级数据分析》TP274/LZ
《spark机器学习》TP181/PTLS
《Hadoop实战》TP274/LM
《Hadoop大数据处理》TP274/LJ
《R与Hadoop大数据分析实战》TP312/PJPT
《Hadoop应用开发技术详解》TP274/LG
参考论文:
epubki/kns/default.htm
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论