python在财务中的应⽤实训报告-数据科学与⼤数据技术专业
实训解决⽅案
第⼀章 ⼤数据发展背景
1.1 国家政策
2017年1⽉
⼯业和信息化部正式发布了《⼤数据产业发展规划(2016-2020年)》,明确了“⼗三五”时期⼤数据产业的发展思路、原则和⽬标,将引导⼤数据产业持续健康发展,有⼒⽀撑制造强国和⽹络强国建设。
2018年9⽉
⼯信部公⽰“2018年⼤数据产业发展试点⽰范项⽬名单”,公布了包括⼤数据存储管理、⼤数据分析挖掘、⼤数据安全保障、产业创新⼤数据应⽤、跨⾏业⼤数据融合应⽤、民⽣服务⼤数据应⽤、⼤数据测试评估、⼤数据重点标准研制及应⽤、政务数据共享开放平台及公共数据共享开放平台等10个⽅向200个项⽬。
2019年11⽉
为进⼀步落实《国务院关于印发促进⼤数据发展⾏动纲要的通知》和《⼤数据产业发展规划(2016~2020年)》,推进实施国家⼤数据战略,务实推动⼤数据技术、产业创新发展,我国⼯业和信息化部将组织开展2020年⼤数据产业发展试点⽰范项⽬申报⼯作。
1.2 ⾏业现状
据相关资料显⽰,随着互联⽹、移动互联⽹、物联⽹等信息通信技术及产业的不断发展,全球数据量呈爆发式增长态势。⾄此,IDC研究报告指出,根据ZDNET的统计预计到2020年,中国产⽣的数据总量将超过8.5ZB,是2013年的10倍。
此外,值得⼀提的是,⼤数据市场空间巨⼤的同时,其产业规模也有望迎来快速增长。据前瞻产业研究院发布的《中国⼤数据产业发展前景与投资战略规划分析报告》统计数据显⽰,2015年我国⼤数据产业规模已达2800亿元,截⽌⾄2017年我国⼤数据产业规模增长⾄4700亿元,规模增速进⼀步提⾼⾄30.6%,初步测算2018年我国⼤数据产业规模将达6200亿元左右,同⽐增长31.9%。并预测在2020年我国⼤数据产业规模增长突破万亿元,达到了10100亿元,同⽐增长26.3%。
2015-2020年我国⼤数据产业规模统计及增长情况预测
数据来源:前瞻产业研究院整理
由此可知,随着来⾃政策、技术以及市场等各⽅⾯的⼒量推进之下,⼤数据产业的发展潜⼒绝不能⼩觑。对此,业内⼈⼠还预期称,我国⼤数据产业正在从起步阶段步⼊黄⾦期,2020年中国有望成世界第⼀数据资源⼤国。
1.3 专业背景
⼤数据及相关专业是以计算机为基础,以挖掘、分析为主,以搭建、⼯具使⽤为辅,紧密⾯向⾏业应⽤的⼀门综合性学科。其⽅向有数据科学与⼤数据技术、概率论与数理统计、数据挖掘与数据分析、数据运维与开发、算法与数据结构、计算机⽹络、并⾏计算等多个专业⽅向。⽬前全国各类院校已陆续开始围绕⼤数据专业建设展开研究并申报⼤数据专业。
2016年,教育部批准北京⼤学、对外经贸⼤学、中南⼤学率先开设“数据科学与⼤数据技术”专业;2017年,教育部批准包括中国⼈民⼤学、北京邮电⼤学、复旦⼤学在内的共计32所⾼校获批“数据科学与⼤数据技术专业”;2018年3⽉,教育部发布《2017年度普通⾼等学校本科专业备案和审批结果》,共计255所⾼校获批开设“数据科学与⼤数据技术专业”及“⼤数据管理与应⽤专业”;2019年3⽉,教育部发布《2018年度普通⾼等学校本科专业备案和审批结果》,共计228所⾼校获批开设“数据科学与⼤数据技术专业” 及“⼤数据管理与应⽤专业”。
发那科机器人reference“⼤数据技术与应⽤”专业是2016年教育部公布的新增专业。2017年共有62所职业院校获批“⼤数据技术
myeclipse设置字体大小
与应⽤”专业,2018年共有148所职业院校获批“⼤数据技术与应⽤”专业,2019年度新增195所⾼职院校获批“⼤数据技术与应⽤”专业。截⽌⽬前,总计405所⾼职院校成功申请该专业。
第⼆章 教学平台
红亚⼤数据教学平台基于⾼校的教学场景,运⽤云计算技术,集课程实验、算法实战、数据科研、考试于⼀体的实训平台,平台课程共计800多个任务。学⽣可通过浏览器访问使⽤,可在学校任何⼀个⽹络可达的场所进⾏学习。
系统课程学习模式包括实验平台、项⽬路径和职业路径,满⾜不同场景的教学需求。在教学管理⽅⾯,平台⾃带⼈⼯智能课程推荐功能,可为学⽣提供个性化课程推荐及AI课程助⼿,助⼒学⽣定向就业。还可以通过⼤数据分析,⾃动⽣成学业报告,为学⽣就业提供桥梁,并作为教师教学的得⼒助⼿,为⾼校的学⽣能⼒培养及教师的⼯作提供强有⼒的⽀持。
2.1 学习模式
2.1.1 实验平台
该模式以知识体系为核⼼,将⼤数据内容按照不同类型的知识模块进⾏分类。如⼤数据基础体系下包含了:Linux基础、编程基础、数学基础、数据库基础等课程;⼤数据进阶体系包含了:Hadoop、Spa
rk数据处理、R语⾔、Python数据处理、SAS数据分析等课程;该模式围绕⼀个内容展开了多⽅⾯知识的学习,与现在教育⽅式⼀致,保留了师⽣们传统的学习授课⽅法。不仅如此,为满⾜学校的已有的课程教学资源,⽼师可以⾃定义实验内容及实验镜像,将⽂本类、实操类、视频类课件上传到教学平台上满⾜教学需求。
2.1.2 职业路径
该模式以职业岗位需求为核⼼,综合分析国内众多企业的⼤数据相关⼈才岗位需求,如⼤数据运维⼯程师、⼤数据研发⼯程师、⼤数据架构⼯程师,经过采集、筛选、对⽐、定模等⼀系列的流程,将岗位技能需求落实到具体的知识点,围绕⼀个岗位展开多⽅⾯相关技术的学习。
教师在后台可以将实验按照所需知识点的难易程度设计成⼀套流程体系。学⽣按照流程开始实验,将每⼀模块的技能牢牢掌握后,到最后具备胜任该职业的能⼒,可为⾃⾝职业发展提供有效帮助。
2.1.3 项⽬路径
项⽬路径学习模式是以还原企业的真实项⽬完成过程为设计思路,将⼤数据技能知识点与实际项⽬案例相结合,让学⽣能够真实的体会到每个知识点在实际项⽬中的具体作⽤。
将⼀个项⽬拆分成多个实验,多个实验间共同使⽤同⼀实验环境,以实现项⽬的连贯性和真实性。项
⽬提供整套的实验环境及配套⼯具,⽤户在切换实验时对应的实验环境不会改变,在下⼀个实验会继续使⽤上⼀实验的实验环境,并最终完成该项⽬。具体项⽬案例包括⼤数据集运维项⽬、图书馆管理系统的设计与实现、IBM离职率分析等。
2.2 练习算法
2.2.1 算法集
算法集提供了⼀个环境,⽤户可以在⾥⾯写代码、运⾏代码、查看结果,并在其中可视化数据,并与平台中的数据集功能进⾏交互式使⽤,可直接调⽤平台当中的数据集⽤于算法在实际数据中的实践测试。鉴于这些优点,它能帮助他们便捷地执⾏各种端到端任务,如数据清洗、统计建模、构建/训练机器学习模型等。
算法集的⼀个特⾊是允许把代码写⼊独⽴的cell中,然后单独执⾏。这样做意味着⽤户可以在测试项⽬时单独测试特定代码块,⽆需从头开始执⾏代码。虽然其他的IDE环境(如RStudio)也提供了这种功能,但就个⼈使⽤情况来看,算法集的单元结构是设计的最好的。
算法集的优势还体现在灵活性和交互性上,除了最基础的Python,它还允许⽤户在上⾯运⾏R语⾔。由于它⽐IDE平台更具交互性,教师也更乐于在各种教程中⽤它来展⽰代码。
2.2.2 数据集
数据集功能提供数量众多的⼤数据数据集,包括互联⽹、零售、电商、医疗等相关数据集,数据集中的数据可直接与算法集中的算法进⾏交互使⽤,为算法提供所需数据的调⽤⽀撑。
教师可根据数据集的内容、格式、数量等为学⽣设定开放式课题,使⽤真实的数据集进⾏⼤数据项⽬案例处理分析,深度理解掌握⼤数据技术是如何处理这些数据的,例如,教师给定⼀份数据让学⽣进⾏预测实验,学⽣需设计算法进⾏清洗与预测等。
平台提供开放式上传功能,⽀持⽤户将⾃⼰的数据上传⾄平台当中,并可设定是否与他⼈共⽤,可帮助⽤户解决数据存放管理问题,实现⽤户数据的开放式共享。
2.3 在线考试
2.3.1 理论考核
理论考核采⽤在线考核模式,将单选题、多选题、判断题、填空题、简答题添加在试卷上,每⼀道题的题⽬、正选、分值等内容可由管理员⾃⾏设置,简答题题采⽤关键词进⾏⾃动判分,同时也可以由教师⼿动判分。
2.3.2 实践测评
实践测评考核模式是以实验操作过程为考核点,也称之为实操题考核模式,由教师在管理端设置考核步骤、分值权重,平台提供配套的实验考试环境。学⽣在实际操作过程中遇到的考核点,需要根据实际结果去填写,到最后统⼀汇总分数。该模式突破了传统的考核模式,通过实操的⽅式来加深印象,巩固⼤数据知识。
2.4 智能教务
2.4.1 教学进度分析
课程实验具有核全局开关功能,打开全局考核后,进⾏所有实验时都必须完成实验当中设定的每⼀步考核才能查看下⼀步。接着,系统不仅⾃动检测到正在进⾏实验,也可以⼿动设定实验状态分析(也可以⼿动设置分析⽬标)。查看分析结果时可查看每个班级的学⽣在进⾏每个实验时完成度,查看每个实验的每个步骤的通过率、完成率、完成进度、实验总结信息等。
教学进度分析功能可通过智能化的⼿段,有效帮助教师分析并掌握整个班级的学习情况,根据学⽣完成实验的进度过程进⾏授课,选择重点难点部分进⾏针对性讲解,有效降低教师授课压⼒,⾼效完成授课任务。
2.4.2 教学计划管理
管理员在后台可以⼀次性布置全部的教学计划,规定上课时间与学习课程,随后学⽣通过在前端查看,即可了解到每⼀天的课程安排。
2.4.3 实验报告管理
教师通过此功能查看学⽣的实验报告,⽀持预览和批阅等功能,后台⾃动统计学⽣学习数据,展⽰出每个步骤的学习通过时间、成绩正确率、班级排名等信息,并将实验数据与学⽣的实验报告有机结合,形成完成的实验报告。此功能相较于传统的实验报告,增加了学⽣的学习数据统计功能,可⼤⼤的减轻教师的负担,同时为教师了解班级整体的学习状况提供的有⼒的⽀持。
2.5 平台管理
2.5.1 ⽤户管理
为满⾜教师⽅便的管理班级学院,平台提供⽤户组织管理功能。其中⽤户管理显⽰平台⽤户的信息列表,管理端可对平台⽤户信息进⾏编辑与删除,根据信息进⾏⽤户模糊筛选,便于管理平台⽤户;⾓⾊管理显⽰平台现有⾓⾊,⽤户可编辑新的⾓⾊并赋予⾓⾊权限;组织结构管理显⽰平台现有的组织机构,管理端可以也可根据层级分步添加组织、学院、系别、专业、班级,对同级别下的机构进⾏排序。
2.5.2 资源管理
⽤户可以在此查看版本信息、⽤户数量、实验数量,资源监控及⽤户虚拟机监控。同时后台资源监控中⼼可查看平台的⽤户数量、实验数量、职业路径数量、项⽬路径数量、算法集数量、数据集数量、⽤户分布、活跃⽤户等数据;实时的CPU、内存、硬盘、实例的使⽤情况和该时刻学⽣实验进⾏的状态;可对虚拟机进⾏监控所处状态。该功能的实现可便捷精准的反应出学⽣的问题所在,可对实验平台进⾏实时状态的查看,⼜同时提⾼了⽼师的教学质量和效率。
第三章 教学课程库
3.1 实验体系
⼤数据实验体系按照⼤数据基础、⼤数据采集、⼤数据存储、数据处理、数据分析、数据挖掘、数据可视化、深度学习、机器学习和⼤数据案例组成。
3.1.1 ⼤数据基础
3.1.1.1 Linux基础
Linux系统是开源软件,其可靠性得到肯定,是当今举世瞩⽬、发展最快、应⽤最⼴的主流软件之⼀。
在服务器平台、嵌⼊式系统和云计算系统所运⾏的操作系统中,Linux占很⼤⽐重。⼤数据主流框架Hadoop、Spark都架设在Linux系统上,所以现在学习和应⽤Linux成为众多⽤户和学⽣的⾸选。
Linux基础32 Linux基础32 Linux系统概述3 Linux简介
Linux应⽤领域
Linux优势
字符操作环境2 使⽤Shell
字符编辑器VI
大学python入门教程Linux⽂件系统3 Linux⽂件
ext3⽂件系统
安装和卸载⽂件系统
进程管理2 Linux进程概述
进程控制命令
常⽤命令介绍5 ⽬录操作
⽂件操作
磁盘操作
⽂本编辑
帮助命令
⽤户管理4 Linux⽤户账户概述
管理⽤户和组
命令⾏配置
⽤户管理器配置
系统监控与备份4 显⽰系统进程
查看硬件信息
查看⽇志⽂件
数据备份与恢复
软件包管理4 RPM概述
RPM包的命令介绍
查看软件包(检查软件包签名)
软件包管理⼯具
管理⽹络服务4 守护进程服务
配置FTP服务
配置邮件服务器
Apache服务器
3.1.1.2 编程基础
编程基础包含Python基础、R语⾔基础、Scala基础和Java基础四⼤模块共计81个实验项⽬。针对每⼀个所讲解的知识点都进⾏了深⼊分析,并使⽤⽣动形象的情境化举例,将原本复杂的、难于理解的知识点和问题进⾏简化,针对每个知识点,精⼼设计了相应的问题,让学习者不但能掌握和理解这些知识点,并且还可以清楚地知道在实际⼯作中如何去运⽤。
编程基础81 Python基础38 Python基础38 Python介绍
Python开发环境搭建
Python基本数据类型
Python变量
Python基本输⼊输出
Python模块
Python运算符与表达式
Python选择与循环结构二维数组a[1]
Python序列操作
Python列表常⽤⽅法
Python元组
Python列表解析式与⽣成器表达式
Python字符编码
Python字符串基本操作
Python字符串格式化
Python字符串⽅法
Python正则表达式与re模块
Python字典创建与使⽤
Python字典⽅法
Python集合创建与使⽤
Python集合常⽤运算
Python⽂件基本概念
Python打开与关闭⽂件
Python⽂件对象基本⽅法
Python数据序列化与反序列化
Python⽂件与⽂件夹基本操作
Python函数的定义和调⽤
Python函数参数
卸载英文Python变量作⽤域
Python函数返回值
Python函数嵌套定义、闭包、装饰器
Python类的定义和使⽤
Python构造⽅法与析构⽅法
Python成员访问权限
Python继承
Python异常概念与常见表现形式
Python常见异常处理结构
springboot特有的注解
Python的raise语句
R语⾔基础14 R语⾔基础14 R语⾔开发环境搭建

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。