项目一  财务大数据认知
一、单选题
1. 下列哪个选项不属于大数据的特点(B)
A.  海量化的数据                  B. 大数据都是有价值的数据
C.  数据类型的多样化              D. 大数据的价值密度相对较低
2.  关于大数据思维下列哪个描述是错误的(D)
孙笑川老婆
A. 大数据时代的思维方式从样本思维转向总体思维     
B. 大数据思维要从精确性转向模糊性
C. 大数据思维要从因果关系转向相关关系         
D. 大数据时代,所有数据都是结构化数据
3. 关于财务大数据,下列哪个说法是错误的(D)
A. 大数据时代,大量的财报报表数据由程序自动处理,工作效率大大提升     
B. 大数据时代,财务共享中心是未来的趋势
C. 大数据能够使财务人员更精准地制定预算管理,为领导层提供决策依据
D. 大数据时代,财会人员只关注自己企业的内部数据即可,不需关注行业数据
4. 下列哪个选项不属于大数据处理的环节(A)
A.  数据模型                B. 数据预处理
C.  数据分析                D. 数据可视化
5. 下列哪个选项可以作为大数据处理工具(B)
A. Google                        B. Python
C. Baidu                        D. Windows
二、简答题
1.大数据的4个V特征分别是什么?请举例说明和解释。
大数据具有Volume、Variety、Velocity、Value四个特点,简称为“4V”。
(1)Volume:Volume是指海量化的数据。无论是采集数据、存储数据还是数据计算,其量都非常大。2020年全球估计有35ZB的数据量。BAT巨头百度、阿里和腾讯,他们各自拥有的数据量也已接近EB级。
(2)Variety:Variety指的是数据类型的多样化。根据数据的特点把大数据分为结构化数据、半结构化数据和非结构数据两种。结构化数据是具有统一的数据结构和规范的数据访问和处理方法的数据,企业销售系统数据、客户关系管理数据、库存数据、订单数据、财务数据等都是结构化数据,这些数据多存放在关系型数据库中。非结构化数据是指不能采用预先定义好的数据模型或者没有以一个预先定义的方式来组织的数据,常见的非结构化数据有办公文档、邮件、各类报表、图像、音频、视频信息等。半结构化数据是介于结构化数据和非结构化数据之间的数据,互联网中的XML文件、HTML文件就属于半结构化数据。
(3)Velocity:Velocity是指大数据的时效性。大数据的时效性包含两个层面:数据生成速度高和数据处理速度高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐引擎尽可能要求实时完成推荐。时效性是大数据区别于传统数据的显著特征。
(4)Value:Value是指大数据的价值密度。与结构化数据相比,大数据的价值密度相对较低,但基于大数据得到的分析结果,其商业价值却很高。
2. 列举大数据的数据来源和类型有哪些?
大数据的数据来源主要有三个方面。第一,全球约有40亿人接入了互联网,每个人都是信息的接收者和产生者,每个人都是数据源;第二,全球大约有1000亿个传感器,这些传感器24小时不停地产生数据。第三,人类活动的进一步扩展使数据规模急剧膨胀,数据类型越来越多,数据结构越来越复杂。
根据数据的特点把大数据分为结构化数据、半结构化数据和非结构数据两种。
根据大数据的数据类型把大数据分为数字、文本、图像、音频、视频、地理位置信息、网络日志等。
层层加码防控隔离
3.列举当前大数据的应用场景;思考将来还可应用在哪些方面?
当前大数据的应用场景:(1)大数据+民生;(2)大数据+交通;(3)大数据+金融;(4)大数据+安全,等等。
将来还可应用在哪些方面:答案略。
4. 列举哪些数据是结构化数据?哪些是非结构化数据?
html制作个人简单网址存放在关系型数据库中的数据都是结构化数据,包括企业销售系统数据、客户关系管理数据、库存数据、订单数据、财务数据等。
常见的非结构化数据有办公文档、邮件、各类报表、图像、音频、视频信息等,对于计算机而言,这些非结构化信息很难理解,无论是存储、查询还是利用都需要更加智能化的信息技术。
5. 谈谈你对财务大数据的理解。
略。
6. 数据分析的目的是什么?
数据分析是采用适当的方法对收集来的大量看似杂乱无章的数据进行理解、分析和汇总,提炼数据的内在规律,以最大化地开发数据的功能,发挥数据的作用。
数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程,基于大数据的分析活动主要挑战的不是大数据分析的技术,而是基于对行业的深入了解和对业务的精准把控,只有明确问题分析的方向才有可能准确地实现分析的目标。
7. 简述数据分析的基本过程
数据分析包括了狭义数据分析和数据挖掘。
狭义数据分析的基本过程是:根据事先确定的分析目标,选择适当的统计分析方法或工具,对收集来的大量数据进行处理与分析,从中提取有价值的信息,形成分析结论。分析结果可以辅助企业进行管理优化、预测和决策。
数据挖掘的基本过程是:采用适当的挖掘算法或工具,对收集来的海量数据进行挖掘,从
中发现不为人知、无法通过人的经验或对数据的直观观察得出的规则或结论。挖掘出的规则或结论可以用于预测和决策。
8.  Python作为大数据处理工具的优势有哪些?nutz耳机
首先,对于初学者来说,Python非常易学易用,它的语法结构简单,通俗易懂,同时借助各种第三方库,Python能实现无所不能的数据管理和分析任务。
其次,大量复杂操作的任务,在Python中只需要短短几行代码就能轻松解决,特别是当数据分析任务重复度很高的时候,只要略微改动代码即可完成任务,大大节省了时间,提高了效率。
再次,Python处理数据的体量很大。
最后,Python有强大的绘图功能,可以自动生成可视化图形,再复杂的绘图过程都可以一次性完成,数据结果还非常清晰直观。
项目二 Python环境搭建与使用
一、单选题
python编程基础教程课后答案
1. 下列说法不正确的(C)
A.  Anaconda是一个集成环境   
B.  Jupyter Notebook是Anaconda中的一个组件
C.  安装了Anaconda还需要安装Python                             
D.  安装了Anaconda就安装好了数据分析所用的模块
2. 下列关于Jupyter Notebook,说法不正确的是(D)
A.  Jupyter Notebook是Anaconda集成环境中自带的代码编辑器                             
B.  Jupyter Notebook是一个网页程序
C.  Jupyter Notebook页面单元格中不仅可以输入代码还可以输入文字                             
D.  Jupyter Notebook的Markdown单元中只能输入文字
3.  对于print语句的使用,下列选项正确的是(A)
A.  print(“欢迎进入财务大数据的学习”)     
B.  print  “欢迎进入财务大数据的学习”
C.  print(欢迎进入财务大数据的学习)       
D.  print([欢迎进入财务大数据的学习])
4. 执行下列代码,正确的运行结果是(A)
print("第二季度销售毛利率为:" , end='')
print(328.5/228.6)
A.  第二季度销售毛利率为:1.4370078740157481
B.  第二季度销售毛利率为:
1.4370078740157481
C.  第二季度销售毛利率为:1.44                             
D.  第二季度销售毛利率为:
1.44
5.  在Jupyter Notebook编写的文件保存后,后缀为(A)
A.  .ipynb                      B. .py
C.  .class                        D. .conda
二、实操题
1.练习从清华大学开源软件镜像站下载适合自己计算机的Anaconda 安装程序。
参考答案见教材中的视频。
2. 在计算机上练习安装Anaconda环境,并检验是否安装成功。
参考答案见教材中的视频。
3. 在Jupyter Notebook中创建Python程序,完成北京MG公司2019年度销售毛利率的计算,并将文件命名为GrossMarginRate
参考答案见GrossMarginRate.ipynb文件。
4.图片站织梦免费模板 GrossMarginRate程序下载另存为HTML形式的文件,尝试把学习成果分享给亲人或好友。
参考答案见GrossMarginRate.html文件。
5. 在Jupyter中完成Python文件的复制、移动、删除、下载、上传、重命名等操作。
参考答案见教材中的视频。
项目三 Python基础程序设计

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。