必修一 数据与计算(知识点归纳)
第一单元 数据与信息
一、核心概念
1.数据:是对客观事物属性的描述,是上来的可以识别的符号。在计算机科学中,数据是批所有能输入到计算机中并能被计算机处理的符号的总称。
数据类型:文本、声音、图形、图像、视频等。
2.信息:是数据中所包含的意义,是对数据进行加工的结果。把数据有组织、有规律地采集在一起就形成了信息。
数据一方面承载着信息,另一方面也产生着信息。
3.知识:是人们在改造世界的实践活动中所获得的可用于指导实践的认识、规律和经验,是归纳提炼出来的有价值的信息。
4.大数据:是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
5.编码:是指用预先规定的方法将文字、数字或其他对象转换成规定的符号组合,或将信息、数据转换为规定的脉冲电信号。在计算机中,编码一般是指用预先规定的方法将数字、文字、图像、声音、视频等对象编成二进制代码的过程。
二、知识链接
1.数据与信息不同特征
(1)数据的载体性与信息的依附性
数据是信息的符号表示,是信息的载体;信息是数据的含义、解释,信息必须依附于某种载体,相同的信息可以领队于不同的载体。
(2)数据的孤立性与信息的联系性
数据是最原始的记录,没有建立联系之前是分散和孤立的;只有对数据进行加工处理,与
其他数据建立联系,才能形成形成针对特定问题的信息。
(3)数据的客观性与信息的主观性
数据具有客观性,信息具有主观性。
2.数据与信息的共同特征
普遍性、可处理性、传递性、共享性、价值相对性、时效性。
3.大数据的特征
(1)数据量:规模大
(2)处理速度:增长快,要求处理快、效能高
(3)多样性:来源多样、种类和格式丰富
(4)真实性:可信性、有效性、信誉高、真伪性等
4.数制
(1)生活中常用的是十进制数,计算机中广泛采用的是二进制数(还有八进制、十六进制)。
(2)数值数据转换(整数)
例:
(37)10=(100101)2
方法:除2反向取余
(3)数值数据的编码分为原码、反码和补码。
5.西文字符编码
应用最广泛的是ASCII码。标准ASCII码使用7个二进制位来表示大小写字母、数字0到9、标点符号、以及特殊控制字符共128个,扩展ASCII码使用8个二进制位附加了128个特殊符号字符和外来语字母及图形符号。
6.汉字编码
用2个字节即16位二进制表示一个汉字,每个字节最高位为0,国家标准GB2312—1980称为国标码。
7.Unicode编码
为容纳上所有文字和符号的字符编码方案,常用的是UTF-8,还有UTF-16和UTF-32等。
8.声音数字化
(1)采样:每秒中在声音波形上采样的次数称为采样频率。常见有44.1kHz、22.05kHz、11.025kHz。频率越高越精确,保真度越高。
(2)量化:用二进制数表示采样所得到的幅度值。倍数越多,精度越高,越保真。
(3)编码:声音编码就是按照一定格式把得到的数据记录下来。常见格式WAV、MP3等。
9.图像数字化
(1)采样:一幅图像所包含的横向和纵向的像素点的数目称为分辨率。分辨变率越高,采样精度越高,图像越清晰,所占存储空间越大。
(2)量化:每个像素点的颜或亮度用若干二进制数表示,所需的进制位数称为颜深度。颜深度越大表示的颜数越多,彩越丰富,画面越自然、逼真,所占存储空间也越大。
(3)编码:按照一定格式将图像上各个像素点数据记录下来。如BMP格式、JPEG格式等。
第二单元 数据处理与应用
一、核心概念
1.数据处理:是对数据进行采集、存储、加工、分析和表达的过程。
2.数据分析:是指用适当的分析方法与工具,对采集的数据进行分类整理,提取与发现其中有价值的信息,以形成结论的过程。
3.数据可视化:是指将数据分析的结果通过表格、图表、图形等形式显示出来。
trim函数的作用是删除文本的什么空格4.数据库:是按照特定的数据结构来组织、存储和管理数据的、建立在计算机存储设备上的仓库。
二、知识链接
1.数据处理的一般过程:
明确目标→数据采集→数据加工→数据分析→数据可视化→报告撰写
(1)明确目标是指明确数据处理的目的,确立分析思路。
(2)数据采集是指根据需要获取数据。主要有人工观察、调研;技术工具直接采集;各种数据库中的数据;网络上搜索获取;网络调查问卷等。
(3)数据加工是指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。
(4)数据分析是指用适当的方法与工具,对采集到的数据进行分类整理、提取与发现有价值的信息,形成结论的过程。有对比分析法、平均分析法、交叉分析法等。
(5)数据可视化是指将数据分析的结果通过表格、图表、图形等形式显示出来。常见图表有条形力、折线图、饼图、柱状图、面积图等。常用工具WPS表格、Excel等。
(6)报告撰写是对整个数据处理过程的总结。
2.数据采集的方法和工具
采集 方法 | 人工获取 | 自动采集 | ||||||
调查 | 访谈 | 观察 | 实验 | 文献调研 | 物联感知 | 视频监控 | 网络平台 | |
采集 工具 | 问卷 | 表格 | 文献检索工具 | 传感器 | 摄像机 | 采集软件 网络爬虫 移动App | ||
3.数据的组织和存储
数据以文件或数据库形式永久存储在外存储器中。结构化数据通常存储在关系开数据库或表格文件中,非结构化数据主要以多媒体格式文件存储,视频文件(AVI、MP4)、音频文件(WAV、MP3)、图像文件(BMP、JPEG、PNG)、文本文件(TXT、DOC、WPS)。
4.表格数据的加工方法
主要包括:数据的计算、排序、筛选、分类汇总。
(1)数据计算:
加(+)、减(-)、乘(*)、除(/)、乘方(^)
等于(=)、大于(>)、小于(<)、大于等于(>=)、小于等于(<=)、不等于(<>)
主要函数:SUM(求和)、COUNT(计数)、AVERAGE(求平均值)、MAX(求最大值)、MIN(求最小值)、SQRT(求平方根)、MOD(求余数)、LEN(求字符串长度)、LEFT(从左边截取字符
串)、RIGHT(从右边截取字符串)、MID(截取指定子串)、TRIM(删除字符串两边空格)、TODAY(返回当天日期)、NOW(返回当前日期和时间)、YEAR、MONTH、DAY等。
(2)数据的排序:
有升序和降序,数值按大小、文本按ASCII码值大小、汉字按拼音字典顺序或笔划多少。
(3)数据的筛选:
从表格中出满足一定条件的几行或几列数据,只显示满足条件的数据。
(4)数据的分类汇总:
分为单方向分类汇总和交叉分类汇总。
第三单元 算法和程序设计
一、核心概念
1.算法:在有限步骤内解决问题所使用的方法。
2.算法的特征:一个算法必须具有有穷性、确定性、有零个或多个输入、有一个或多个输出、可行性这五个特征。
3.程序:一组能被计算机理解并执行的指令序列,是执行算法的操作步骤。
4.程序设计语言:人们编制程序所使用的计算机语言。
5.变量:引用在程序中可能会变化的数值,通过变量名可以访问存储在内在中的数据。
6.批量数据:一组数据类型相同的数据对象。数据类型可以是简单类型,也可以是复杂的构造类型。
7.用户自定义函数:由用户自己编写的、能够实现独立功能的语句块。
8.嵌套:两个物体有装配关系时,将一个物体嵌入另一个物体,这种方法叫做嵌套。
9.模块化:程序设计中的模块化就是把一个复杂庞大的程序按照某种依据划分成若干个相对独立的程序块,以方便程序的编写、调试和对程序的了解。
二、知识链接
1.算法的特征及评价
(1)有穷性:一个算法在执行有限步骤后在有限时间内能够实现。
(2)确定性:每一个步骤的表述都应该是确定的、没有歧义的语句。
(3)有零个或多个输入
(4)有一个或多个输出:没有输出的算法有没有意义的。
(5)可行性:意味着算法可按部就班地执行,并最终行到正确的结果。
评价一个算法的好坏:正确性、可读性、高效性
2.算法的描述方法
(1)自然语言
(2)流程图
符号 | 名称 | 作用 |
起止框 | 表示一个算法的开始或结束。 | |
处理框 | 表示要处理的内容,该框有一个入口和一个出口。 | |
输入/输出框 | 表示数据的输入或结果的输出。 | |
判断框 | 表示条件判断的情况。满足条件,执行一条路径;不满足条件,执行另外一条路径。 | |
连接框 | 用于连接因画不下而断开的流程线。 | |
流程线 | 指出流程控制方向。 | |
(3)伪代码:介于自然语言和程序设计语言之间的人工语言来描述算法。
3.算法的基本控制结构
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论