Python快乐编程——数据分析与实战  习题答案
第三章
一:
uncensor selector1. ndarray数据类型  矩阵
定时运行程序的方法2. dtype size shape itemszie ndim
3. mat matrix
4. 排序 去重  使用内置函数进行处理
二:
1. B
2. B
3. AC
4. D
三:
1. 重置数组的形状
2. 创建一个全部参数为1的数组
第四章-Pandas的基本操作
一,
1.  A
2.  D
3.  B
4.  CD
二,
1.
read_sql_table
read_sql_query 
read_sql
2.  dropna fillna isnull notnull
3. reindex
三,
1. Frame和Series
2.
(1) 使用unique进行唯一性判断
(2)使用value_count进行次数统计
(3)使用isin进行成员资格检查
第五章
一:
A
A
C
A
二:
步骤1:绘制画布
步骤2:添加子图并绘制图形
步骤3:规定x,y轴及相关标签
步骤4:保存图片或者显示
三:
第六章
参考答案:
一:
1. Timestamp, Period, Timedelta,DatetimeIndex,PeriodtimeIndex, TimedeltaIndex
2. to_timestamp
3. 获取对应的日期的星期名(如Wonday)
4. floor, ceil, round
二:
1.D
2.A
3.A
4.A
5.B
三:
要钱吗四:
更正结果
1.
import pandas as pd
time_index = pd.date_range("1/1/20",periods = 10 , freq ="1h30min")
sqlmap指定cookie参数是print(time_index)
2.
import pandas as pd
rng = pd.period_range("1/1/2000", "6/30/2000", freq = "M")opengl教程
print(rng)
3.
p = pd.Period("2019", freq = "A-DEC")
time = p.asfreq("D") # 年初
print(time)
第七章
一.
1. how  字符串类型 inner
2. concat
3. corr method
4. 量纲 [0,1] 或者[-1,1]
5. 最大-最小标准化方法、Z-score标准化方法、小数定标标准化方法。
二.
1. D
2. C
3. D
4. A
5. A
三.
1. 错
2. 对
3. 错
4. 对
四.
1 .箱型图 和 基于3 σ方法
箱型图的
优点:直观、方便
缺点:数据量比较大时不能直接观察确切的值
3 σ方法:
python数据分析基础教程答案优点:能够将值的分离出来
缺点:数据源只能是服从正态分布
五.
第八章
一. 填空题
1. 文本处理常用的Python库有____和____。
2. jieba库支持____、____、____三种分词模式。
3. NLTK库由____、____、开发而成。
4. 文本相似度分析可以使用____库和____库。
5. 文本情感分析又被称为____、和____、,指的是带有情感彩的主观性文本进行____、____、____、和____的过程
1. NLTK\jieba
2. 精确模式 全模式 搜索引擎模式
3. Steven Bird  Edward Lope 
4. NLTK gensim
5. 倾向性分析 意见挖掘 分析 处理 归纳 推理
二. 选择题
1. 下列关于jieba 说法正确的是(  )
A. jieba分词包含4种工作模式
B. jieba分词可以用于英文文本
C. jieba分词的默认模式为精确模式
D. jieba分词可以自定义停止词词典
2. 下列关于NLTK说法正确的是(  )
A. NLTK可以用于若干种语言
B. NLTK不可用于中文文本分析
C. NLTK词性标注CC表示连击词
D. NLTK免费开源
3. 下列关于文本相似度分析说法不正确的是( )

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。