jupyter函数的⾃我总结jupyter ipython 版本改变了换了个名字
jupyter开启⽅法:在终端中输⼊jupyter notebook
条件:只⽀持⾕歌内核的浏览器,在任何系统当中都不能关闭终端
jupyter 可以创建python3⽂件,尾缀名.ipynb
终端在windows系统下⽆法使⽤
%who查看变量函数名类名包名
%run 运⾏外部⽂件的,⽀持.ipynb .py
numpy
ndarray的创建:
强制转换:np.array()  ⽀持 list tuple
创建ndarray  np.adarray() 元素是随即的
np.random库:
randint() ⽣成⼀个全为整数的多维数组,size代表数组的形状
random()  ⽣成⼀个0-1之间的数组,size代表形状
rand()  ⽣成⼀个0-1之间的数组,每填写⼀个参数,就增加⼀个维度
randn()  标准的正太分布, ⽣成0附近的数组
normal()  正太分布的函数,loc 定义标准值是多少,scale定义波动(偏差)
linspace()  以增长幅度⽣成数据的
logspace()  将增长的幅度求对数
arange()  和range没有不同
ones()    ⽣成⼀个样本全为1的数组
zeros()  ⽣成⼀个全为0的数组
full()    ⽣成⼀个全为指定数值的数组
eye()    ⽣成⼀个单位矩阵的
diag()  ⽣成⼀个对⾓矩阵
数组的属性
shape  查看数组的形状
ndim  查看数组的维度
size  查看样本的数量
dtype 查看数据类型
T    数组的转置
imag  提取虚数部分
real  提取实数部分
Day2
索引  numpy的索引是多维索引,对于图⽚的索引顺序先y后x
reshape() 重设形状,不能改变元素的总量, reshape(-1)的作⽤就是将数组转变为1为的
ravel()  将数组展开成⼀维的
concatenate() 级联,作⽤:将多个数组拼接成⼀个数字,axis是数组连接的轴,0代表最外层,-1代表最内层spli()  将数组分为⼏个等份
mean()  求平均值,可以⽤来做图⽚的灰度化
nansum()  将带有nan的数据视为0在就和
argmin()  查最⼩值的下标
argmax()  查最⼤值的下标
argwhere()  查符合条件元素的下标
swapaxes()  轴的交换,⼀般使⽤做转置的
repeat()  数组元素的循环,可以⽤axis调节是列重复还是⾏重复
add()  数组就和,两个数组的形状必须⼀致,相对应的位置相加
np.multiply() 普通的乘法,对应位置相乘
np.dot()  矩阵乘法,⾏*列
linspace函数python
sort()  排序
Day3
pandas 中有两个重要的数据库类型,Series,DataFrame
Series 是⼀维的数组,类似于字典,可以同时使⽤枚举型索引和关联型索引
index指定关联索引的  name指定列名
DataFrame  是⼀个⼆维的数组类型,类似于数据表,是由多个Series组成的
index代表的是⾏索引,columns代表的是列索引
loc[]  显⽰索引,闭区间,只可以使⽤关联索引
iloc[]  隐式索引,半闭区间,只能使⽤枚举索引
dataframe使⽤[],只能取列索引
.index 获取所有的⾏索引
.columns 获取所有的列索引
.valuex  获取所有的元素,返回ndarray
.dtypes  获取数据类型
isnull()  判断有没有空值(NaN),如果有则返回True
notnull() 判断有没有空值(NaN),如果有返回False
dropna()  删除含有空值的⾏或列
fillna()  填充⾏或者列的空值
Day4
stack()  将列索引转变成⾏索引
unstack() 将⾏索引转变为列索引
std()    求标准差
concat()  pandas中的级联,可以将多个DataFrame合并成⼀个新的数据集,默认使⽤outer join
merge()  合并DataFrame,⼀次只能合并两张表,默认使⽤inner join,如果两张表的字段不同,可以是⽤left_on|right_on 如果,关联字段是⾏号,可以使⽤left_index|right_index,如果字段同名且不同意,可以使⽤suffix添加后缀名
drop()  删除⾏或列
set_index() 将摸个字段作为⾏号
query()  执⾏条件查询
Day5
duplicated()      查重复的值,返回bool值
drop_duplicates()  删除重复的值
map()    映射
replace()  将指定的值替换为其他值,使⽤dict作为映射对照表
rename()    将⾏号替换为其他的⾏号,使⽤dict作为映射对照表
describe()  检查异常值的统计表
sort_index()  对⾏号进⾏排序
sort_values() 对某⼀列的值进⾏排序
unique()    提取重复值
groupby()    分组
add_prefix() 给⾏或者列添加前缀
pandas中的绘图函数
df.plot() kind =['line','bar','barh','kde','hist','scatter']
line 线性图
bar|barh 柱状图,⼆维的图形
kde  密度图,⼀维图形
hist 直⽅图,⼀维图形
scatter 散点图,⽀持⼆维和三维,DataFrame中的⼀列对于scatter就是⼀个维度

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。