python数据分析实训_⼊门实践,Python数据分析
1-2 Anaconda和Jupyter notebook介绍
Anaconda是什么
1 最著名的Python数据科学平台
2 750流⾏的Python&R包
3 跨平台:windows,Mac,Linux
4 condaL:可扩展的包管理⼯具
5 免费分发
6 ⾮常活跃的社区
复制代码
Anaconda的安装
python数据分析基础教程答案
2 检验是否安装成功
网上视频教程怎么制作cd ~/anaconda
anaconda bin/conda --version
复制代码
Conda的Environment管理
1 创建⼀个新的environment
conda create --name python34 python=3.4
2 激活⼀个environment
activate python34 # for Windows
source activate python34 # for linuc & Mac
3 退出⼀个environment
deactivate python34 # for Windows
source deactivate python34
4 删除⼀个environment
conda remmove --name python34 --all
复制代码
Conda的package的管理
1 Conda的包管理有点类似pip
2 安装⼀个Python包
conda install numpy
3 查看已安装的Python包
conda list
conda list -n python34 # 查看指定环境安装的Python包
4 删除⼀个Python包
conda remove -n python34 numpy
复制代码
什么是iPython⼀个强⼤的交互式shell
是jupyter的kernel
ajax请求的方法实例
⽀持交互式数据分析和可视化什么是Jupyter Notebook前⾝是IPython notebookl
⼀个开源的web application
可以创建和分享包含代码,视图,注释的⽂档、
可以⽤于数据统计,分析,建模,机器学习等领域
notebook的⽂件格式(.ipynb)由Ipython Notebook 定义的⼀种格式(json)
可以读取在线数据,CSV/XLS⽂件
可以转化为其他格式,(py,html.pdf,md等)
NBViewer⼀个online的ipynb格式notebook展⽰⼯具
可以通过URL分享
Github集成了NBViewer
通过转换器轻松集成到Blogs Emails,Wikis,Books
实验室环境在Windows/Mac/Linux上安装Anaconda
在使⽤Python3.6作为基础环境
使⽤Jupyter Notebook 作为编程IDE
1-4 Anaconda在windows上安装演⽰
安装之后,按住win
点击jupyter botebook
浏览器输⼊localhost:8888
1-5 Anaconda在Linux上的安装演⽰
# 在linux机器中
sh Anaconda3-2020.02-Linux-x86_64.sh
# 进⼊命令号
1 按回车
2 yes
3 选择安装⽬录,这个时候⽬录不变,回车
需要两分钟
4 安装完之后需要选择什么什么玩意,选择yes
在根⽬录中会看见⼀个anaconda的⽂件夹,进⼊⽂件夹可以看到很多⽬录
cd ~/anaconda3
cd bin
可以很多的⽂件夹
./anaconda --version # 查看conda版本号
./jupyter notebook --no-browser # 在本地运⾏jupyter
#要是抛错Running as root is not recommended. Use --allow-root to bypass. ./jupyter notebook --no-browser --allow-root
# 但是这样只能本地访问jupyter,如何实现远程访问呢?
ssh端⼝转发
# 在本地执⾏端⼝转发命令
ssh -N -f -L localhost:8888:localhost:8888 root@{ip地址}
>>>password
# 本地浏览器执⾏localhost:8888,就可以看见linux上的jupyter的页⾯了
执⾏print('hello world')
# jupyter执⾏命令⾏
:ifconfig
电脑刷新快捷键复制代码
php代码图片1-6 Jupyter-notebook的使⽤演⽰
进⼊jupeter浏览器中之后
点击new-->Terminal,显⽰命令⾏界⾯
# 换⽬录执⾏jupeter,并把当前⽬录当做⼯作⽬录
/root/anaconda3/bin/jupyter notebook --no-browser --allow-root
复制代码
第2章 Numpy⼊门
2-1 数据科学领域5个常⽤Python库
numpy
scipy
Pandas
Matplotlib
Scikit-learn
复制代码
Number
数据处理⾥⾯最基础的库N维数组(矩阵),快速⾼效,⽮量数学运算
⾼效的index,不需要循环
开源免费跨平台,运⾏效率⾜以和C/Matlab媲美
Scipy依赖于Numpy
专为科学和⼯程设计
实现了多种常⽤科学计算:线性代数,傅⾥叶变换,信号和图像处理
Pandas结构化数据分析利器(依赖Numpy)
提供了多种⾼级数据结构:Time-Series,DataFrame,Panel
强⼤的数据索引和处理能⼒
MatplotlibPython 2D绘图领域使⽤最⼴泛的套件
基本能取代Matlab的绘图功能(散点,曲线,柱形等)
通过mplot3d可以绘制精美的3D图
Scikit-learn机器学习的Python模块
建⽴在Scipy之上,提供了常⽤的机器学习算法:聚类,回归
简单易学的API接⼝
2-2 数学基础回顾之矩阵运算
基本概念矩阵:是指1xn或者nx1的矩阵
标量:1x1的矩阵
数组:N维的数组,是矩阵的延伸
特殊矩阵
矩阵加减运算相加,相减的两个矩阵必须要有相同的⾏和列
⾏和列对应元素相加减
数组乘法(点乘)
矩阵乘法
清华⼤学出版的线性代数
复制代码
2-3 Array的创建及访问
import munpy as np
# create from python list
list_1 = [1,2,3,4]
array_1 = np.array(list_1) # ⽣成⼀个⼀维数组
list_2 = [6,7,8,9]
array_2 = np.array([list_1,list_2]) # 创建⼀个⼆维数组
print(array_2)
print(array_2.size) #数组⾥元素的个数
print(array_2.shape) # 查看矩阵或数组的维数
print(array_2.dtype) #数组元素的类型
array_4 = np.arange(1,10,2) # 使⽤arange创建数组
print(array_4) # array([1, 3, 5, 7, 9])
array([[0., 0., 0.],
[0., 0., 0.]])
<(5) # 单位矩阵
array([[1., 0., 0., 0., 0.],
[0., 1., 0., 0., 0.],
[0., 0., 1., 0., 0.],
[0., 0., 0., 1., 0.],
[0., 0., 0., 0., 1.]])
# 数组的访问
a = np.arange(10)
print(a) # array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
a[2] # 2
a[1:5] # array([1, 2, 3, 4])
b = np.array([[1,2,3,4],[5,6,7,8]]) # 矩阵
b[1,0] # 矩阵取值(第⼆个数组第⼀个值) # 5
c = np.array([[1,2,3],[4,5,6],[7,8,9]])
c[:2,1:] # 第⼀个元素是⾏,第⼆个元素是列
openvino中文手册
#array([[2, 3],[5, 6]])
复制代码
2-4 数组与矩阵运算
快速创建数组
import numpy as np
np.random.randn(10) # 创建⼀个⼗维数组,且是动态分布的
"""
array([-0.7512065 , 0.97527973, -1.24433992, 0.86890475, -0.51251532, -0.02522675, -0.40664444, 0.66399272, -0.94669869, 1.52843227]) """
np.random.randint(10) # 返回⼀个10以内的随机整数

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。