Jupyter使⽤与⽂件操作
1-1 数据分析介绍
数据分析介绍
数据分析基本概念
· ⽤适当的统计分析⽅法对收集来的⼤量数据进⾏分析
· 提取有⽤信息和形成结论
· 对数据加以详细研究和概括总结的过程
数据分析的流程
⽬的明确——准备数据——数据解析——分析数据——获得结论——成果可视化
为什么要学习数据分析
· 岗位有需求
·
是机器学习的基础
· 数据科学的基础
数据分析⼯具
⼯具:excel,tableau,spss
编程语⾔:R,Python,Matlab
注意
数据分析与数据挖掘的相似之处:
1. 数据挖掘和数据分析都是对数据进⾏分析、处理等操作,从⽽得到有价值的知识
数据分析与数据挖掘的区别:
2. 在应⽤⼯具上,数据分析更多的是借助现有的分析⼯具进⾏;⽽数据挖掘⼀般需要通过编程来实现。
3. 在⾏业知识⽅⾯,数据分析要求对所从事的⾏业有⽐较深的了解,更多的是将数据与业务紧密结合起来;⽽数据挖掘不需要有太多的
⾏业知识,更专注与技术层⾯。
环境部署
· Pycharm
· jupyter
1-2 Jupyter使⽤
Jupyter介绍
Jupyter Notebooks 是什么?
Jupyter Notebooks 是⼀款开源的⽹络应⽤,我们可以将其⽤于创建和共享代码与⽂档。
其提供了⼀个环境,你⽆需离开这个环境,就可以在其中编写你的代码、运⾏代码、查看输出、可视化数据并查看结果。因此,这是⼀款可执⾏端到端的数据科学⼯作流程的便捷⼯具,其中包括数据清
理、统计建模、构建和训练机器学习模型、可视化数据等等。
Jupyter Notebooks特点
· 基于web的在线编辑器
· 可交互式
· .ipynb⽂件分享
· ⽀持markdown
Jupyter安装
如何安装 Jupyter Notebooks?
1. ⾸先需要在你的机器上安装 Python。(建议python3.6-3.7都可)
2. 安装命令:pip install jupyter
Jupyter使⽤
如何运⾏ Jupyter Notebooks?
1.⾸先需要建⽴单独项⽬⽂件夹(建议名称不要包含中⽂)
2.windows+R输⼊cmd进⼊windows终端
3.切换到该⽂件夹路径下
4.打开命令:jupyter notebook
如图所⽰:
基础使⽤ Jupyter Notebooks
如图所⽰:
打开笔记本后,你会看到顶部有三个选项卡:Files、Running 和 Clusters。其中,Files 基本上就是列出所有⽂件,Running 是展⽰你当前打开的终端和笔记本,Clusters 是由 IPython 并⾏提供的。
基础使⽤ Jupyter Notebooks
如图所⽰:
要打开⼀个新的 Jupyter 笔记本,点击页⾯右侧的「New」选项。
· Python3 --> 创建python file
· Text File --> ⽂本编辑器
· Folder --> 创建⽂件夹
· Teminal --> 终端(类似于Windows上的cmd)
创建python file
如图所⽰:
在代码上⾯的菜单中,你有⼀些操作各个单元的选项:添加、编辑、剪切、向上和向下移动单元、运⾏单元内的代码、停⽌代码、保存⼯作以及重启 kernel。
如图所⽰:
· Code --> 代码
· Markdown --> 标记(在运⾏⼀段代码后添加你的结论、添加注释等。)
· Raw NBConvert --> 原⽣NBConvert(将你的笔记本转换成另⼀种格式(⽐如 HTML)的命令⾏⼯具。)· Heading --> 标题(也是Markdown语法)
快捷键使⽤
· 运⾏ --> Ctrl+Enter
· Esc --> 命令模式
· Enter --> 编辑模式
进⼊命令模式之后快捷键:
· A --> 在活跃单元之上插⼊⼀个新单元
· B --> 在活跃单元之下插⼊⼀个新单元
· 连续按两次 D --> 可以删除⼀个单元
· Z --> 撤销被删除的单元
javascript常用函数· Y 会将当前活跃的单元变成⼀个代码单元
· 按住 Shift +上或下箭头可选择多个单元。在多选模式时,按住 Shift + M 可合并你的选择。
处于编辑模式时快捷键:
· Ctrl + Home 到达单元起始位置
· Ctrl + S 保存进度
· Ctrl + Enter 会运⾏整个单元块
· Alt + Enter 不⽌会运⾏你的单元块,还会在下⾯添加⼀个新单元
实际上,⼤家不需要去背这些快捷键。可以进⼊命令模式,摁住H就可以看到快捷键了。
如图所⽰:
1-3 ⽂件操作
⽂件操作
⽂件操作介绍
在实际操作中,通常采集本地数据来进⾏数据分析,那么就需要学习Python去对本地⽂档进⾏读取与写⼊等操作。⽐如:txt⽂件,json⽂件,csv⽂件,excel⽂件等。
本地⽂件操作步骤
· 打开⽂件
· 操作⽂件
· 关闭⽂件
Python操作txt⽂件
open(file, mode=‘r’,encoding=None) --> 打开⽂件
· file --> ⽂件路径
· mode --> 操作⽂件模式纯dos刷bios命令
· r --> 只读模式
· w --> 写⼊
· a --> 追加
·
encoding --> 指定⽂件编码
· utf-8 --> 当⽂件中⽂乱码时,则指定编码为utf-8解决。
读取中的数据
f = open('','r')
f.close()
注意
· r模式,当⽂件不存在时则报错
· f.read() --> 读取全部
· f.readline() -->逐⾏读取
· f.readlines() -->读取全部,且为列表
·
读取不可逆
创建⽂件,并且写⼊内容
f = open('','w')
f.write("I am Iorman")
f.close()
注意
nasa火箭发射失败
如何用java开发游戏· w模式,当⽂件不存在时创建⽂件
· 再次写⼊为覆盖python解析json文件
· 关闭之后需重新打开
with open() --> 上下⽂管理器
with关键字⽤于Python的上下⽂管理器机制。为了防⽌诸如open这⼀类⽂件打开⽅法在操作过程出现
异常或错误,或者最后忘了执⾏close⽅法,⽂件⾮正常关闭等可能导致⽂件泄露、破坏的问题 。Python提供了with这个上下⽂管理器机制,保证⽂件会被正常关闭。在它的管理下,不需要再写close语句。其余操作都同open()⼀致。
with open('','r') as f:
adlines())
Python操作json⽂件
JSON是⼀种使⽤⼴泛的轻量数据格式. Python标准库中的json模块提供了JSON数据的处理功能。
由于JSON与python中的字典格式⾮常像。所以python中的json模块也相当于是⽤来使json与字典做转换。但是要注意的是,json中的数据必须使⽤双引号包裹
json格式:’{“key”:“value”}’
将{“age”:18}写⼊data.json⽂件中
import json
data = {"age":18}
with open('data.json','w') as f:
json.dump(data,f)
读取data.json⽂件中的数据并且,获取到18这个值。
import json
with open(‘data.json’,‘r’) as f:
j_data = json.load(f)
黑莓开发者模式print(j_data[‘age’])
Python操作csv⽂件
CSV即Comma Separate Values,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其⽂件以纯⽂本形式存储表格数据(数字和⽂本)。经常⽤来作为不同程序之间的数据交互的格式。
创建day02.csv⽂件,并写⼊数据。
import csv  # 内置模块
with open("demo02.csv","w",encoding="utf8",newline="") as datacsv:
datawriter = csv.writer(datacsv)
datawriter.writerow(["name","age","gender"])
datawriter.writerow(["Rose","18","⼥"])
与此同时,除了python内置的csv模块可以对csv⽂件进⾏读写操作之外,pandas操作起来显得更加简洁。
import pandas as pd
# 读取
data = pd.read_csv("day02.csv")
# print(data)
# 写⼊
data_head = data.head()
print(data_head)
data_save = _csv("day02.csv",index = False)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。