Python提取CSV数据统计四分位数
四分位数
第⼀四分位数 (Q1),⼜称“较⼩四分位数”,等于该样本中所有数值由⼩到⼤排列后第25%的数字。Q1的位置= (n+1) × 0.25第⼆四分位数 (Q2),⼜称“中位数”,等于该样本中所有数值由⼩到⼤排列后第50%的数字。Q2的位置= (n+1) × 0.5第三四分位数 (Q3),⼜称“较⼤四分位数”,等于该样本中所有数值由⼩到⼤排列后第75%的数字。Q3的位置= (n+1) × 0.75该程序中针对⽆法进⾏等分的数据量进⾏了优化便于统计计算
数据准备
在EXCEL中存储需要统计的数据,以下数据共包含四组数据
对多组数据进⾏计算
运⾏Python脚本
# 读取CSV⽂件
# 统计列表中数据的四分位数
import pandas as pd
import numpy as np
import math
# 转换为dataframe数据框形式
df = pd.read_csv('test.csv', sep=',', header=None)
# 提取该列数据转换为list形式
data1 = df.values[:,0].tolist()
data2 = df.values[:,1].tolist()
data3 = df.values[:,2].tolist()
data4 = df.values[:,3].tolist()
# 计算四分位数统计函数
def statistic(data):
data = np.array(data)
# 上四分位数向上取整
q1_loc = il(len(data)*0.25+1)
q1 = data[q1_loc]
# 计算中位数
mid = np.median(data)
# 下四分位数向下取整
q3_loc = math.floor(len(data)*0.75+1)
q3 = data[q3_loc]
result =[q1, mid, q3]
print(result)
# 调⽤统计函数计算
statistic(data1)
statistic(data2)
python怎么读csv数据statistic(data3)
statistic(data4)
统计结果
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论