python中的pd进⾏数据处理1、⽤pd读取excel中的的某⼀列⽣成列表,并将集合或列表写进excel
def excel_one_line_to_list():
df = pd.read_excel(r"poi_grid.xlsx",usecols=[1],
names=None)  # 读取项⽬名称列,不要列名
df_li = list()
# print(df_li)
result = []
for s_li in df_li:
result.append(s_li[0])
print(result)
res = set(result)
r = list(res)
c = {'result':r}
data = pd.DataFrame(c)
pd.DataFrame(data).to_excel('b.xlsx')
2、python如何对excel表格指定内容查
poi_data_renshu = pd.read_excel(r"poi_grid.xlsx")
d_fnid = [1,2,3,4,5]
renshu_list=[]
for d_fnid_li in d_fnid:
p=poi_data_renshu[poi_data_renshu['fnid']== d_fnid_li][['renshu']]    # [[]]内为指定的列名
# print(p)
for row in p.values:
renshu_list.append(row[0])
3、python 判断两个列表中相同和不同的元素
#接⼝返回值
list1 = ['张三', '李四', '王五', '⽼⼆']
#数据库返回值
list2 = ['张三', '李四', '⽼⼆', '王七']
a = [x for x in list1 if x in list2] #两个列表中都存在
b = [y for y in (list1 + list2) if y not in a] #两个列表中的不同元素
print('a的值为:',a)
print('b的值为:',b)
c = [x for x in list1 if x not in list2]  #在list1列表中⽽不在list2列表中
d = [y for y in list2 if y not in list1]  #在list2列表中⽽不在list1列表中
print('c的值为:',c)
print('d的值为:',d)
运⾏结果为:
a的值为: [‘张三’, ‘李四’, ‘⽼⼆’]
b的值为: [‘王五’, ‘王七’]
c的值为: [‘王五’]
d的值为: [‘王七’]
4、python 将某⼀⾏的数据中逐列取出,与第⼀列对应
df = pd.read_excel(r"F:\GPU10.0.45\813shopfinal\fnid_jihe.xlsx") # print(df)
df.fillna(value=0, inplace=True)
print(df)
for i in df.values:
# print(i[0])
for j in range(1,50):
# print(i[j])
if i[j] != 0:
dic= {'custid':i[0],'fnid':i[j]}
print(dic)
data = pd.DataFrame([dic])
# print(data)
for k in data.values:
print(k[0])
with open('bdf.csv', 'a+') as f:
f.write(str(k[0])+','+str(k[1])+',')
f.write('\n')
pd取某⼏列
import pandas as pd
data = pd.read_csv()
data = data.iloc[:, 0:13]  # 按位置取某⼏列
取⾏列
from pandas import DataFrame
import pandas as pd
python怎么读入exceldf=DataFrame(np.arange(12).reshape((3,4)),index=['one','two','thr'],columns=list('abcd'))
df['a']#取a列
df[['a','b']]#取a、b列
#ix可以⽤数字索引,也可以⽤index和column索引
df.ix[0]#取第0⾏
df.ix[0:1]#取第0⾏
df.ix['one':'two']#取one、two⾏
df.ix[0:2,0]#取第0、1⾏,第0列
df.ix[0:1,'a']#取第0⾏,a列
df.ix[0:2,'a':'c']#取第0、1⾏,abc列
df.ix['one':'two','a':'c']#取one、two⾏,abc列
df.ix[0:2,0:1]#取第0、1⾏,第0列
df.ix[0:2,0:2]#取第0、1⾏,第0、1列
#loc只能通过index和columns来取,不能⽤数字
df.loc['one','a']#one⾏,a列
df.loc['one':'two','a']#one到two⾏,a列
df.loc['one':'two','a':'c']#one到two⾏,a到c列
df.loc['one':'two',['a','c']]#one到two⾏,ac列
#iloc只能⽤数字索引,不能⽤索引名
df.iloc[0:2]#前2⾏
df.iloc[0]#第0⾏
df.iloc[0:2,0:2]#0、1⾏,0、1列
df.iloc[[0,2],[1,2,3]]#第0、2⾏,1、2、3列
#iat取某个单值,只能数字索引
df.iat[1,1]#第1⾏,1列
#at取某个单值,只能index和columns索引
df.at['one','a']#one⾏,a列
按条件取⾏
选取等于某些值的⾏记录⽤ ==
df.loc[df[‘column_name’] == some_value]
选取某列是否是某⼀类型的数值⽤ isin
df.loc[df[‘column_name’].isin(some_values)]
多种条件的选取⽤ &
df.loc[(df[‘column’] == some_value) & df[‘other_column’].isin(some_values)]
选取不等于某些值的⾏记录⽤!=
df.loc[df[‘column_name’] != some_value]
isin返回⼀系列的数值,如果要选择不符合这个条件的数值使⽤~
df.loc[~df[‘column_name’].isin(some_values)]
#删除特定⾏
要删除列“score”<50的所有⾏:
df = df.drop(df[df.score < 50].index)
df.drop(df[df.score < 50].index, inplace=True)
# 多条件情况
# 可以使⽤操作符: | 只需其中⼀个成⽴, & 同时成⽴, ~ 表⽰取反,它们要⽤括号括起来。# 例如删除列“score<50 和>20的所有⾏
df = df.drop(df[(df.score < 50) & (df.score > 20)].index)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。