9⽉14⽇Python⽣物信息学数据管理
第三章笔记
1,read()与readlines()的区别:
new_file = open('')
lines = ad()
data = []
for nucleotide in lines:
data.append(nucleotide)
print(data)
new_file = open('')
lines = adlines()
data = []
for nucleotide in lines:
writelines在python中的用法data.append(nucleotide)
print(data)
2,如果不读取直接添加会出现和第⼆张图readlines⼀样的情况
new_file = open('')
data = []
for nucleotide in new_file:
data.append(nucleotide)
print(data)
3,写⼊⽂本⽂件⽤write()函数。其只接受字符串数据,且不能⾃动换⾏,如需换⾏添加换⾏符,或者使⽤writelines()函数接受由⾏组成的列表。
4,⽂本转换为数字:float()。转换为整形:int()。数字等转换为⽂本:str()。
5,格式化。%3i表⽰字符串应该包含格式化为三位的整数整数的实际值在结尾的括号中。%x.yf,x为总字符数,y是⼩数点位数。
6,join()⽤法:
7,⾃测题:写程序读取⽂件,保存独⽴副本。
text_file = open('')
data = []
for value in text_file:
data.append(str(value))
open('','w').writelines(data)
8,从纯⽂本中读取序列,计算每个出现频率。给出最常出现频率,计算GC含量,并写⼊⽂本⽂件。
new_file = open('')
lines = ad()
data = []
for nucleotide in lines:
data.append(nucleotide)
numberA = 0
numberT = 0
numberC = 0
numberG = 0
for nucle in data:
if nucle == 'A':
numberA += 1
if nucle == 'T':
numberT += 1
if nucle == 'C':
numberC += 1
if nucle == 'G':
numberG += 1
total = numberA + numberT + numberC + numberG
print('A所占频率:' + str(numberA/total))
print('T所占频率:' + str(numberT/total))
print('C所占频率:' + str(numberC/total))
print('G所占频率:' + str(numberG/total))
print('CG所占含量:' + str((numberC + numberG)/total))
data2 = []
data2.append(numberA/total)
data2.append(numberT/total)
data2.append(numberC/total)
data2.append(numberG/total)
data2.sort()
print(data2[3])
data3 = []
data3.append('A所占频率:' + str(numberA/total))
data3.append('T所占频率:' + str(numberT/total))
data3.append('C所占频率:' + str(numberC/total))
data3.append('G所占频率:' + str(numberG/total))
data3 = ' '.join(data3)
open('','w').write(data3)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论