資源簡介
文件用于計算fasta文件中基因序列的N50、基因條數、最短最長的序列條數。將腳本文件拷貝至fasta文件目錄下,使用方法:python cal_N50.py
跳出“Enter your fasta/fa name: ”后,輸入你當前目錄下的fasta文件名后回車即可
代碼片段和文件信息
#GC_N50.py
print?‘Python?and?Biopython?needed?for?running?this?script!‘
print?“script?for?calculating?N50?of?assembly“
fasta?=?raw_input(‘Enter?your?fasta/fa?name:?‘)
#?N50?calculation
baseSumLength=?0[]
ValueSumN50?=?00
no_cno_gno_ano_tno_n?=?00000
from?Bio?import?SeqIO
for?record?in?SeqIO.parse(open(fasta)?“fasta“):
???baseSum?+=?len(record.seq)
???Length.append(len(record.seq))
???seq?=record.seq.lower()
???no_c+=seq.count
評論
共有 條評論