-
大小: 16KB文件類型: .pl金幣: 1下載: 1 次發布日期: 2021-05-04
- 語言: 其他
- 標簽: Perl??chenlianfu??Blast??
資源簡介
Usage:
/home/chenlianfu/chenlianfu_scripts/parsing_blast_result.pl [options] blast.out > blast.tab
對BLAST的xml或tab格式的結果進行解析和過濾,得到更準確的BLAST結果。結果為表格形式(BLAST outfmt6),結果按query序列的ID排序,每個query序列的比對結果按得分排序。
--type default: xml
設置輸入BLAST結果文件的類型。可以設置為xml或tab兩種類型。
若是tab格式,則BLAST結果中沒有query與subject的序列長度信息,默認設置下無法使用--subject-coverage和--query-coverage參數的覆蓋率閾值對結果進行過濾。在設置--db-subject輸入數據庫FASTA文件后可以使用--subject-coverage參數進行過濾;在設置--db-query輸入query序列FASTA文件后可以使用--query-coverage參數進行過濾。
若是xml格式,結果文件中包含query和subject長度信息,從而不需要使用--db-subject和--db-query參數輸入FASTA序列文件。
--no-header
添加該參數則不輸出表頭。
--max-hit-num default: 20
設置允許的最大hit數量。
--evalue default: 1e-5
設置HSP的evalue閾值。
--identity default: 0.05
設置HSP的identity閾值。
--CIP default: 0.2
設置cumulative identity percentage閾值(這里依然使用了比值,單位不是%,所以其值要設置不大于1,默認值0.2表示20%閾值),對Hit進行過濾。CIP = 所有HSPs的一致位點之和 / 所有HSPs的比對長度之和。
--subject-coverage default: 0.2
設置所有HSPs對subject序列總體的覆蓋率閾值。該參數閾值在文獻中也被稱為CALP(cumulative alignment length percentage),即 sum of all HSPs / subject length。
--db-subject
輸入數據庫的FASTA文件,以獲取subject序列長度信息。
--query-coverage default: 0.2
設置所有HSPs對query序列總體的覆蓋率閾值。該參數閾值在文獻中也被稱為CALP(cumulative alignment length percentage),即 sum of all HSPs / query length。
--db-query
輸入query序列的FASTA文件,以獲取query序列長度信息。
--percentage-of-top-bitscore default: 100
使用bitscore得分對hit進行過濾,設置輸出hits的bitscore得分和最高得分相差不超過最高得分的百分數。hit若有多個HSPs,則取最高的HSP得分作為hit的得分;若數據庫非常大,則推薦將設置該參數值設置為10,則能極大減少比對結果,保留最準確的結果;若數據庫比較小,則推薦設置該參數值為50,或使用默認值;使用該參數來減少比對結果,優于僅使用最優比對結果。
--HSP-num default: max
若一個hit有多個HSPs,該參數設置輸出得分指定數目個最高的HSPs。默認輸出所有的HSPs。
--out-hit-confidence
添加該參數,則在表格結果第13、14和15列分別輸出Hit的CIP、CALP_query、CALP_subject值。
--suject-annotation
若--type參數的值是xml,添加該參數可以生效,則額外增加最后一列suject annotation注釋結果。
代碼片段和文件信息
- 上一篇:使用flash播放mp4視頻
- 下一篇:ca碼生成(verilog)
評論
共有 條評論