小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

RNA

 我的生信收藏 2018-05-24

HISAT2是TopHat2/Bowti2的繼任者,使用改進(jìn)的BWT算法,實(shí)現(xiàn)了更快的速度和更少的資源占用,作者推薦TopHat2/Bowti2和HISAT的用戶轉(zhuǎn)換到HISAT2。
官網(wǎng):
https://ccb./software/hisat2/index.shtml

HISAT2安裝

下載HISAT2-2.0.1,并解壓:

unzip hisat2-2.0.1-beta-Linux_x86_64.zip

將HISAT2目錄添加到環(huán)境變量:

vi ~/.bashrc

在文件末位添加:

export PATH=/lustre/home/lcn/chenwen/bin/hisat2-2.0.1-beta:$PATH

保存退出

source ~/.bashrc

建立索引

建立基因組索引

hisat2-build –p 4 genome.fa genome

建立基因組+轉(zhuǎn)錄組+SNP索引:
bowtie2的索引只有基因組序列信息,tophat2比對(duì)時(shí),轉(zhuǎn)錄組信息通過-G參數(shù)指定。HISAT2建立索引時(shí),就應(yīng)該把轉(zhuǎn)錄組信息加進(jìn)去。
HISAT2提供兩個(gè)Python腳本將GTF文件轉(zhuǎn)換成hisat2-build能使用的文件:

extract_exons.py Homo_sapiens.GRCh38.83.chr.gtf > genome.exon
extract_splice_sites.py Homo_sapiens.GRCh38.83.chr.gtf > genome.ss

此外,HISAT2還支持將SNP信息加入到索引中,這樣比對(duì)的時(shí)候就可以考慮SNP的情況。這仍然需要將SNP文件轉(zhuǎn)換成hisat2-build能使用的文件:

extract_snps.py snp142Common.txt > genome.snp

最后,將基因組、轉(zhuǎn)錄組、SNP建立索引:

hisat2-build -p 4 genome.fa --snp genome.snp --ss genome.ss --exon genome.exon genome_snp_tran

官網(wǎng)提供了人和小鼠的索引文件下載,壓縮包有make_grch38_tran.sh文件,詳細(xì)記錄了創(chuàng)建索引的過程。

運(yùn)行HISAT2

hisat2 -p 16 -x ./grch38_tran/genome_tran -1 SRR534293_1.fastq -2 SRR534293_2.fastq –S SRR534293.sam

-x 指定基因組索引
-1 指定第一個(gè)fastq文件
-2 指定第二個(gè)fastq文件
-S 指定輸出的SAM文件

更多參數(shù)請(qǐng)查看HISAT2的操作手冊(cè):
https://ccb./software/hisat2/manual.shtml

官方操作手冊(cè)簡(jiǎn)要版

用法:
hisat2 [options]* -x <hisat2-idx> {-1 <m1> -2 <m2> | -U <r> | –sra-acc <SRA accession number>} [-S <hit>]

主要參數(shù):
-x <hisat2-idx>
參考基因組索引文件的前綴。
-1 <m1>
雙端測(cè)序結(jié)果的第一個(gè)文件。若有多組數(shù)據(jù),使用逗號(hào)將文件分隔。Reads的長(zhǎng)度可以不一致。
-2 <m2>
雙端測(cè)序結(jié)果的第二個(gè)文件。若有多組數(shù)據(jù),使用逗號(hào)將文件分隔,并且文件順序要和-1參數(shù)對(duì)應(yīng)。Reads的長(zhǎng)度可以不一致。
-U <r>
單端數(shù)據(jù)文件。若有多組數(shù)據(jù),使用逗號(hào)將文件分隔。可以和-1、-2參數(shù)同時(shí)使用。Reads的長(zhǎng)度可以不一致。
–sra-acc <SRA accession number>
輸入SRA登錄號(hào),比如SRR353653,SRR353654。多組數(shù)據(jù)之間使用逗號(hào)分隔。HISAT將自動(dòng)下載并識(shí)別數(shù)據(jù)類型,進(jìn)行比對(duì)。
-S <hit>
指定輸出的SAM文件。

輸入選項(xiàng):
-q
輸入文件為FASTQ格式。FASTQ格式為默認(rèn)參數(shù)。
-qseq
輸入文件為QSEQ格式。
-f
輸入文件為FASTA格式。
-r
輸入文件中,每一行代表一條序列,沒有序列名和測(cè)序質(zhì)量等。選擇此項(xiàng)時(shí),–ignore-quals參數(shù)也會(huì)被選擇。
-c
此參數(shù)后是直接比對(duì)的序列,而不是包含序列的文件名。序列間用逗號(hào)隔開。選擇此項(xiàng)時(shí),–ignore-quals參數(shù)也會(huì)被選擇。
-s/–skip <int>
跳過輸入文件中前條序列進(jìn)行比對(duì)。
-u/–qupto <int>
只使用輸入文件中前條序列進(jìn)行比對(duì),默認(rèn)是沒有限制。
-5/–trim5 <int>
比對(duì)前去除每條序列5’端個(gè)堿基
-3/–trim3 <int>
比對(duì)前去除每條序列3’端個(gè)堿基
–phred33
輸入的FASTQ文件堿基質(zhì)量值編碼標(biāo)準(zhǔn)為phred33,phred33為默認(rèn)參數(shù)。
–phred64
輸入的FASTQ文件堿基質(zhì)量值編碼標(biāo)準(zhǔn)為phred64。
–solexa-quals
將Solexa的堿基質(zhì)量值編碼標(biāo)準(zhǔn)轉(zhuǎn)換為phred。
–int-quals
輸入文件中的堿基質(zhì)量值為用空格分隔的數(shù)值,而不是ASCII碼,例如40 30 30 40。

有空繼續(xù)寫!?。?/p>

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多