1. 前言
随着基因组组装的技术不断完善,T2T和单倍型基因组很容易组装出来,单倍型基因组比较分析也是近期比较火的,因此斗胆来接着这个机会来分析以下,大概就是以下两个分析(1)单倍型基因组的结构差异分析(2)单倍型等位基因的差异表达分析和下游的差异基因富集分析。
2. 软件下载
mamba create -n Hap_compritive\
mamba activate Hap_compritive
mamba install bioconda::minimap2
mamba install bioconda::syri
mamba install bioconda::plotsr
git clone https://github.com/zhangrengang/orthoindex.git
cd orthoindex
mamba env create -f OrthoIndex.yaml
mamba activate OrthoIndex
python3 setup.py install
3. 单倍型结构变异分析
minimap2 -ax asm5 --eqx zhslhap1genome.fa zhslhap2genome.fa -t 40 > Minimap.sam
syri -c Minimap.sam -r zhslhap1genome.fa -q zhslhap2genome.fa -k -F S
plotsr --sr syri.out --genomes genome.txt -o output_plot.png
4. 单倍型基因组等位基因差异表达分析
暂时想到的策略就是jcvi鉴定定位基因,然后RSEM定量,最后进行差异分析。
# 提取转录本并构建索引
rsem-prepare-reference -p 20 -gff3 zhslhap2.gff3 --bowtie2 zhslhap1genome.fa zhslhap1genome
rsem-prepare-reference -p 20 -gff3 zhslhap2.gff3 --bowtie2 zhslhap2genome.fa zhslhap2genome
# 比对并定量
rsem-calculate-expression --bowtie2 --paired-end -p 12 zhsl_1.fq zhsl_2.fq zhslhap1genome zhslhap1genome_rsem
rsem-calculate-expression --bowtie2 --paired-end -p 12 zhsl_1.fq zhsl_2.fq zhslhap2genome zhslhap2genome_rsem
输出结果比较重要的就是*genes.result和*isoforms.results,分别是基因和转录本的定量结果