KSNP 和 hifiasm 集合,提取read中的SNPs,纠错,生成string graph,组装,
先进行read phased,分别对phased的read进行组装,纯合区域复制?
read phased? 根据一个位点的差异,如果多于3个这个位点可能是SNP,然后查看这个read和其他read之间其他位点SNP差异,判断是否冲突决定是SNP还是错误,是否来自同一个haplotype or error or 不同haplotype。
hifiasm是目前最好的haplotype组装软件
single copy marker gene --> unique k-mer ? 感觉好像有用,可能大概率没用,有数据集可以试一下。
预测hic contact的真实性,
通过预测dna空间的结构特征来预测。