[other] PacBio长read纠错算法的研究
Tofloor
poster avatar
王闯
deepin
2023-08-01 17:31
Author

PacBio长read纠错算法有哪些,各有什么优缺点

Reply Favorite View the author
All Replies
把一切操作变成GUI
deepin
Backbone of ecological co-construction group
2023-08-03 07:58
#1
类型 算法 优点 缺点
基于重叠图的纠错算法 Canu, FALCON等 依赖于读序列之间的重叠情况,通过重叠序列的拼接来完成长read纠错工作。 这种算法依赖于读序列之间的重叠情况,如果重叠情况不理想,
那么纠错效果可能会受到影响。
基于深度的纠错算法 Quiver, Arrow等 利用长reads覆盖率高于错误reads的性质,通过统计多个reads中每个碱基出
现的频率来判断所有reads中出现异常的碱基,并进行纠错。
这种算法依赖于长reads覆盖率高于错误reads的性质,
如果覆盖率不够高,那么纠错效果可能会受到影响。
基于比对的纠错算法 bwa, BLASR等 将长reads和相关参考序列比对,根据匹配情况对错配发生的位置进行修正。 这种算法需要一个相关参考序列来进行比对,
如果参考序列不够准确或者与目标序列差异较大,
那么纠错效果可能会受到影响。
混合型纠错算法 LoRDEC等 结合了多种纠错方法,达到更高的准确度和健壮性。例如,LoRDEC结合了
PacBio长reads和Illumina短reads纠错,提高了基因组组装的准确性。
这种算法结合了多种纠错方法,但是由于其复杂性,
可能会导致计算时间较长。
Reply View the author