服务咨询电话
发表于:2019-06-11
作者:科翔信息
浏览 124 次
专利申请号:
CN200810223683.1
专利类型:
发明
IPC 分类号:
G06F19/18
应用领域:
用于规模化蛋白质鉴定。
现有技术缺点:
现有技术在计算机上对肽序列的排序和去冗所要花费的时间较长、效率较低。
技术优势:
1、动态划分每次索引的肽序列范围,将词典和倒排表的创建过程全部放在内存中完成,保证高效率的创建索引。
2、每次在内存中保留一定质量范围的索引,不需要产生临时文件, 空间消耗低。
3、肽序列用定长结构表示,有利于存储和查询。
4、采用位向量来标记肽序列是否为冗余序列,避免在肽序列数组中删除元素。
摘要:
本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列在各个计数窗口内的数量;根据计算机内存的大小得到在计算机内存中一次可处理的肽序列的数量,结合肽序列在各个计数窗口内的数量,得到在计算机内存中一次处理的肽序列的质量范围段;对蛋白质数据库做模拟酶切,将所得到的在一个质量范围段内的肽序列保存在计算机内存中,并在计算机内存中完成对所保存肽序列的排序、去冗余以及建立词典和倒排表的操作;为每个质量范围段建立词典和倒排表。
(以上资讯来源于网络,如有侵权,请联系管理员删除。)
合肥科翔信息技术服务有限责任公司 版权所有 免责声明
地址:安徽省合肥市高新区天元路软件园1号楼210-212室
电话:180-1954-5300 QQ:2501649871
COPYRIGHT © 合肥科翔信息技术服务有限责任公司 ALL RIGHTS RESERVED. 皖ICP备2023003016号-1
技术支持:明图网络