服务咨询电话
发表于:2019-06-21
作者:科翔信息
浏览 105 次
专利申请号:
CN200710175751.7
专利类型:
发明
IPC 分类号:
G06F17/30
应用领域:
用于关键词快速匹配。
现有技术缺点:
以往技术采用并行处理,不仅会增加硬件成本,而且系统的可实现性也是个大问题,不适合处理大规模关键词。
技术优势:
1、过滤散列表采用比特位的方式存储,可以有效节约存储空间。较好的利用了 Cache 局部性,从而有效提高了关键词匹配速度;
2、另外本发明结合基于位运算的散列值递推计算,可以在常数时间内进行散列值的计算,从而实现较快速度的大规模关键词匹配。
摘要:
本发明公开了一种关键词匹配方法和系统。首先读入关键词文件, 统计关键词个数,设置多个过滤散列表和一个校验散列表的掩码或大小;根据关键词和上述散列表掩码或大小构造该过滤散列表和该校验散列表;根据过滤散列表和校验散列表对输入的文本进行扫描匹配,将匹配结果存储在指定的内存结构或者外部文件中。本发明的方法和系统不仅有效提高关键词匹配的速度,还非常节约内存,并可以实现大规模关键词匹配。
(以上资讯来源于网络,如有侵权,请联系管理员删除。)
合肥科翔信息技术服务有限责任公司 版权所有 免责声明
地址:安徽省合肥市高新区天元路软件园1号楼210-212室
电话:180-1954-5300 QQ:2501649871
COPYRIGHT © 合肥科翔信息技术服务有限责任公司 ALL RIGHTS RESERVED. 皖ICP备2023003016号-1
技术支持:明图网络