首页毕业论文药学张元斌-基于Hbase和ElasticSearch的中药文献数据全文检索系统的研究与实现
搬砖公

文档

1752

关注

0

好评

0
DOCX

张元斌-基于Hbase和ElasticSearch的中药文献数据全文检索系统的研究与实现

阅读 808 下载 0 大小 2.49M 总页数 0 页 2025-12-15 分享
价格:¥ 50.00
下载文档
/ 0
全屏查看
张元斌-基于Hbase和ElasticSearch的中药文献数据全文检索系统的研究与实现
还有 0 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 0 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
南京中医药大学本科生毕业论文人工智能与信息技术学院计算机科学与技术专业2019年级学号084619220学生姓名张元斌论文题目基于HBASE和ElasticSearch的中药文献数据全文检索系统的研究与实现实习单位南京中医药大学指导教师胡晨骏起止时间2022.12-2023.52023年5月20日南京中医药大学人工智能与信息技术学院2023届本科毕业论文摘要中医药是中国传统医学的重要组成部分,其文献记载了丰富的理论知识和临床实践经验。中药文献作为传统医学的重要组成部分,具有重要的学术价值和实践意义。然而,由于近年来中药文献数量井喷式增长,传统的文献检索方法已经无法满足人们对于快速、准确检索文献的需求,将现代信息检索技术揉合到中药文献检索中,是历史的必然,也是时代的必须,研发一套基于大数据技术的中药文献全文检索系统具有重要的意义。本文提出了一种基于HBase和ElasticSearch技术的中药文献全文检索系统,通过采用基于ElasticSearch存储的HBase二级索引方案,弥补了HBase单一索引存在的限制,既有效地利用了HBse进行海量数据的存储和主键排序的数据检索,又合理地利用了ElasticSearch的倒排索引的特性以实现高效的全文检索,成功地结合了两个技术的优势,实现了更灵活、更高效的查询功能。系统在进行文献全文检索时能够以毫秒级的速度输出结果,查询效率极高,在实验过程中也系统表现出了可靠性和稳定性,长时间运行未出现崩溃或故障,并且有采取维护数据安全和用户隐私的保护措施。关键词:HBase;ElasticSearch;二级索引:中药文献检索南京中医药大学人工智能与信息技术学院2023届本科毕业论文AbstractTraditional Chinese medicine (TCM)is a crucial part of Chinese medical heritage,withextensive records of theoretical knowledge and vast clinical experience.Chinese medical literatureserves as an important component of traditional medicine,offering significant academic value andpractical significance.However,due to the recent exponential growth in TCM literature,traditional literature retrieval methods can no longer meet the demand for rapid and accuratesearches.Incorporating modem information retrieval techniques into TCM literature searches is ahistorical necessity and a requirement of our times.Developing a comprehensive full-text searchsystem for TCM literature based on big data technology is of great importance.This article proposes a full-text search system for TCM literature based on HBase andElasticSearch technologies.By adopting a HBase secondary index scheme based on ElasticSearchstorage,the limitations of HBase's single index are effectively addressed.The system efficientlyutilizes HBase for massive data storage and primary key sorted data retrieval while reasonablyhamessing ElasticSearch's inverted index feature for highly efficient full-text searches.Bysuccessfully integrating the advantages of both technologies,the system achieves more flexibleand efficient querying functions.When conducting full-text searches of the literature,the systemprovides results with millisecond speed,exhibiting extremely high efficiency.Throughout theexperimentation process,the system demonstrated reliability and stability,with no crashes orfaults occurring during longtime operations.Additionally,it employs measures to maintain datasecurity and protect user privacy.Keywords:HBase;ElasticSearch;Secondary Index;Literature Search of TCM
文档评分
    请如实的对该文档进行评分
  • 0
发表评论
返回顶部

问题、需求、建议

扫码添加微信客服