华中科技大学

基于Hadoop存储的文件管理系统的研究与实现

作者:
马登邑

关键词:
文件管理 Hadoop存储 分割上传 XML信息存储

摘要:
互联网技术的日新月异和云存储技术的突飞猛进,带来了数据存储方式的巨大变革,促进了网络硬盘的快速发展。网络硬盘改变着人们进行文件管理的方式,而针对中小企业海量数据的文件管理系统发展却相对滞后,因此,研究适用于中小企业的文件管理系统尤为重要。本文在分析了文件管理系统的功能和性能需求的基础上,给出了系统的总体架构方案、开放型结构封装方案、文件上传方案和用户信息管理优化方案,并对上述方案进行了具体实现。在总体方案中,设计了总体功能结构方案,并根据功能结构划分设计了服务器部署方案;在开放型结构封装中,将底层功能接口资源化,实现资源的远程调用,并将资源调用方法封装成开发包,供其它开发平台使用,增强系统的开放性;在文件上传中,进行文件动态分割,实现文件多线程上传,利用增量算法实现文件断点续传,提高文件上传效率,结合消息队列管理服务,实现文件离线传输到Hadoop分布式存储服务器;在用户信息管理中,建立用户与文件信息的两级索引,将结构化的数据转换为半结构化的树目录数据存储,并实现半结构化数据XML的维护和解析。本文研究和实现的基于Hadoop存储的文件管理系统具有开放型封装结构、文件高效上传和用户信息快速获取等优点,在功能和性能测试上,达到了预期目标,能够适用于中小企业海量数据的文件管理。

在线下载

相关文章:
在线客服:
对外合作:
联系方式:400-6379-560
投诉建议:feedback@hanspub.org
客服号

人工客服,优惠资讯,稿件咨询
公众号

科技前沿与学术知识分享