【京华思为】北京天津公司专为政企客户提供戴尔服务器、浪潮服务器、H3C服务器、超聚变服务器、机房数据中心建设等服务! | 网站地图
欢迎来到你问我答第二期:非结构化数据怎么存?
来源:www.bjjhsw.cn 发布时间:2022年04月21日
欢迎来到你问我答第二期:非结构化数据怎么存?成都戴尔存储代理商告诉我们,结构化数据如日期、电话号、账户余额、产品名称等,严格遵循数据格式与长度规范、易于由二维表结构进行逻辑表达和实现。与之相反,非结构化数据结构不规则或不完整、缺乏预定义数据模型、格式多种多样,比如文档、图片、音频、视频、社交媒体记录等,往往呈现出杂乱无章的特点。
针对结构化数据,市面上有大量成熟的分析工具可用来实现数据洞察,但非结构化数据难以标准化和理解,处理难度较大,对其价值挖掘尚处于发展阶段。
关于非结构化数据存储,成都戴尔存储代理商指出,目前业内主要有擅长存储文件的NAS文件存储和对象存储两种选项。
1、文件存储
以文件和文件夹为操作对象,基于文件夹/文件的路径访问数据。这是一种比较接地气的形式,我们日常在电脑里先打开父文件夹,再层层点开父文件夹嵌套的子文件夹,找到子文件夹里的某个文件,这一套流程就是文件存储的体验。
作为数据存储老手,文件存储已经被广泛应用十几年,它能兼顾多个应用和多个用户访问,突出优势是方便文件共享。
2、对象存储
是近些年的存储网红,它以对象(object,不是搞对象的对象)为操作对象。不同于文件存储的树状嵌套分层结构,对象存储架构更为扁平化,它将数据及其元数据打包放到一个超大的资源池,用户可根据元数据快速定位文件。
有这么一个比喻,同样到商场存包,文件存储这个商场里,你要记住自己的物品放在哪间储存室的哪排柜子的第几号,而在对象存储商场,存包员会给你一张凭条,你只需将凭条交给存包员即可取包,无需记住数据以什么形式存在了哪里。
成都戴尔存储代理商表示,对象存储的灵活性和扁平架构决定了它可以通过扩展来存储数据,其容量通常可达到EB级以上,从理论上讲对象存储的容量和对象数量可以扩充。