本文介绍如何基于OSS并使用MaxCompute构建PB级数据仓库。通过MaxCompute对OSS上的海量数据进行分析,将您的大数据分析工作效率提升至分钟级,帮助您更高效、更低成本的挖掘海量数据价值。
前提条件
- 已开通OSS服务,并已创建Bucket。
- 已开通MaxCompute服务,并已授权MaxCompute访问OSS。
- 开通MaxCompute服务请参见开通MaxCompute。
- MaxCompute需要直接访问OSS的数据,因此需要将OSS的数据相关权限赋给MaxCompute的访问账号。您可以在直接登录阿里云账号后,单击此处完成一键授权。
背景信息
互联网金融应用每天都需要将大量的金融数据交换文件存放在OSS上,并需要进行超大文本文件的结构化分析。通过MaxCompute的OSS外部表查询功能,用户可以直接用外部表的方式将OSS上的大文件加载到MaxCompute进行分析,从而大幅提升整个链路的效率。