在我们日常的工作中,不断的接触大数据相关的内容。然而我们发现,无论是大数据组件,还是整个大数据体系,都没有完善安全机制。诸多组件的管理端口和通信端口都可以被非授权访问。配置Kerberos的认证,无论是搭配Sentry还是Ranger,整个实践过程也并不简单,上下游和其他业务系统的安全对接也是困难重重。
当数据被加工使用时,数据访问权限控制,敏感数据脱敏,隐私数据保护成了另外一个不可回避的问题。
因此,我们组成了这么一个松散的兴趣小组,在大数据与安全相结合的交叉领域,探索一些新的技术可能性。
- BD 代表 Big Data , 即大数据技术;
- SEC 代表 Security, 即安全技术;
- x 则表示两者相乘。
BDxSEC = Big Data x Security!