做TG的,想扒一下纸飞机的公开数据,又怕泄露用户隐私。数据湖里怎么做好安全,防止用户信息被滥用?
你这担心很合理,抓数据的时候确实得注意隐私问题,别踩坑。
数据湖那边得设访问权限,不是谁都能随便看的,最好加密存储,就算被人拿去也看不懂。数据脱敏也得做,用户ID、手机号这种敏感字段,该打码打码。
如果是抓公开数据,也要确认这些数据确实是公开的。有些表面看是公开的,其实不能随便用。最后建议定期审计日志,看下有没有异常访问行为。这样可以提前发现风险。
搞清楚目的,别越界就行了。