2000w酒店数据安全吗?使用前必须了解的风险!

格科网

说到这个 ‘2000w酒店数据’ ,当时在圈子里闹得挺厉害的。不少人都在传,据说是哪个酒店管理系统出篓子,数据被人整个拖走。

我也是挺好奇的,主要是从技术的角度想看看,这么大量的数据泄露出来,到底是个什么情况。那会儿网上能找到一些流传的下载源,挺乱的,真假难辨,但还是有人搞到。

我记得当时费点劲儿,也弄到一份。下下来一看,嚯,还真不小,压缩包好像就有1个多G,解压出来更大,得好几个G。文件格式印象里是文本类的,可能是CSV,或者是SQL导出的脚本,时间有点久记不太清。

2000w酒店数据安全吗?使用前必须了解的风险!

开始捣鼓

这么大的文件,用普通的文本编辑器是打不开的,肯定卡死。我就想着,得把它弄到数据库里去才方便看。当时手上正好有环境,就随手搭个MySQL。

然后就是写个简单的脚本,主要是Python写的,用来解析那个大文件,然后一条一条往数据库里插。这个过程还挺费时间的,毕竟数据量在那儿摆着。中间还遇到点小麻烦,比如文件编码问题,还有些脏数据,导致脚本中断,得手动处理一下再继续跑。前前后后折腾大半天,才把数据囫囵导进去。

简单看看

数据导进数据库之后,事情就简单多。我就随便写几条SQL查询语句,主要是想看看数据的整体结构和大概内容。

字段还挺多的,姓名、身份证号、手机号、邮箱、家庭住址、入住酒店名称、房间号、入住和退房时间……基本上能想到的敏感信息都有。真的是触目惊心

2000w酒店数据安全吗?使用前必须了解的风险!

随便翻翻,数据看起来有真有假。有些信息格式规整,看起来挺靠谱,但也有些明显是错误的,或者格式混乱。这说明原始数据采集和管理本身就可能存在问题,再加上泄露和传播过程中的各种处理,数据质量就更没法保证。

我当时主要做几件事:

  • 看看数据的时间跨度:好像主要是集中在某几年,跨度还挺长的。
  • 统计下涉及的酒店范围:确实像传言说的,主要是些连锁快捷酒店。
  • 感受下数据量:两千万条记录,对应的人数可能稍微少点,因为一个人可能有多条记录,但那也是个非常庞大的数字。
  • 2000w酒店数据安全吗?使用前必须了解的风险!

一些想法

看完之后,心里挺不是滋味的。主要感觉有几点:

  • 安全意识太差:能让这么大规模的数据泄露出来,说明当时相关系统的安全防护措施几乎等于没有。开发、运维、管理,各个环节肯定都有问题。
  • 个人隐私荡然无存:这些信息要是被不法分子利用,后果不堪设想。精准诈骗、敲诈勒索,简直是细思极恐。
  • 2000w酒店数据安全吗?使用前必须了解的风险!

  • 数据价值与风险并存:大数据时代,数据是金矿,但也是炸药。管理不就会引发灾难。

我搞这个数据,纯粹是出于技术研究和对这个事件本身的好奇。看完之后,解大概情况,我就把本地的数据和数据库都彻底删除。这种东西留在手里没任何好处,纯粹是个烫手山芋,还是个法律风险极高的玩意儿

这事儿也给我自己敲个警钟,平时在外面,无论是住酒店还是连接公共WiFi,都要多留个心眼。密码设置复杂点,敏感操作尽量走自己的流量。毕竟在这个时代,保护好自己的数据太重要。

现在回想起来,那几年确实是网络安全意识相对薄弱的时期,很多系统都是“裸奔”状态。希望经过这么多年的发展和各种安全事件的教训,现在的情况能好很多。

免责声明:由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权,根据《信息网络传播权保护条例》,如我们转载的作品侵犯了您的权利,请您通知我们,请将本侵权页面网址发送邮件到qingge@88.com,深感抱歉,我们会做删除处理。