数据的采集及应用
先讲下商业领域的数据分析,商业领域数据分析一般是采用静态数据结合动态数据标签化的方式分析或者建模预测。采集往往是多对一的注册提交、或者是以授权方式的交换,以个人标签体系为示例:企业为了更好的服务客户,往往会以数据为基础,链接产品和用户开展商业活动。比如一些经典的营销理论提到的4P4C理论,4P【产品(product)、价格(price)、渠道(place)、促销(promotion)】,4C【成本(cost)、消费者(consumer)、方便性(convenience)、交流(communication)】。个性化服务的背后是精准营销,这个过程往往需要大量的涉敏数据或者脱敏降级的数据去支撑分析建模。个保法对于个人信息的处理要求我们再看一段《个人信息保护法》。这几段主要讲解了关于个人数据的处理过程和保护制度。《个人信息保护法》里面提到两个概念,一个是去标识化,一个是匿名化。去标识化,是指个人信息经过处理,使其在不借助额外信息的情况下无法识别特定自然人的过程。匿名化,是指个人信息经过处理无法识别特定自然人且不能复原的过程。个人理解去标识化不再保留数据的类别特征、而匿名化则无法定位到具体的自然人身份。以手机号13888888888举例,去标识化处理后形态不再具备能够推断手机号的特征,比如1*8,从组成特征看可能的类别更广。而匿名化无法定位特定自然人,一般的脱敏手段,可能是针对部分位数进行遮蔽、仿真处理,从而无法推断自然人身份。
现有数据安全防护的思考验证
传统的攻击手段往往是基于主机、系统、web应用、API、数据库等,有很强的边界感,相对应的基于这块的网络安全建设已经相对成熟一点,比如日志审计、杀毒软件、鉴权授信、流量监测、加密、容灾备份等等,包括相关的立法、司法对于量刑已经非常成熟了。在这种情况下进行一些相关活动,考验其实不是技术能力,更多的是偏向于心跳、胆量方面。而数据安全的防护建设目前是在法规、标准下指导,在实际落地过程当中,可能要结合业务架构、流程、管理、现有的安全体系建设并行。并且不再是局限于传统的制度、标准、规范、流程、工具,应该将数据安全意识真正的普及到个人。金融、证券、保险、运营商、能源交通、政务等关键基础设施领域根据敏感性将数据分为1-4级或1-5级。以个人数据分析为例,带有唯一标识的往往敏感性比较高,比如手机号、身份证;以商业数据分析为例,涉及财务、业务、产品营销类信息往往敏感性比较高;其他依次类推。目前对于个人敏感数据的处理往往是以匿名化、去标识化的方式进行降级,进行公开。比如我们考的证书在某些网站上公示,涉及身份属性,往往是以手机号、身份证号为代表的脱敏数据,便于个人鉴别,但本身也带有一定的敏感性;比如餐饮领域我们点的外卖,脱敏通常是手机号中间的四位,而点外卖这件事情本身就带着区域的信息。目前使用的手机号为11位。前三位为网络识别号中间四位为地区编码最后四位为用户号码目前大部分服务行业采用的脱敏方式为地区编码,而本身服务行业已经带有很强的地区属性了。比如189****5678的用户点了一份外卖。那么我们就可以推断中间的四位。首先我们写一个简单的程序,生成移动、联动、电信所有的地区表并进行简单的统计。查询189开头的号码。在189所有的区域339条分布中,均值为30,中位数为15,标准差为49,可以看到遮蔽区域已缩小到十位数的可验证区间。假设我们是在常州区域看到的这样一组信息(正如前面所说,业务区域的活动本身就带有地区信息),点外卖的是一位江苏常州电信的大哥,我们将所有号码生成,计算号码中每个数字出现的频率,进行卡方检验,按照P值排序,提高验证效率。还原出了常州电信大哥的号码,排在了第2位。类似的还原可以用于身份证号、驾驶证号等等。但通常是有了一条线索之后,不法分子可以进行社工。
日常个人对于敏感数据的防护
我们日常生活中,关于数据安全方面的法律法规建设已经相对完善。无论是从自身的商业利益还是合规,企业侧也在积极参与相关的数据安全建设,但是仍然存在别有用心之人对于敏感数据的相关利用,进行一些违规设计、概率操作。正如之前提到的12类个人属性数据,对于个人相关的信息首先自己应该保持敏感不公开,包括日常车票,身份证、外卖单、快递单、医疗信息等等,减少这样敏感数据的暴露面。
4A评测 - 免责申明
本站提供的一切软件、教程和内容信息仅限用于学习和研究目的。
不得将上述内容用于商业或者非法用途,否则一切后果请用户自负。
本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。
如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。敬请谅解!
程序来源网络,不确保不包含木马病毒等危险内容,请在确保安全的情况下或使用虚拟机使用。
侵权违规投诉邮箱:4ablog168#gmail.com(#换成@)