RenRen的样本,一般是2列数据,分别是用户名(同时也是邮箱)和口令,使用TAB分割。此样本的格式不太严谨,删除只有1列或者超过2列的无效记录共53412条,进一步剔除如邮箱长度超过50个字符或者口令长度超过20个字符的显然不合理数据后,记录数为4711943条。注意到其中有些用户名是重复的,重复次数最多的用户名是〃yourname@hotmail.com",共1388条,其次是〃yourname@domain.com",共818条,共计有549847条记录用户名重复,考虑到重复数量如此之多,网站可能通过其它我们未知的字段区分记录,故这部分数据没有剔除。 学生们对这两个网站的口令主要分析了口令长度分布、密码类型分布,以及使用手机号码、生日英文单词、Email地址等作为密码等情况统计,其中口令长度分布情况如图1所示。另外他们还对复杂密码,即字母+数字+特殊字符的密码进行了统计分析。 囹1CSDN和RenRen网漏口令长度分布百分比 通过分析发现,CSDN用户一般采用的是10位左右的数字密码或数字+字母的组合密码,其平均口令长度要高于RenRei^CSDN仍有超过23万人选择"123456789"这样的弱密码,作为主要是程序员一类的技术型用户,设置如此简单的密码,简直是不可思议的事情。由此可见普通网友设置密码仍然比较薄弱,因此加强密码设置强度已经刻不容缓。为此,第三组学生为网友提出了设置密码的基本要求:1)使用大小写字母、标点和数字组合;2密码字符数尽量多一些,12位左右较为合适;3)不要以任何形式使用你的用户名或是注册名;4)不要使用任何语言的单词作为密码;5)不要使用"password"作为密码;6)不使用关于自身的信息,如姓名、出生日期、绰号或者昵称、身份证号码、电话号码、手机号码、所居住的街道等,甚至家庭成员或宠物的名字;7)有规律地更换密码。 值得一提地是,在研究CSDN和RenRen样本中,他们发现大量用户名、邮箱或者密码完全相同或者极其相似的"水军"记录。第三组同学下一步准备对这部分数据深入挖掘,研究网络"水军"的行为特征[4]。 2.2假冒网站分析 欺骗攻击的实质是冒充身份认证以骗取信任的攻击方式,攻击者针对认证机制的缺陷,将自己伪装成可信任方,从而与受害者进行交流,最终获取信息或是展开进一步攻击。其中假冒网站是指攻击者利用欺骗性的电子邮件和伪造的网站(钓鱼网站)来进行网络诈骗的一种欺骗手段[5]。典型的网络钓鱼攻击是设计一个与正规网站极其相似的钓鱼网站,然后通过电子邮件等方式引诱用户进入该假冒网站,再通过用户输入账号和密码来窃取其重要信息。普通用户一般不会觉察到这个过程,而在蒙受损失后才会后知后觉。 目前互联网上的钓鱼网站传播途径主要有[6]:1)通过QQ、MSN、阿里旺旺等客户端聊天工具发送传播钓鱼网站链接;2)在搜索引擎、中小网站投放广告,吸引用户点击钓鱼网站链接;3)通过Email、论坛、博客、SNS网站批量发布钓鱼网站链接;4)通过微博、Twitter中的短连接散布钓鱼网站链接;5)通过仿冒邮件,如冒充"银行密码重置邮件",欺骗用户进入钓鱼网站;6)感染病毒后弹出模仿QQ、阿里旺旺等聊天工具窗口,用户点击后进入钓鱼网站;7)恶意导航网站、恶意下载网站弹出仿真悬浮窗口,点击后进入钓鱼网站;8)伪装成用户输入网址时易发生的错误,如gogle.com、sinz.com等,一旦用户写错,就误入钓鱼网站。 第四组同学在课堂上分析并演示了五种常见的欺骗攻击:IP欺骗、ARP欺骗、Email欺骗、DNS欺骗和Web欺骗,特别是对网络钓鱼的防御和检测提出了他们的见解。他们认为网络钓鱼不只是一个技术性问题,攻击者会不断发现攻击用户的新途径,目前没有单一的解决方案。 对于检测假冒网站,他们建议:1)通过第三方网站身份诚信认证辨别真实性;2)核对网站域名,假冒网站一般和真实网站有细微区别,如在域名方面,假冒网站通常将英文字母"1"替换为数字"1",CCTV换成CCYV等仿造域名;3)比较网站内容。假冒网站的字体样式与真实网站往往不一致;4)查询网站丨CP备案查询网站的基本情况;5)大型电子商务网站一般应用了可信证书类产品,如其网址非"https"开头,应谨慎对待;6)专用网站检测,如SiteWatcher检测假冒网站,如图2所示。 图2假冒网站检测 2.3SQL注入攻击及防御 随着B/S模式应用开发的流行,使用这种模式编写应用程序的程序员也越来越多。但由于程序员的水平及经验参差不齐,很多程序员在编写表单代码的时候,将用户输入的内容直接用来构造动态SQL命令或作为存储过程的输入参数,攻击者把SQL命令插入到Web表单的输入域或页面请求的查询字符串,欺骗服务器执行恶意的SQL命令这就是SQL注入攻击[7]。表面看SQL注入跟一般的Web页面访问没什么区别,一般防火墙也不会对SQL注入发出警报,故而网站被入侵很久也可能不会被发觉。据调查,国内采用ASP+Access或SQLServer数据库的网站占70%以上。 |