文 档: 在线黑产中黑话的检测
作 者: 段海新 duanhx@tsinghua.edu.cn 清华大学 网络研究院
语 言: 中文
标 签 黑色产业链 数据分析 安全研究
介 绍:
  • 近年来地下经济(黑产)的发展与对抗
  • 近年来我们关于黑产的研究
  • 基于泛名的Blackhat SEO ——蜘蛛池检测(USENIX Security 2016)
  • 如何学习不用字典学习 Klingon语言 地下经济中使用黑话的检测与测量
  • 如何学习克林贡语(Klingon)
  • 从Amazon买一本Klingon 语言的字典
  • 但是,作为中国人,你也许不懂“溜冰壶”
  • 在Google搜索“溜冰壶”
  • 百度 图片搜索“溜冰壶”
  • 行话,黑话,黑词(jargons, black words)
  • 黑话用来逃避检测
  • 黑话在与检测的对抗中不断演进,无法预测
  • 重用现存的词,但是含义不同,很难应用现有自然语言处理技术
  • 点启发:1)有些页面已经被标记为恶意;2)一个页面推广多种黑词
  • 我们的贡献
  • 我们的方法:关键词驱动的黑色产业推广链条
  • 黑产推广的模式 我们的检测流程—KDES
  • 如何提取关键词——锚文本是最有效的
  • 如何过滤热点新闻
  • 利用搜索引擎的标签,判断白词和黑词
  • 利用相关搜索来扩展黑词
  • 结果:~40万 新的关键词,~2M URL, ~ 1M 域名,1500核心词,6类
  • 最热门的黑词、对搜索引擎的污染
  • 结果分析、测量
  • 这些黑词在贴吧和知道等论坛上出现的情况
  • 总结和未来的工作
附件下载
相关推荐
2016年我国互联网网络安全态势报告
  • 网络安全态势,安全状况,安全热点,安全监测数据分析
#报告主要内容 - 2016年我国互联网网络安全监测数据分析 - 2016年
用户行为分析(UBA)与内部威胁
  • 内部威胁,外部威胁,UBA,数据分析, 用户行为分析
- 内部威胁VS外部威胁 - 内部威胁类型 - UBA的定义和发展阶段 -
《信息安全研究》2016年 2卷 10期
  • 信息安全研究,技术应用,学术论文
- 特别策划 - 助力-互联网+”行动:解读卫士通的网络安全 - 学
面向工业控制系统的可信处理技术
  • 工控,工控安全,可信计算,安全研究
#内容提要 - 工业控制系统安全现状 - 需求分析 - 工控可信处理技术
可视化在复杂安全分析中的应用
  • 可视化,可视分析 ,数据可视化,大数据分析,安全分析
- 满城尽是可视化 - 可视化与认知 - 通过设计视觉符号提高效率 - V
《信息安全研究》2016年 2卷 3期
  • 信息安全研究,技术应用,学术论文
- 特别策划 - 助力-互联网+”行动:解读北信源的信息网络安全 -
阅读心得