文 档: 在线黑产中黑话的检测
作 者: 段海新 duanhx@tsinghua.edu.cn 清华大学 网络研究院
语 言: 中文
标 签 黑色产业链 数据分析 安全研究
介 绍:
  • 近年来地下经济(黑产)的发展与对抗
  • 近年来我们关于黑产的研究
  • 基于泛名的Blackhat SEO ——蜘蛛池检测(USENIX Security 2016)
  • 如何学习不用字典学习 Klingon语言 地下经济中使用黑话的检测与测量
  • 如何学习克林贡语(Klingon)
  • 从Amazon买一本Klingon 语言的字典
  • 但是,作为中国人,你也许不懂“溜冰壶”
  • 在Google搜索“溜冰壶”
  • 百度 图片搜索“溜冰壶”
  • 行话,黑话,黑词(jargons, black words)
  • 黑话用来逃避检测
  • 黑话在与检测的对抗中不断演进,无法预测
  • 重用现存的词,但是含义不同,很难应用现有自然语言处理技术
  • 点启发:1)有些页面已经被标记为恶意;2)一个页面推广多种黑词
  • 我们的贡献
  • 我们的方法:关键词驱动的黑色产业推广链条
  • 黑产推广的模式 我们的检测流程—KDES
  • 如何提取关键词——锚文本是最有效的
  • 如何过滤热点新闻
  • 利用搜索引擎的标签,判断白词和黑词
  • 利用相关搜索来扩展黑词
  • 结果:~40万 新的关键词,~2M URL, ~ 1M 域名,1500核心词,6类
  • 最热门的黑词、对搜索引擎的污染
  • 结果分析、测量
  • 这些黑词在贴吧和知道等论坛上出现的情况
  • 总结和未来的工作
附件下载
相关推荐
大浪淘沙-海量web日志异常挖掘
  • 日志分析,数据分析,异常挖掘检测
#目录 - 概述 - 什么是海量web日志异常挖掘 - 异常类型
《安天365安全研究》-2017-04
  • 安全研究,安全期刊
#目录 - 第 1 部分拟研究技术专题 - 1.1《黑客攻防实战—
安全数据科学分享
  • 数据分析,机器学习
#FrameWork - • 机器学习的基本概念 - • 机器学习在安全领域
从数据视角探索安全威胁
  • 数据清洗,威胁感知,数据分析
本议题讨论了数据为安全人员思维方式带来的变化。尝试从数据角度对传统威胁感知方案进
《信息安全研究》2016年 2卷 4期
  • 信息安全研究,技术应用,电子数据取证,学术论文
- 特别策划 - 助力-互联网+”行动:解读中兴通讯的网络安全 -
《信息安全研究》2015年 1卷 3期
  • 信息安全研究,大数据,技术应用,学术论文
- 特别策划 - 助力-互联网+”行动:解读腾讯的网络安全 - 大
阅读心得