文 档: 在线黑产中黑话的检测
作 者: 段海新 duanhx@tsinghua.edu.cn 清华大学 网络研究院
语 言: 中文
标 签 黑色产业链 数据分析 安全研究
介 绍:
  • 近年来地下经济(黑产)的发展与对抗
  • 近年来我们关于黑产的研究
  • 基于泛名的Blackhat SEO ——蜘蛛池检测(USENIX Security 2016)
  • 如何学习不用字典学习 Klingon语言 地下经济中使用黑话的检测与测量
  • 如何学习克林贡语(Klingon)
  • 从Amazon买一本Klingon 语言的字典
  • 但是,作为中国人,你也许不懂“溜冰壶”
  • 在Google搜索“溜冰壶”
  • 百度 图片搜索“溜冰壶”
  • 行话,黑话,黑词(jargons, black words)
  • 黑话用来逃避检测
  • 黑话在与检测的对抗中不断演进,无法预测
  • 重用现存的词,但是含义不同,很难应用现有自然语言处理技术
  • 点启发:1)有些页面已经被标记为恶意;2)一个页面推广多种黑词
  • 我们的贡献
  • 我们的方法:关键词驱动的黑色产业推广链条
  • 黑产推广的模式 我们的检测流程—KDES
  • 如何提取关键词——锚文本是最有效的
  • 如何过滤热点新闻
  • 利用搜索引擎的标签,判断白词和黑词
  • 利用相关搜索来扩展黑词
  • 结果:~40万 新的关键词,~2M URL, ~ 1M 域名,1500核心词,6类
  • 最热门的黑词、对搜索引擎的污染
  • 结果分析、测量
  • 这些黑词在贴吧和知道等论坛上出现的情况
  • 总结和未来的工作
附件下载
相关推荐
《安天365安全研究》第二期
  • 安天365安全研究,web安全,渗透测试,安全研究,安全期刊
#目录 - 第 1 部分拟研究技术专题 - 1.1《黑客攻防实战—
面向信息安全的大数据分析-概念、过程、应用、实现
  • 大数据分析
- 大数据分析的基本概念 - 面向安全的大数据分析过程 - 面向安全的大数据
DNS中的“奇葩”数据解析
  • DNS,数据分析,数据分析与挖掘
#Outliner - Domain - • DGA
安全客2017季刊—第4期
  • 安全客,安全运营,漏洞分析,安全研究,安全事件,木马
#目录 - 【人是安全的尺度】 - 大安全时代面临新威胁大挑战,记录
《信息安全研究》2018年 4卷 3期
  • 信息安全研究,学术论文,技术应用,政策法规
- 特别策划 - 海泰方圆,安全创造价值 - 政策法规专题
画地为牢-公共Wi-Fi的黑白暗战
  • 无线安全,安全防护,黑色产业链
- 目录 - • 1.时隔一年,物是人非(如今的公共WiFi安全现状) -
阅读心得