主页 / 2017网络安全生态峰会 / 在线黑产中黑话的检测
  • 作者
    段海新 duanhx@tsinghua.edu.cn 清华大学 网络研究院
  • 简介
    • 近年来地下经济(黑产)的发展与对抗
    • 近年来我们关于黑产的研究
    • 基于泛名的Blackhat SEO ——蜘蛛池检测(USENIX Security 2016)
    • 如何学习不用字典学习 Klingon语言 地下经济中使用黑话的检测与测量
    • 如何学习克林贡语(Klingon)
    • 从Amazon买一本Klingon 语言的字典
    • 但是,作为中国人,你也许不懂“溜冰壶”
    • 在Google搜索“溜冰壶”
    • 百度 图片搜索“溜冰壶”
    • 行话,黑话,黑词(jargons, black words)
    • 黑话用来逃避检测
    • 黑话在与检测的对抗中不断演进,无法预测
    • 重用现存的词,但是含义不同,很难应用现有自然语言处理技术
    • 点启发:1)有些页面已经被标记为恶意;2)一个页面推广多种黑词
    • 我们的贡献
    • 我们的方法:关键词驱动的黑色产业推广链条
    • 黑产推广的模式 我们的检测流程—KDES
    • 如何提取关键词——锚文本是最有效的
    • 如何过滤热点新闻
    • 利用搜索引擎的标签,判断白词和黑词
    • 利用相关搜索来扩展黑词
    • 结果:~40万 新的关键词,~2M URL, ~ 1M 域名,1500核心词,6类
    • 最热门的黑词、对搜索引擎的污染
    • 结果分析、测量
    • 这些黑词在贴吧和知道等论坛上出现的情况
    • 总结和未来的工作
  • 提示
    本站仅做资料的整理和索引,转载引用请注明出处
附件下载
  • 11.黑产中黑词的检测与扩展应用.0726.pptx
    时间: 大小: 25.94 M 下载: 173