主页 / 2017网络安全生态峰会 / 在线黑产中黑话的检测
-
标题
-
作者段海新 [email protected] 清华大学 网络研究院
-
简介
- 近年来地下经济(黑产)的发展与对抗
- 近年来我们关于黑产的研究
- 基于泛名的Blackhat SEO ——蜘蛛池检测(USENIX Security 2016)
- 如何学习不用字典学习 Klingon语言 地下经济中使用黑话的检测与测量
- 如何学习克林贡语(Klingon)
- 从Amazon买一本Klingon 语言的字典
- 但是,作为中国人,你也许不懂“溜冰壶”
- 在Google搜索“溜冰壶”
- 百度 图片搜索“溜冰壶”
- 行话,黑话,黑词(jargons, black words)
- 黑话用来逃避检测
- 黑话在与检测的对抗中不断演进,无法预测
- 重用现存的词,但是含义不同,很难应用现有自然语言处理技术
- 点启发:1)有些页面已经被标记为恶意;2)一个页面推广多种黑词
- 我们的贡献
- 我们的方法:关键词驱动的黑色产业推广链条
- 黑产推广的模式 我们的检测流程—KDES
- 如何提取关键词——锚文本是最有效的
- 如何过滤热点新闻
- 利用搜索引擎的标签,判断白词和黑词
- 利用相关搜索来扩展黑词
- 结果:~40万 新的关键词,~2M URL, ~ 1M 域名,1500核心词,6类
- 最热门的黑词、对搜索引擎的污染
- 结果分析、测量
- 这些黑词在贴吧和知道等论坛上出现的情况
- 总结和未来的工作
-
提示本站仅做资料的整理和索引,转载引用请注明出处
相关推荐
-
2017-12-16 10:45:11
-
2020-06-15 08:29:21
-
2020-08-24 12:30:41.672988
-
2019-12-24 14:09:08
附件下载
-
11.黑产中黑词的检测与扩展应用.0726.pptx