第16期“安全范儿”技术沙龙「LLM安全漏洞挖掘」专场 - 议题列表 - VipRead 信息安全知识库

主页 / 第16期“安全范儿”技术沙龙「LLM安全漏洞挖掘」专场 / 议题列表

火山引擎AI安全保障实践-曲乐炜

作者: 曲乐炜@火山引擎
收录: 2025-08-15T02:45:44Z
简介:

这份文档详细介绍了火山引擎在AI领域的安全保障实践。首先，文档概述了火山引擎的AI业务架构，该架构涵盖了从底层AI基础设施（AI Infra）、大模型服务平台（MaaS）到智能体开发运维（Agent DevOps）和最终的AI智能体（AI Agent）应用的全方位服务。文档的核心部分阐述了火山引擎的AI安全保障方案，强调“安全是一切Agent的基础”。该方案构建了一个多层次的纵深防御体系，

LLM 间接提示注入漏洞解析与防御路线

作者: 杨武⼒@百度
收录: 2025-08-15T02:27:17Z
简介:

演示首先概述了LLM面临的普遍安全风险，并引用OWASP的报告，强调“提示注入”是首要威胁。近期多所国际知名大学的论文被发现植入了操控AI给出好评的隐形指令，这便是提示注入的实例。研究数据表明，与直接提示注入相比，间接提示注入（IPI）的攻击成功率要高得多，因为它将恶意指令隐藏在模型处理的网页、文档等外部内容中，模型在解析时会自动执行。接着，文稿深入分析了IPI的攻击原理。其有效性的关键在

AI Agent应用攻击面漫谈

作者: 黎轲（郁离歌、）@字节跳动
收录: 2025-08-15T02:05:44Z
简介:

该报告深入探讨了AI Agent应用面临的攻击面。首先，报告概述了AI Agent的定义、决策流程（感知、规划、行动）和关键特性（自主性、适应性等），并介绍了其在客服、办公助手等领域的广泛应用。其核心技术架构由大型语言模型（Model）、代理运行时（Agent Runtime）、功能工具（Tools）以及底层支持服务（Supporting Services）构成。报告的核心部分详细剖析了A

LLM&Agent安全防护实战-业务落地视角下的风险管控与解决方案

作者: 吴栋贤@字节跳动,张杭生@字节跳动
收录: 2025-08-15T01:49:40Z
简介:

文稿深入探讨了随着大型语言模型（LLM）与AI智能体（Agent）能力日益强大，所带来的严峻安全挑战。报告指出了几大核心风险领域： * **有害内容输出**：模型可能被诱导生成歧视性或极端的有害言论。 * **数据与隐私泄露**：系统提示（System Prompt）和个人身份信息（PII）面临泄露风险。攻击者可通过路径遍历等手段实现数据越权访问。 * **目标劫持**：通过间接

1