基于污点分析的 AI 自动化漏洞挖掘尝试

本文为知道创宇404实验室内部分享沙龙“404 Open Day”的议题内容，作为目前团队AI安全研究系列的一部分，分享出来与大家一同交流学习。

1. 概述

本文是受Protect AI的vulnhuntr项目[1]的启发，结合自己的经验做的另一种AI挖洞的尝试，如下图所示：

与vulnhuntr思路不同的是，我们先逆向找到sink到source的链路，再利用AI做Source到Sink的正向污点分析来检测和判断整个链路的连通性。当然这种方式只适用于调用链不是很深的常规漏洞挖掘，因为链路查找如果不做污点分析，对于反序列化利用链这种情况会延伸出很多无效链路，肯定是不现实的。后面我也设计了V2版本来适配做反序列化利用链的查找，但是用AI测试的效果并不好，不过只是一种尝试罢了。

为什么想用AI做污点分析？

最初的想法：用AI做污点传递连通性检测可能更有优势，它的知识量很大而且很智能，根据网页版交互使用体验和测试，它有时候确实能给你惊喜，所以做了下去

2. 调用链查找-工具端-V1版

由于做Java方面多一些，对编译后的字节指令和源代码更熟练一点，后续部分都是以Java语言为例。

2.1 整体设计

大致分为两部分，一部分处理类信息库，一部分做反向搜索链的查找，如下图所示：

类信息库处理：

源代码：AST方式，优点是AI可能识别和处理效果好一点，缺点是信息的补全处理以及需要人工模拟栈调用
字节码：ASM，当然也可以反编译然后转AST方式，优点是不用补全信息以及栈模拟调用，缺点可能是AI识别和处理可能会差一点？也不一定，得看模型的处理能力

反向调用链查找：

Sink规则：可以自己收集，可以从一些开源的、非开源的工具提取
Source规则：可以是通用的框架、常规入口点，可以是根据实际审计环境自定义入口
搜索算法：由于没有做污点分析，Sink->Source就是一直向上找"who call me"，还有就是多态、Object、Collection等特殊情况的处理
提示信息：可以为每层调用添加提示AI的信息，例如多线程无显示调用，我在代码中做了关联，需要用提示信息提示AI做对应的处理

2.2 为什么要反向找链

2.3 附加提示信息

附加信息可以提示AI做对应的转换处理。

3. 链路连通性检测-AI端-V1版

3.1 整体设计

由于目前Java对AI处理的适配性没有Python、JS好，所以做了API/RPC这种结构，AI端需要的信息从远程Java端进行获取，如下图所示：

整体思路就是从Java端拿到调用链信息，发送携带调用链信息的Request，响应的Response需要哪些信息，就在上一次Request的基础上添加这些信息，如此循环直到AI判断无法继续向下走或者拥有足够的信息能判断最终链路连通。

3.2 Prompt

主要就是限定请求模板和相应模板做数据映射和控制，以及具体的分析方法。

3.3 分析方法

这里还可以加入sanitize检测，但是目前AI对sanitize的检测不太行，而且很多bypass方法AI可能还没有人工处理得好，因此这里没有加入。

4. 漏洞演示-V1版

这个版本是去年做的，当时XAI的grok线上模型有免费的额度，用之前某cms旧版本做了下小测试，录了个演示视频，可以在此处观看： https://www.bilibili.com/video/BV1ELAceYEBx/

5. 一个JDK链引发的改版-V2版

当时是一个朋友问我，虽然最初的想法本就不是做这种反序列化的利用链的挖掘，但是还是做了下尝试，然后引出了改版以适配做这种反序列化利用链挖掘，如果能适配好有能力挖掘反序列化利用链的能力，那挖常规漏洞更是易如反掌了。

6. 试错-V2版

中间做了很多试错的测试，最后得出用每两层之间做污点分析的方法：从上一层->sink，上上层->上一层...，通过使用这种思路，如果sink->上一层的通路都无法进行了，那就没必要继续了。这种方式提前加入污点分析，就能更早中止链路，防止后续无效链路的延伸。

7. 条件控制-V2版

为了防止无效链路出现，需要加入更多的条件控制，对于每两层调用，首先要做的就是检测被调用函数，如下图所示：

这里其实是对多态的处理，需要AI根据上下文推测实际的类型，如果没有绑定其他类型并且该处调用是属性对象、参数对象或经过污染的对象调用，那么这个位置才能被认为可以用被调用函数替代。

污点分析的条件控制：

图中红色标记处也是处理多态的情况，只是这是在两层调用之间出现的中间调用。

8. 现实很骨感-V2版本

由于控制条件太多，抑或是我的prompt无法准确描述想要的东西，测试过一些本地模型和线上模型，实际效果都不太好：

后面也想过做条件拆分，在代码中做结果整合，但是很棘手，因为漏洞本身就是需要上下文和条件控制的，仅根据我目前的认知，漏洞挖掘这个场景做条件拆分再组合我实在是很难办到。

9. 结论

可以看到上面所做的工作，核心的东西都是利用prompt描述做控制，强依赖AI，中间过程具有极其的不稳定性。其实在做V1和V2版本的过程中，我就意识到自己在做一个对标codeql的东西，但是我知道凭我是肯定没办法实现codeql那种效果的，想用几千个文字描述codeql做的东西，确实有些异想天开了，不过较下劲尝试下，毕竟它有时候确实能给你惊喜。经过这一系列折腾，给我的感觉是对于这类条件控制很多或者需要精细处理的场景，AI只有赋能在已经具有稳定性的架构中，核心的东西不能过于强依赖AI，才可能最大的发挥AI的作用以及获得较好的效果。

以上只是本人结合AI做漏洞挖掘粗浅和拙劣认知，AI目前还有很多技术，结合这些技术或许能在自动化漏洞挖掘方面达到期望的效果。

10. 参考

[1] https://github.com/protectai/vulnhuntr

作者：longofo@知道创宇404实验室
时间：2025年2月16日
原文链接：https://paper.seebug.org/3283/

4A评测 - 免责申明

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的。

不得将上述内容用于商业或者非法用途，否则一切后果请用户自负。

本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑或手机中彻底删除上述内容。

如果您喜欢该程序，请支持正版，购买注册，得到更好的正版服务。如有侵权请邮件与我们联系处理。敬请谅解！

程序来源网络，不确保不包含木马病毒等危险内容，请在确保安全的情况下或使用虚拟机使用。

侵权违规投诉邮箱：4ablog168#gmail.com（#换成@）

基于污点分析的 AI 自动化漏洞挖掘尝试

1. 概述