一个由多模式 LLM 驱动的代理,用于自动解决验证码

2024-07-12 223 0


在现代互联网环境中,CAPTCHA 验证码已成为一种常见的安全机制,用于防止自动化脚本和恶意行为。然而,随着技术的发展,如何高效且智能地解决 CAPTCHA 成为一个挑战。本文推荐一种由多模态大型语言模型(LLM)驱动的自动 CAPTCHA 解算器,利用 Google Vertex AI和自定义代理的能力,提供了一种强大且灵活的解决方案。

特征亮点

  1. 自动识别 CAPTCHA:该解算器可以自动识别输入图像是否为 CAPTCHA,从而避免不必要的处理。

  2. 精准识别 CAPTCHA 类型:无论是文本、数学方程式、图像旋转、拼图还是图像选择,该工具都可以准确地识别出 CAPTCHA 的类型。

  3. 高效解决文本和数学 CAPTCHA:通过强大的文本和数学解算代理,快速提供解决方案。

  4. 集成 Google Cloud Vertex AI:利用 Google 的先进 AI 模型(如 gemini-vision-pro),提供可靠的 CAPTCHA 解决性能。

安装与配置

在使用该 CAPTCHA 解算器之前,用户需要确保已安装所需的依赖项,并配置 Google Cloud 项目和服务帐号:

pip install --upgrade google-cloud-aiplatform

初始化与运行

通过以下简单的代码片段,用户可以轻松初始化并运行 CAPTCHA 解算器:

from iamabot import solve

# 初始化解算器,提供 Google Cloud 项目 ID 和服务帐号凭证文件路径
solver = solve.Solve(
 project_id=1077607249524,
 credential_file_path="google-service-account-credential-file.json"
)

# 运行解算器,解决 CAPTCHA 图像
solved_response = solver.run("sample_captchas/text_moderate.png")

# 输出解决方案
print(solved_response)

项目结构

该项目的代码结构简洁明了,包含以下主要模块:

  • agents.py:定义用于识别和解决 CAPTCHA 的代理。

  • gemini_core.py:负责与 Google Cloud Vertex AI 的交互。

  • solve.py:CAPTCHA 解算器的主要入口点。

  • sample.py:提供如何使用 CAPTCHA 解算器的示例。

工作流程

整个工具的工作流程设计合理,确保了高效性和准确性。以下是简化的流程图:

+-----------------------------------+
| Start run function                |
+-----------------------------------+
       |
      v
+-----------------------------------+
| Load Agents                       |
+-----------------------------------+
       |
      v
+-----------------------------------+
| Generate prompt for image check   |
+-----------------------------------+
       |
      v
+-----------------------------------+
| Check if image looks like captcha |
+-----------------------------------+
       |
      Yes
       |
      v
+-----------------------------------+
| Generate prompt for captcha type  |
+-----------------------------------+
       |
      v
+-----------------------------------+
| Determine captcha type            |
+-----------------------------------+
       |
      v
+-----------------------------------+
| Solve appropriate captcha type    |
+-----------------------------------+
       |
      v
+-----------------------------------+
| Return captcha solution           |
+-----------------------------------+
       |
      v
+-----------------------------------+
| End run function                  |
+-----------------------------------+

代理角色

项目中定义了四个关键代理,每个代理在 CAPTCHA 解决过程中都有特定的角色:

  1. CheckIfImageLooksLikeCaptchaAgent:确定图像是否为 CAPTCHA。

  2. DecideCaptchaTypeAgent:识别 CAPTCHA 的具体类型。

  3. TextSolveAgent:解决文本类型的 CAPTCHA。

  4. MathSolveAgent:解决数学方程类型的 CAPTCHA。

限制

目前,该解算器主要支持文本和数学 CAPTCHA 的解决。对于图像旋转、拼图和图像选择等 CAPTCHA 类型,解算器可以识别但尚未实现自动解决。

与其他同类型工具对比

在 CAPTCHA 解算领域,还有其他几款工具值得关注,包括 Anti-Captcha、Death by Captcha 和 2Captcha。以下是对这些工具的详细对比:

Anti-Captcha

优点

  • 支持多种类型的 CAPTCHA,包括图片选择、旋转和拼图。

  • 提供 API 接口,便于集成到各类应用中。

  • 用户界面友好,操作简单。

缺点

  • 解决速度较慢,特别是在高峰期。

  • 对于复杂 CAPTCHA 的解决率不如预期。

  • 成本较高,按解决次数收费。

Death by Captcha

优点

  • 提供多种编程语言的 API 支持,方便开发者集成。

  • 解决成功率较高,适用于多种 CAPTCHA 类型。

  • 成本较低,适合大量使用场景。

缺点

  • 解决速度有时较慢,特别是在网络高峰期。

  • 对于最新类型的 CAPTCHA 解决效果不佳。

  • 客户服务响应较慢。

2Captcha

优点

  • 支持多种复杂 CAPTCHA 类型,包括 reCAPTCHA、hCaptcha 等。

  • 提供多种支付方式,灵活方便。

  • 解决速度相对较快,适用于紧急任务。

缺点

  • 成本较高,按解决次数收费。

  • 部分类型的 CAPTCHA 解决成功率不高。

  • 用户界面较为简陋,不易操作。

多模态 LLM 驱动的 CAPTCHA 解算器

优点

  • 高效识别和解决文本与数学 CAPTCHA,集成 Google Cloud Vertex AI 提供强大计算能力。

  • 自动识别 CAPTCHA 类型,避免不必要的处理,提高效率。

  • 项目结构清晰,代码易于维护和扩展。

缺点

  • 目前仅支持文本和数学 CAPTCHA,其他类型的 CAPTCHA 尚未实现自动解决。

  • 需要配置 Google Cloud 项目和服务帐号,初始配置较为复杂。

  • 对于非 Google Cloud 用户,可能不适用。

具体使用场景

电商网站

在电商网站上,经常需要进行商品信息采集、价格监控和库存查询等操作。这些操作通常会遇到 CAPTCHA 验证,通过此工具可以自动解决 CAPTCHA,从而实现全自动化的电商数据采集和监控。

社交媒体

在社交媒体平台上进行自动化操作,如批量发送好友请求、自动点赞和评论等,通常会遇到 CAPTCHA 验证。使用此工具可以绕过 CAPTCHA 限制,进行自动化社交操作。

自动化运维

在一些自动化运维任务中,如自动重启服务器、更新配置文件和监控系统状态等,可能需要访问带有 CAPTCHA 验证的管理界面。此工具可以帮助运维人员自动解决 CAPTCHA,提升运维效率。

教育平台

在教育平台上进行批量注册账号、提交作业和在线考试等操作时,遇到 CAPTCHA 验证,可以利用此工具自动解决,从而实现教育资源的高效管理和使用。

其他领域

其他需要解决 CAPTCHA 的场景,如金融交易、在线投票、网络营销等,都可以通过此工具实现自动化操作,提高工作效率,减少人工干预。

总结

由多模态 LLM 驱动的自动 CAPTCHA 解算器通过其智能、高效的设计,为用户提供了一个值得信赖的解决方案。无论是在提高效率还是在应对复杂的 CAPTCHA 挑战,该工具都展示了强大的潜力。相比其他同类型工具,它在文本和数学 CAPTCHA 的解决上有独特优势,但在处理多样化 CAPTCHA 类型方面还有提升空间。我们强烈推荐这个工具给所有需要高效解决 CAPTCHA 的用户。

访问 GitHub 项目地址获取更多信息和下载工具。


4A评测 - 免责申明

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的。

不得将上述内容用于商业或者非法用途,否则一切后果请用户自负。

本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。

如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。敬请谅解!

程序来源网络,不确保不包含木马病毒等危险内容,请在确保安全的情况下或使用虚拟机使用。

侵权违规投诉邮箱:4ablog168#gmail.com(#换成@)

相关文章

苹果试图保护你的隐私,OpenAI可能做不到
Shuffle:一款完全自动化的安全栈增强平台
如何使用CODASM编码Payload并降低熵值
SessionExec:一款针对会话安全的安全命令测试工具
Arkime:一款大规模数据包捕获和索引数据库系统
从蓝队流量角度分析Shiro-550反序列化漏洞

发布评论