AI安全

DeepSeek本地化部署有风险!快来看看你中招了吗?

2025年伊始,AI领域迎来一个重要变革 - DeepSeek R1开源发布,凭借着低成本、性能出众的优势,这个模型在短短几周内就获得空前关注。由于官网服务经常繁忙,大家开始选择使…

DeepSeek崛起下的AI安全隐忧

近日,DeepSeek凭借其高性能、低成本的通用人工智能技术成为科技圈的“顶流”,不仅让更多大众群体了解了AI技术的潜力,也引发了人们对AI安全风险的广泛关注。人工智能技术虽然为各…

DeepSeek网络攻击的幕后黑手浮出水面

2025年开年,由国人研发的AI大模型DeepSeek火出天际。尤其是自DeepSeek-R1发布,十余天内,在全球范围内快速掀起关注热潮,成为AI发展历史上的现象级事件之一。上至…

越狱之后的DeepSeek

本篇翻译自安全供应商wallarm的一篇博客,观点来自于这篇博客。地址:https://lab.wallarm.com/jailbreaking-generative-ai/分析D…

基于伪随机数生成器的模型后门攻击

随机平滑是一种流行的ML防御方法,用于训练可证明稳健的模型,并验证模型对特定输入数据点的鲁棒性。其核心原理是通过采样高斯噪声来探索数据点周围的区域,从而证明模型在对抗样本攻击下的稳…

新观点!CISO们无需迷信LLMs

近年来,网络安全专家一直在呼吁拓展CISO的职责范围,以应对日益复杂的网络威胁。生成式AI的出现,尤其是大型语言模型(LLMs)为网络安全带来了新的挑战。尽管LLMs具有巨大的潜力…

VelLMes-AI-Honeypot:一款大语言模型LLM的蜜罐工具

关于VelLMes-AI-HoneypotVelLMes-AI-Honeypot是一款大语言模型LLM的蜜罐工具,该工具可以通过使用LLM创建交互式、动态且逼真的蜜罐。该工具旨在帮…

AI 安全案例分享:我是如何控制劫持AI助手的

前言在当今数字化时代,人工智能(AI)已经成为许多企业和应用的核心组成部分。然而,随着AI技术的广泛应用,其安全性问题也日益凸显。最近,我在一次日常的安全检查中,意外发现了一个严重…

反击AI黑客:通过提示注入防御基于LLM的网络攻击

大语言模型被越来越多地用于自动化网络攻击,这使得复杂的漏洞更容易被利用和扩展。为此,本文提出了一种新的防御工具,专门用于对抗 LLM 驱动的网络攻击。Mantis 是一个防御框架,…

对抗性机器学习:安全威胁与防范措施

前言对抗性机器学习(Adversarial Machine Learning, AML)是一个迅速发展的研究领域,专注于探索机器学习系统所面临的安全与脆弱性风险。随着机器学习算法在…

1 2 4