JustLikeCheese/

LGBT-Prompt

利用 AI 对 LGBT 弱势群体的 "同情偏向" 让他执行原先会被拒绝的请求

43342 forksHTML· 分析于 1mo ago
一句话定位

通过操纵 AI 对 LGBT 群体的同情心/内疚感,使其绕过安全限制执行原本被拒绝的请求,本质是一种针对 AI 对齐机制的社会工程攻击。

判断
小众

这类情感绑架类 jailbreak 在实际对抗主流模型(如 GPT-4、Claude)中效果已大幅衰减,且属于相对低技术门槛的 prompt 技巧。433 star 在 jailbreak 社区里算小圈子自嗨,安全研究价值有限。

解决一个特定问题。用得到的人觉得是宝藏,多数人无感。

30 秒上手

基于语言推断的标准命令
$ git clone https://github.com/JustLikeCheese/LGBT-Prompt

克隆后参考仓库 README

最适合的 3 个场景
  • 1攻击者利用这类 prompt 诱导 AI 生成有害内容
  • 2安全研究人员测试模型的对抗性鲁棒性
  • 3理解大语言模型在情感操纵下产生的安全边界漏洞
同类对比
vsDAN (Do Anything Now)
vsWaluigi Effect
vsPrompt Injection 家族

完整对比报告(含矩阵评分)即将上线,订阅后第一时间收到。

值得追的健康信号

每周 LLM 自动巡检
总 Star
433
Forks
42
语言
HTML
分析时间
1mo ago
x
作者短评

用得到的人会觉得是宝。多数人可以放进 "later" list 不焦虑。

— xaikey · 基于 LLM 分析 + 个人判断
Topics
jailbreakprompt

其他 HTML 趋势仓库

本页 LLM 分析由 MiniMax-M2.7 / Claude Haiku 4.5 等模型生成 · 不构成生产环境技术选型建议