LLM Security Group 's Notes - 分享知识，认识世界

全部文章 - 114

2025

2025-11-01

MASTERKEY: Automated Jailbreaking of Large Language Model Chatbots

2025-10-31

SELFDEFEND: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner

2025-10-31

Jailbreaking Black Box Large Language Models in Twenty Queries

2025-10-26

Multi-Turn Jailbreaking Large Language Models via Attention Shifting

2025-10-24

FigStep: Jailbreaking Large Vision-Language Models via Typographic Visual Prompts

2025-10-24

Con Instruction: Universal Jailbreaking of Multimodal Large Language Models via Non-Textual Modalities

2025-10-19

Jailbroken: How Does LLM Safety Training Fail?

2025-10-18

Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!

2025-10-14

Weak-to-Strong Jailbreaking on Large Language Models

2025-09-19

Audio Jailbreak Attacks: Exposing Vulnerabilities in SpeechGPT in a White-Box Frameworkgeneration models

数据加载中