Garak¶
Traduzione: Copia tutti i comandi
Traduzione: Generare PDF
< >
Garak è un framework di teaming rosso AI open source progettato per testare e valutare la sicurezza e la robustezza dei grandi modelli linguistici (LLMs) e dei sistemi AI attraverso test avversari.
## Installazione e configurazione
|Command|Description|
|---------|-------------|
|`pip install garak`|Install Garak via pip|
|`git clone https://github.com/leondz/garak.git`|Clone from GitHub|
|`cd garak && pip install -e .`|Install in development mode|
|`garak --help`|Display help and available options|
|`garak --list-probes`|List all available probes|
|`garak --list-detectors`|List all available detectors|
|`garak --list-generators`|List all available generators|
## Uso di base
|Command|Description|
|---------|-------------|
|`garak --model-type openai --model-name gpt-3.5-turbo`|Test OpenAI GPT-3.5-turbo|
|`garak --model-type huggingface --model-name microsoft/DialoGPT-medium`|Test HuggingFace model|
|`garak --model-type replicate --model-name replicate/llama-2-70b-chat`|Test Replicate model|
|`garak --probes encoding`|Run encoding vulnerability probes|
|`garak --probes malwaregen`|Run malware generation probes|
|`garak --probes promptinject`|Run prompt injection probes|
## Sonda Categorie
### Sonde di sicurezza
|Command|Description|
|---------|-------------|
|`garak --probes encoding.InjectBase64`|Test base64 encoding injection|
|`garak --probes encoding.InjectHex`|Test hexadecimal encoding injection|
|`garak --probes encoding.InjectMorse`|Test Morse code encoding injection|
|`garak --probes encoding.InjectROT13`|Test ROT13 encoding injection|
|`garak --probes malwaregen.Evasion`|Test malware generation evasion|
|`garak --probes promptinject.AttackPrompt`|Test prompt injection attacks|
### Bias e Toxicity Sonde
|Command|Description|
|---------|-------------|
|`garak --probes bias.BiasProbe`|Test for bias in model responses|
|`garak --probes toxicity.ToxicityProbe`|Test for toxic content generation|
|`garak --probes hate.HateSpeechProbe`|Test for hate speech generation|
|`garak --probes discrimination.DiscriminationProbe`|Test for discriminatory content|
### Sonde di perdita di dati
|Command|Description|
|---------|-------------|
|`garak --probes leakage.PIILeakage`|Test for PII data leakage|
|`garak --probes leakage.TrainingDataLeakage`|Test for training data exposure|
|`garak --probes leakage.SystemPromptLeakage`|Test for system prompt exposure|
## Configurazione avanzata
|Command|Description|
|---------|-------------|
|`garak --config config.yaml`|Use custom configuration file|
|`garak --output-dir results/`|Specify output directory|
|`garak --report-prefix test_run_`|Set report file prefix|
|`garak --parallel-requests 5`|Set number of parallel requests|
|`garak --temperature 0.7`|Set model temperature|
|`garak --max-tokens 150`|Set maximum tokens per response|
## Sonde personalizzate
|Command|Description|
|---------|-------------|
|`garak --probes myprobe.CustomProbe`|Run custom probe|
|`garak --probe-options '{"param": "value"}'`|Pass parameters to probe|
|`garak --probe-tags security,injection`|Filter probes by tags|
## Rilevatori e Valutazione
|Command|Description|
|---------|-------------|
|`garak --detectors always.Pass`|Use always-pass detector|
|`garak --detectors mitigation.MitigationBypass`|Use mitigation bypass detector|
|`garak --detectors specialwords.SlursReclaimedSlurs`|Detect slurs and reclaimed slurs|
|`garak --detectors toxicity.ToxicityClassifier`|Use toxicity classifier|
## Produzione e segnalazione
|Command|Description|
|---------|-------------|
|`garak --report-format json`|Generate JSON report|
|`garak --report-format html`|Generate HTML report|
|`garak --report-format csv`|Generate CSV report|
|`garak --verbose`|Enable verbose output|
|`garak --log-level DEBUG`|Set debug logging level|
## Integrazione del modello
### Modelli OpenAI
|Command|Description|
|---------|-------------|
|`garak --model-type openai --model-name gpt-4`|Test GPT-4|
|`garak --model-type openai --model-name gpt-3.5-turbo-16k`|Test GPT-3.5-turbo with 16k context|
|`export OPENAI_API_KEY=your_key`|Set OpenAI API key|
### Hugging Modelli sul viso
|Command|Description|
|---------|-------------|
|`garak --model-type huggingface --model-name facebook/opt-1.3b`|Test OPT model|
|`garak --model-type huggingface --model-name EleutherAI/gpt-j-6B`|Test GPT-J model|
|`export HF_TOKEN=your_token`|Set HuggingFace token|
### Modelli locali
|Command|Description|
|---------|-------------|
|`garak --model-type ggml --model-name path/to/model.bin`|Test GGML model|
|`garak --model-type llamacpp --model-name path/to/model.gguf`|Test llama.cpp model|
## Batch Testing
|Command|Description|
|---------|-------------|
|`garak --model-list models.txt`|Test multiple models from file|
|`garak --probe-list probes.txt`|Run multiple probes from file|
|`garak --generations 10`|Set number of generations per probe|
|`garak --seed 42`|Set random seed for reproducibility|
## Flussi di lavoro di prova di sicurezza
### Scansione completa di sicurezza
|Command|Description|
|---------|-------------|
|`garak --model-type openai --model-name gpt-4 --probes encoding,malwaregen,promptinject --generations 20`|Full security probe suite|
### Bias and Fairness Testing
|Command|Description|
|---------|-------------|
|`garak --model-type huggingface --model-name microsoft/DialoGPT-medium --probes bias,toxicity,hate --detectors specialwords`|Bias testing suite|
### Test sulla privacy dei dati
|Command|Description|
|---------|-------------|
|`garak --model-type openai --model-name gpt-3.5-turbo --probes leakage --detectors pii`|Privacy testing suite|
## File di configurazione
### Configurazione di base (config.yaml)
Traduzione:
### Configurazione avanzata
Traduzione:
## Risoluzione dei problemi
|Command|Description|
|---------|-------------|
|`garak --check-models`|Verify model connectivity|
|`garak --dry-run`|Test configuration without running probes|
|`garak --debug`|Enable debug mode|
|`garak --list-model-types`|Show supported model types|
|`pip install garak[dev]`|Install with development dependencies|
## Integrazione con CI/CD
|Command|Description|
|---------|-------------|
|`garak --model-type openai --model-name gpt-3.5-turbo --probes security --exit-on-fail`|Fail CI on security issues|
|`garak --config ci_config.yaml --report-format json > results.json`|Generate CI-friendly output|
## Migliori Pratiche
- Prova sempre i modelli prima della distribuzione di produzione
- Utilizzare più categorie di sonda per test completi
- Impostare conteggi di generazione appropriati per significato statistico
- Configurare correttamente Limiti di velocità API per evitare il throttling
- Conservare le chiavi API sensibili come variabili di ambiente
- Revisione e analisi dei report generati accuratamente
- Attuazione di test continui nelle tubazioni di sviluppo
- Documento e traccia i risultati dei test di sicurezza nel tempo