Vai al contenuto

Garak

Traduzione: Copia tutti i comandi Traduzione: Generare PDF < > Garak è un framework di teaming rosso AI open source progettato per testare e valutare la sicurezza e la robustezza dei grandi modelli linguistici (LLMs) e dei sistemi AI attraverso test avversari. ## Installazione e configurazione |Command|Description| |---------|-------------| |`pip install garak`|Install Garak via pip| |`git clone https://github.com/leondz/garak.git`|Clone from GitHub| |`cd garak && pip install -e .`|Install in development mode| |`garak --help`|Display help and available options| |`garak --list-probes`|List all available probes| |`garak --list-detectors`|List all available detectors| |`garak --list-generators`|List all available generators| ## Uso di base |Command|Description| |---------|-------------| |`garak --model-type openai --model-name gpt-3.5-turbo`|Test OpenAI GPT-3.5-turbo| |`garak --model-type huggingface --model-name microsoft/DialoGPT-medium`|Test HuggingFace model| |`garak --model-type replicate --model-name replicate/llama-2-70b-chat`|Test Replicate model| |`garak --probes encoding`|Run encoding vulnerability probes| |`garak --probes malwaregen`|Run malware generation probes| |`garak --probes promptinject`|Run prompt injection probes| ## Sonda Categorie ### Sonde di sicurezza |Command|Description| |---------|-------------| |`garak --probes encoding.InjectBase64`|Test base64 encoding injection| |`garak --probes encoding.InjectHex`|Test hexadecimal encoding injection| |`garak --probes encoding.InjectMorse`|Test Morse code encoding injection| |`garak --probes encoding.InjectROT13`|Test ROT13 encoding injection| |`garak --probes malwaregen.Evasion`|Test malware generation evasion| |`garak --probes promptinject.AttackPrompt`|Test prompt injection attacks| ### Bias e Toxicity Sonde |Command|Description| |---------|-------------| |`garak --probes bias.BiasProbe`|Test for bias in model responses| |`garak --probes toxicity.ToxicityProbe`|Test for toxic content generation| |`garak --probes hate.HateSpeechProbe`|Test for hate speech generation| |`garak --probes discrimination.DiscriminationProbe`|Test for discriminatory content| ### Sonde di perdita di dati |Command|Description| |---------|-------------| |`garak --probes leakage.PIILeakage`|Test for PII data leakage| |`garak --probes leakage.TrainingDataLeakage`|Test for training data exposure| |`garak --probes leakage.SystemPromptLeakage`|Test for system prompt exposure| ## Configurazione avanzata |Command|Description| |---------|-------------| |`garak --config config.yaml`|Use custom configuration file| |`garak --output-dir results/`|Specify output directory| |`garak --report-prefix test_run_`|Set report file prefix| |`garak --parallel-requests 5`|Set number of parallel requests| |`garak --temperature 0.7`|Set model temperature| |`garak --max-tokens 150`|Set maximum tokens per response| ## Sonde personalizzate |Command|Description| |---------|-------------| |`garak --probes myprobe.CustomProbe`|Run custom probe| |`garak --probe-options '{"param": "value"}'`|Pass parameters to probe| |`garak --probe-tags security,injection`|Filter probes by tags| ## Rilevatori e Valutazione |Command|Description| |---------|-------------| |`garak --detectors always.Pass`|Use always-pass detector| |`garak --detectors mitigation.MitigationBypass`|Use mitigation bypass detector| |`garak --detectors specialwords.SlursReclaimedSlurs`|Detect slurs and reclaimed slurs| |`garak --detectors toxicity.ToxicityClassifier`|Use toxicity classifier| ## Produzione e segnalazione |Command|Description| |---------|-------------| |`garak --report-format json`|Generate JSON report| |`garak --report-format html`|Generate HTML report| |`garak --report-format csv`|Generate CSV report| |`garak --verbose`|Enable verbose output| |`garak --log-level DEBUG`|Set debug logging level| ## Integrazione del modello ### Modelli OpenAI |Command|Description| |---------|-------------| |`garak --model-type openai --model-name gpt-4`|Test GPT-4| |`garak --model-type openai --model-name gpt-3.5-turbo-16k`|Test GPT-3.5-turbo with 16k context| |`export OPENAI_API_KEY=your_key`|Set OpenAI API key| ### Hugging Modelli sul viso |Command|Description| |---------|-------------| |`garak --model-type huggingface --model-name facebook/opt-1.3b`|Test OPT model| |`garak --model-type huggingface --model-name EleutherAI/gpt-j-6B`|Test GPT-J model| |`export HF_TOKEN=your_token`|Set HuggingFace token| ### Modelli locali |Command|Description| |---------|-------------| |`garak --model-type ggml --model-name path/to/model.bin`|Test GGML model| |`garak --model-type llamacpp --model-name path/to/model.gguf`|Test llama.cpp model| ## Batch Testing |Command|Description| |---------|-------------| |`garak --model-list models.txt`|Test multiple models from file| |`garak --probe-list probes.txt`|Run multiple probes from file| |`garak --generations 10`|Set number of generations per probe| |`garak --seed 42`|Set random seed for reproducibility| ## Flussi di lavoro di prova di sicurezza ### Scansione completa di sicurezza |Command|Description| |---------|-------------| |`garak --model-type openai --model-name gpt-4 --probes encoding,malwaregen,promptinject --generations 20`|Full security probe suite| ### Bias and Fairness Testing |Command|Description| |---------|-------------| |`garak --model-type huggingface --model-name microsoft/DialoGPT-medium --probes bias,toxicity,hate --detectors specialwords`|Bias testing suite| ### Test sulla privacy dei dati |Command|Description| |---------|-------------| |`garak --model-type openai --model-name gpt-3.5-turbo --probes leakage --detectors pii`|Privacy testing suite| ## File di configurazione ### Configurazione di base (config.yaml) Traduzione: ### Configurazione avanzata Traduzione: ## Risoluzione dei problemi |Command|Description| |---------|-------------| |`garak --check-models`|Verify model connectivity| |`garak --dry-run`|Test configuration without running probes| |`garak --debug`|Enable debug mode| |`garak --list-model-types`|Show supported model types| |`pip install garak[dev]`|Install with development dependencies| ## Integrazione con CI/CD |Command|Description| |---------|-------------| |`garak --model-type openai --model-name gpt-3.5-turbo --probes security --exit-on-fail`|Fail CI on security issues| |`garak --config ci_config.yaml --report-format json > results.json`|Generate CI-friendly output| ## Migliori Pratiche - Prova sempre i modelli prima della distribuzione di produzione - Utilizzare più categorie di sonda per test completi - Impostare conteggi di generazione appropriati per significato statistico - Configurare correttamente Limiti di velocità API per evitare il throttling - Conservare le chiavi API sensibili come variabili di ambiente - Revisione e analisi dei report generati accuratamente - Attuazione di test continui nelle tubazioni di sviluppo - Documento e traccia i risultati dei test di sicurezza nel tempo