Rétro-ingénierie Moderne avec l'IA : Comment les LLM Transforment l'Analyse Binaire

La rétro-ingénierie a toujours été l'une des disciplines les plus intellectuellement exigeantes en cybersécurité. Les analystes passent des heures à examiner des instructions assembleur, à reconstruire mentalement des structures de données et à tracer des chemins d'exécution à travers des binaires dépouillés. La charge cognitive est énorme, et la demande d'ingénieurs en rétro-ingénierie qualifiés dépasse largement l'offre.

C'est exactement dans cette lacune que les grands modèles de langage font leur marque. Au cours des deux dernières années, la rétro-ingénierie assistée par IA est passée d'une curiosité à un véritable multiplicateur de force. Des plugins Ghidra qui renomment des milliers de fonctions en minutes, des intégrations Binary Ninja qui expliquent le shellcode en langage naturel, et des scanners de vulnérabilités automatisés qui raisonnent sur les patterns de corruption mémoire sont tous disponibles aujourd'hui. Ce n'est pas de la technologie spéculative. Ce sont des outils de production sur lesquels les analystes en exercice s'appuient.

Ce guide couvre l'état actuel de la rétro-ingénierie augmentée par l'IA, les outils qui comptent, les workflows pratiques pour les intégrer dans votre pipeline d'analyse, et les limitations que vous devez comprendre avant de leur faire confiance.

L'Intersection de l'IA et de la Rétro-ingénierie

La rétro-ingénierie est fondamentalement un problème de reconnaissance de patterns et de traduction. Vous prenez du code machine, l'élevez vers des représentations de plus en plus abstraites, et reconstruisez finalement l'intention originale du développeur. Les LLM excellent exactement dans ce type de traduction structurée.

L'insight clé derrière les outils actuels est que le pseudocode C décompilé est suffisamment proche du langage naturel pour que les LLM généralistes puissent raisonner dessus efficacement. Quand Ghidra ou IDA Pro produit une sortie de décompilateur, cette sortie est du C syntaxiquement valide. Les LLM entraînés sur des milliards de lignes de code source peuvent inférer les objectifs des fonctions, suggérer des noms de variables significatifs, identifier des patterns de bibliothèques courants et signaler des constructions suspectes.

Trois catégories d'assistance IA ont émergé :

Enrichissement sémantique — Renommer les fonctions, variables et types basé sur l'analyse comportementale du code décompilé
Explication et résumé — Générer des descriptions en langage naturel de ce que font les blocs de code
Détection de vulnérabilités — Identifier les patterns associés aux dépassements de tampon, use-after-free, bugs de chaîne de format et autres conditions exploitables

Chaque catégorie a des profils de fiabilité différents. L'enrichissement sémantique est étonnamment précis pour le code de bibliothèques connues. La qualité des explications varie avec la capacité du modèle. La détection de vulnérabilités reste la moins fiable mais la plus activement recherchée.

Décompilation Assistée par IA : Plugins Ghidra

L'architecture ouverte de Ghidra et son support de scripting Python/Java en ont fait la plateforme principale pour l'expérimentation en rétro-ingénierie avec IA. Plusieurs plugins ont mûri pour devenir des outils quotidiens.

GhidrAssist

GhidrAssist connecte Ghidra directement aux API LLM (OpenAI, Anthropic, ou modèles locaux via Ollama) et fournit une analyse contextuelle de la fonction actuellement sélectionnée. Il envoie la sortie décompilée avec les références croisées et les données de chaînes au modèle et renvoie une analyse structurée.

L'installation est simple :

# Clone the repository
git clone https://github.com/unkmc/GhidrAssist.git

# Copy the extension to Ghidra's extensions directory
cp -r GhidrAssist $GHIDRA_INSTALL_DIR/Extensions/Ghidra/

# Restart Ghidra and enable via File > Install Extensions

Une fois configuré avec une clé API, vous pouvez faire un clic droit sur n'importe quelle fonction et sélectionner "Explain Function" ou "Suggest Names". Le plugin envoie le C décompilé avec le contexte sur les conventions d'appel, les symboles importés et les références croisées.

Ce qui rend GhidrAssist particulièrement efficace est sa gestion de la fenêtre de contexte. Plutôt que de déverser toute la décompilation du binaire dans un prompt, il construit des requêtes ciblées incluant la fonction cible, ses appelants et appelés immédiats, et les références de chaînes pertinentes. Cette approche ciblée produit des résultats significativement meilleurs que le prompting naïf.

GEPETTO

GEPETTO (GPT Explanation of ProcEdures To Transform Operations) a été l'un des premiers plugins IA de qualité production pour Ghidra. Il se concentre spécifiquement sur l'explication et le renommage de fonctions :

# GEPETTO configuration in ghidra_script.py
# Set your API provider and model
import ghidra_bridge
b = ghidra_bridge.GhidraBridge()

# Get the current function's decompiled output
current_function = b.currentProgram.getFunctionManager().getFunctionContaining(
    b.currentAddress
)
decomp = b.DecompInterface()
decomp.openProgram(b.currentProgram)
results = decomp.decompileFunction(current_function, 60, None)
c_code = results.getDecompiledFunction().getC()

# Send to LLM for analysis
prompt = f"""Analyze this decompiled C function. Suggest:
1. A descriptive function name
2. Parameter names and likely types
3. A one-paragraph explanation of its purpose

```c
{c_code}
```"""

GEPETTO excelle dans le traitement par lots. Vous pouvez l'exécuter sur la liste complète des fonctions d'un binaire et obtenir un premier renommage qui transforme une mer d'étiquettes FUN_00401000 en noms significatifs comme decrypt_config_buffer ou parse_c2_response. Le taux de précision sur les patterns courants (E/S fichier, opérations réseau, routines cryptographiques) dépasse typiquement 80%.

VulChatGPT

VulChatGPT étend le concept de GEPETTO avec un focus spécifique sur l'identification de vulnérabilités. Il analyse les fonctions décompilées pour des patterns de vulnérabilités courants et produit des rapports structurés :

# VulChatGPT analysis prompt structure
vulnerability_prompt = """
Analyze this decompiled function for security vulnerabilities.
Focus on:
- Buffer overflow conditions (unchecked memcpy, strcpy, sprintf)
- Integer overflow/underflow in size calculations
- Use-after-free patterns
- Format string vulnerabilities
- Race conditions in shared resource access
- Unvalidated input used in sensitive operations

For each finding, provide:
- Vulnerability type
- Affected line(s)
- Severity estimate
- Exploitation difficulty
"""

La valeur ici n'est pas que le LLM détecte des vulnérabilités qu'un analyste qualifié manquerait. Plutôt, il accélère le triage. Lors de l'analyse d'un binaire avec 2 000 fonctions, avoir un premier passage automatisé qui signale les 50 fonctions les plus suspectes économise des jours de revue manuelle.

Sidekick de Binary Ninja et Analyse IA

Binary Ninja a adopté une approche plus intégrée de l'assistance IA. Plutôt que de s'appuyer sur des plugins tiers, Vector 35 a intégré des fonctionnalités IA directement dans la plateforme.

Sidekick fournit une interface de chat interactive au sein de Binary Ninja qui est consciente du contexte. Il sait quelle fonction vous visualisez, quelle est votre sélection actuelle et quelle analyse a déjà été effectuée. Cette intégration étroite signifie que vous pouvez poser des questions comme "Que contrôle le troisième paramètre de cette fonction ?" et obtenir des réponses fondées sur l'analyse réelle du binaire.

L'API Sidekick permet également le scripting :

# Binary Ninja Sidekick scripting example
from binaryninja import BinaryViewType

bv = BinaryViewType.get_view_of_file("/path/to/binary")

# Iterate functions and get AI-generated summaries
for func in bv.functions:
    if func.name.startswith("sub_"):
        # Request AI analysis for unnamed functions
        analysis = bv.query_sidekick(
            f"Analyze function at {hex(func.start)} and suggest a name"
        )
        if analysis.confidence > 0.8:
            func.name = analysis.suggested_name

Le moteur de propagation de types de Binary Ninja alimente directement le contexte IA, donc le modèle voit non seulement du code décompilé brut mais aussi les types récupérés, structures et valeurs d'énumération. Cela produit des résultats notablement meilleurs que les outils qui n'envoient que du pseudocode brut.

Intégrations IA d'IDA Pro

La dominance d'IDA Pro dans la rétro-ingénierie commerciale signifie qu'il a attiré un effort significatif d'intégration IA.

BinaryAI

BinaryAI utilise la recherche de similarité basée sur les embeddings pour apparier les fonctions avec une base de données de code open source connu. Plutôt que de demander à un LLM de deviner ce qu'une fonction fait, BinaryAI calcule un embedding vectoriel du graphe de flux de contrôle de la fonction et des patterns de flux de données, puis cherche des fonctions similaires dans son corpus indexé.

# BinaryAI IDA plugin usage
import binaryai as bai
import idautils
import idc

# Initialize client
client = bai.Client(token="your_api_token")

# Analyze current function
func_addr = idc.get_screen_ea()
func_bytes = idc.get_bytes(func_addr, idc.get_func_attr(func_addr, idc.FUNCATTR_END) - func_addr)

# Query the BinaryAI database
results = client.search_function(func_bytes)
for match in results[:5]:
    print(f"Match: {match.name} from {match.source} (confidence: {match.score:.2f})")

Cette approche est complémentaire à l'analyse basée sur LLM. BinaryAI excelle dans l'identification des fonctions de bibliothèques liées statiquement (zlib, OpenSSL, SQLite), tandis que les LLM sont meilleurs pour comprendre la logique applicative personnalisée.

Gepetto pour IDA

La version IDA de Gepetto fonctionne de manière similaire à son homologue Ghidra mais exploite la sortie supérieure du décompilateur d'IDA (Hex-Rays) pour de meilleurs résultats :

# Gepetto for IDA: batch rename workflow
import ida_hexrays
import ida_funcs
import openai

def analyze_all_functions():
    renamed = 0
    for func_ea in idautils.Functions():
        func = ida_funcs.get_func(func_ea)
        cfunc = ida_hexrays.decompile(func_ea)
        if cfunc:
            pseudocode = str(cfunc)
            # Send to LLM for naming
            response = openai.chat.completions.create(
                model="gpt-4o",
                messages=[{
                    "role": "user",
                    "content": f"Suggest a function name for:\n{pseudocode}"
                }]
            )
            new_name = response.choices[0].message.content.strip()
            if new_name and not new_name.startswith("sub_"):
                ida_funcs.set_func_name(func_ea, new_name, ida_funcs.SN_CHECK)
                renamed += 1
    print(f"Renamed {renamed} functions")

Nommage Automatisé des Fonctions et Récupération de Types

Le nommage de fonctions est là où l'IA apporte la valeur la plus immédiate et tangible en rétro-ingénierie. Le workflow est simple mais puissant :

Décompiler la fonction en pseudocode
Envoyer le pseudocode plus le contexte (chaînes, imports, références croisées) à un LLM
Analyser la réponse pour un nom suggéré et des types de paramètres
Appliquer les suggestions et propager les types à travers le graphe d'appels

L'étape de propagation est critique. Quand vous identifiez correctement que FUN_00405a20 est en fait aes_cbc_encrypt, l'information de type pour ses paramètres (tampon de clé, IV, texte en clair, longueur) peut se propager à chaque appelant, améliorant dramatiquement la lisibilité à travers tout le binaire.

# Type propagation after AI-assisted naming
# Ghidra script for cascading type application

from ghidra.program.model.data import StructureDataType, PointerDataType
from ghidra.program.model.symbol import SourceType

def apply_crypto_types(func, analysis_result):
    """Apply recovered types from AI analysis to a function and its callers."""
    dtm = currentProgram.getDataTypeManager()

    # Create structure based on AI suggestion
    if analysis_result.get("struct_type"):
        struct = StructureDataType(analysis_result["struct_name"], 0)
        for field in analysis_result["fields"]:
            struct.add(
                dtm.getDataType(field["type"]),
                field["size"],
                field["name"],
                field["comment"]
            )
        dtm.addDataType(struct, None)

    # Rename function
    func.setName(analysis_result["name"], SourceType.USER_DEFINED)

    # Update parameter types
    params = func.getParameters()
    for i, param_info in enumerate(analysis_result.get("params", [])):
        if i < len(params):
            params[i].setName(param_info["name"], SourceType.USER_DEFINED)

Détection de Vulnérabilités Alimentée par LLM dans les Binaires

La détection de vulnérabilités dans le code compilé s'est traditionnellement appuyée sur la correspondance de patterns (Flawfinder, RATS) ou des méthodes formelles lourdes (exécution symbolique, interprétation abstraite). Les LLM offrent un terrain intermédiaire : ils peuvent raisonner sur la sémantique du code à un niveau entre la correspondance de patterns syntaxiques et la vérification formelle.

Les approches actuelles fonctionnent mieux pour les classes de vulnérabilités bien connues :

# Structured vulnerability analysis pipeline
import json

def analyze_function_for_vulns(decompiled_code, context):
    prompt = f"""You are a binary security analyst. Analyze this decompiled function
for exploitable vulnerabilities.

Function context:
- Binary: {context['binary_name']}
- Architecture: {context['arch']}
- Calling convention: {context['calling_convention']}
- Known imports used: {', '.join(context['imports'])}

Decompiled code:
```c
{decompiled_code}

Respond in JSON format: {{ "vulnerabilities": [ {{ "type": "buffer_overflow|use_after_free|format_string|integer_overflow|race_condition", "severity": "critical|high|medium|low", "line_reference": "approximate line in decompiled output", "description": "what the vulnerability is", "exploitation_notes": "how it might be exploited", "confidence": 0.0-1.0 }} ], "overall_risk": "critical|high|medium|low|none" }}"""

response = call_llm(prompt)
return json.loads(response)


La limitation clé est le taux de faux positifs. Les LLM tendent à sur-signaler les problèmes potentiels, surtout autour de l'arithmétique de pointeurs qui est en fait sûre grâce à des vérifications de limites ailleurs dans le code. Traitez toujours les rapports de vulnérabilités du LLM comme des pistes pour investigation manuelle, pas comme des résultats confirmés.


## La Boîte à Outils Capstone, Unicorn et Keystone

Avant l'arrivée de l'IA, la suite Capstone/Unicorn/Keystone a établi les fondations de l'analyse binaire programmatique. Ces outils restent des blocs de construction essentiels et se marient bien avec les workflows assistés par LLM.

**Capstone** est un framework de désassemblage supportant plusieurs architectures :

```python
from capstone import Cs, CS_ARCH_X86, CS_MODE_64

CODE = b"\x55\x48\x89\xe5\x48\x83\xec\x10\x89\x7d\xfc\x8b\x45\xfc\x83\xc0\x01"

md = Cs(CS_ARCH_X86, CS_MODE_64)
md.detail = True

for insn in md.disasm(CODE, 0x1000):
    print(f"0x{insn.address:x}:\t{insn.mnemonic}\t{insn.op_str}")
    # Feed to LLM for semantic analysis
    # Groups tell us instruction categories (jump, call, ret, etc.)
    groups = [insn.group_name(g) for g in insn.groups]

Unicorn fournit l'émulation CPU pour l'analyse dynamique :

from unicorn import Uc, UC_ARCH_X86, UC_MODE_64
from unicorn.x86_const import UC_X86_REG_RAX, UC_X86_REG_RIP

# Initialize emulator
mu = Uc(UC_ARCH_X86, UC_MODE_64)

# Map memory and write code
ADDRESS = 0x1000000
mu.mem_map(ADDRESS, 2 * 1024 * 1024)
mu.mem_write(ADDRESS, CODE)

# Set up stack
STACK_ADDR = 0x2000000
mu.mem_map(STACK_ADDR, 1024 * 1024)

# Emulate and collect execution trace
trace = []
def hook_code(uc, address, size, user_data):
    trace.append(address)

mu.hook_add(unicorn.UC_HOOK_CODE, hook_code)
mu.emu_start(ADDRESS, ADDRESS + len(CODE))

print(f"RAX = {mu.reg_read(UC_X86_REG_RAX)}")

Keystone gère l'assemblage, complétant le cycle :

from keystone import Ks, KS_ARCH_X86, KS_MODE_64

ks = Ks(KS_ARCH_X86, KS_MODE_64)
encoding, count = ks.asm("mov rax, 0x1337; ret")
print(f"Assembled {count} instructions: {bytes(encoding).hex()}")

La puissance de combiner ces outils avec les LLM réside dans la construction de pipelines d'analyse automatisés. Vous pouvez utiliser Capstone pour désassembler, envoyer la sortie à un LLM pour analyse sémantique, utiliser les suggestions du LLM pour guider les chemins d'émulation Unicorn, et utiliser Keystone pour générer des payloads de test.

PyGhidra : Pipelines de Rétro-ingénierie Python-First

PyGhidra (anciennement pyhidra) vous permet d'exécuter le moteur d'analyse de Ghidra comme bibliothèque Python sans lancer l'interface graphique. C'est transformateur pour construire des pipelines automatisés :

import pyghidra

# Analyze a binary headlessly
with pyghidra.open_program("/path/to/malware.bin") as flat_api:
    program = flat_api.getCurrentProgram()
    listing = program.getListing()
    func_manager = program.getFunctionManager()

    # Iterate all functions
    results = {}
    for func in func_manager.getFunctions(True):
        # Get decompiled output
        decomp = flat_api.DecompInterface()
        decomp.openProgram(program)
        decomp_result = decomp.decompileFunction(func, 120, None)

        if decomp_result.depiledFunction():
            c_code = decomp_result.getDecompiledFunction().getC()
            # Send to LLM for analysis
            analysis = analyze_with_llm(c_code)
            results[func.getName()] = analysis

    # Generate report
    generate_analysis_report(results, "/path/to/report.json")

PyGhidra permet l'analyse binaire style CI/CD. Vous pouvez mettre en place un pipeline qui traite automatiquement les nouveaux échantillons de malware, génère des rapports d'analyse enrichis par IA, et signale les éléments prioritaires pour revue humaine :

#!/bin/bash
# Automated malware analysis pipeline
SAMPLE_DIR="/incoming/samples"
REPORT_DIR="/reports"

for sample in "$SAMPLE_DIR"/*.bin; do
    filename=$(basename "$sample" .bin)
    echo "Analyzing: $filename"

    python3 analyze_binary.py \
        --input "$sample" \
        --output "$REPORT_DIR/${filename}.json" \
        --model claude-sonnet \
        --max-functions 500 \
        --confidence-threshold 0.7

    # Flag high-severity findings
    python3 triage_report.py "$REPORT_DIR/${filename}.json"
done

Construction de Scripts d'Analyse Personnalisés avec Assistance LLM

L'approche la plus puissante n'est pas d'utiliser des plugins prêts à l'emploi mais de construire des scripts d'analyse personnalisés adaptés à vos cibles spécifiques. Les LLM peuvent vous aider à écrire ces scripts :

# Custom malware config extractor using LLM-guided analysis
import struct
import re

class ConfigExtractor:
    def __init__(self, binary_path, llm_client):
        self.binary_path = binary_path
        self.llm = llm_client
        self.config = {}

    def find_config_function(self, decompiled_functions):
        """Use LLM to identify the configuration initialization function."""
        for name, code in decompiled_functions.items():
            response = self.llm.query(
                f"Does this function initialize a malware configuration "
                f"structure? Look for patterns like: setting C2 URLs, "
                f"encryption keys, sleep intervals, persistence mechanisms.\n\n"
                f"```c\n{code}\n```\n\n"
                f"Respond with YES or NO and a confidence score."
            )
            if "YES" in response and self.parse_confidence(response) > 0.75:
                return name, code
        return None, None

    def extract_config_values(self, config_func_code):
        """Use LLM to identify and extract configuration values."""
        response = self.llm.query(
            f"Extract all configuration values from this function. "
            f"Identify C2 servers, encryption keys, file paths, "
            f"registry keys, and timing values.\n\n"
            f"```c\n{config_func_code}\n```\n\n"
            f"Respond in JSON format with field names and values."
        )
        return self.parse_json_response(response)

    def parse_confidence(self, response):
        match = re.search(r'(\d+\.?\d*)', response.split("confidence")[-1])
        return float(match.group(1)) if match else 0.0

    def parse_json_response(self, response):
        try:
            json_match = re.search(r'\{.*\}', response, re.DOTALL)
            if json_match:
                return json.loads(json_match.group())
        except json.JSONDecodeError:
            pass
        return {}

Considérations Éthiques et Limitations

La rétro-ingénierie assistée par IA soulève des questions importantes que les praticiens doivent aborder.

Précision et surconfiance. Les LLM produisent des analyses au son plausible qui peuvent être complètement fausses. Une fonction qui ressemble à du chiffrement AES-128 pour le modèle pourrait en fait être un chiffrement XOR personnalisé avec une structure fortuitement similaire. Ne faites jamais confiance à l'analyse IA sans vérification. Traitez-la comme un générateur d'hypothèses, pas comme un oracle.

Propriété intellectuelle. Utiliser l'IA pour rétro-ingéniérer des logiciels propriétaires soulève des questions juridiques qui varient selon la juridiction. Le DMCA aux États-Unis a des exemptions pour la recherche en sécurité et l'interopérabilité, mais les limites ne sont pas toujours claires. Documentez votre objectif et consultez un conseiller juridique lorsque vous travaillez sur des cibles commerciales.

Fuite de données du modèle. Quand vous envoyez du code décompilé à une API LLM cloud, ce code peut être journalisé, utilisé pour l'entraînement ou sujet à assignation judiciaire. Pour les cibles sensibles (malware d'États-nations, binaires classifiés, engagements clients sous NDA), utilisez exclusivement des modèles locaux. Ollama avec un modèle capable comme Llama 3 ou Mixtral fournit une qualité d'analyse raisonnable sans qu'aucune donnée ne quitte votre machine.

Robustesse adversariale. Les auteurs de malware explorent déjà des techniques pour confondre l'analyse IA. Insérer des références de chaînes trompeuses, ajouter du code mort qui ressemble à des fonctions de bibliothèques bénignes, et utiliser des patterns d'obfuscation qui ciblent spécifiquement la compréhension du LLM sont toutes des techniques émergentes. Attendez-vous à une course aux armements.

Atrophie des compétences. La dépendance excessive à l'analyse IA peut éroder les compétences fondamentales de rétro-ingénierie. Les analystes juniors qui apprennent à cliquer sur "Expliquer la Fonction" avant de lire le code eux-mêmes peuvent ne jamais développer la compréhension approfondie nécessaire pour les défis inédits. Utilisez l'IA comme un accélérateur, pas comme un remplacement de l'apprentissage.

Le Futur : Agents Autonomes d'Analyse Binaire

La prochaine frontière est les systèmes agentiques capables d'effectuer une analyse binaire multi-étapes de manière autonome. Plutôt que de répondre à des questions individuelles sur des fonctions individuelles, ces systèmes navigueront dans les binaires, formeront et testeront des hypothèses, et produiront des rapports d'analyse complets.

Des prototypes précoces existent déjà. Les systèmes de recherche peuvent prendre un binaire, identifier son point d'entrée, tracer les chemins d'exécution, identifier les fonctions intéressantes, les analyser pour des vulnérabilités et produire des rapports structurés, le tout sans intervention humaine. L'architecture ressemble typiquement à ceci :

# Autonomous binary analysis agent architecture
agent:
  planning_model: claude-sonnet
  analysis_model: claude-sonnet
  tools:
    - ghidra_decompile
    - ghidra_xrefs
    - ghidra_strings
    - unicorn_emulate
    - capstone_disasm
    - yara_scan
  workflow:
    - step: initial_triage
      actions: [identify_packer, check_imports, extract_strings]
    - step: unpack_if_needed
      condition: is_packed
      actions: [dump_unpacked, reanalyze]
    - step: function_analysis
      actions: [identify_interesting_functions, analyze_top_50]
    - step: vulnerability_scan
      actions: [check_memory_safety, check_crypto_usage]
    - step: report_generation
      actions: [compile_findings, assign_severity, generate_report]

Le facteur limitant n'est pas la capacité du modèle mais la fiabilité de l'intégration des outils. Faire en sorte qu'un LLM invoque correctement les API Ghidra, interprète les résultats et décide des prochaines étapes nécessite une ingénierie soigneuse de la boucle agent. Les appels API hallucinés, les adresses mal interprétées et les boucles d'analyse infinies sont des modes de défaillance courants.

Dans l'année à venir, attendez-vous à ce que les plateformes commerciales livrent l'analyse basée sur des agents comme fonctionnalité centrale. Les analystes qui comprennent à la fois les capacités IA et les fondamentaux sous-jacents de la rétro-ingénierie seront ceux qui utiliseront ces outils le plus efficacement. La technologie amplifie l'expertise. Elle ne la remplace pas.

Commencer Aujourd'hui

Si vous voulez intégrer l'IA dans votre workflow de rétro-ingénierie dès maintenant, commencez ici :

Installez GhidrAssist et configurez-le avec votre fournisseur LLM préféré. Utilisez-le sur un binaire que vous avez déjà analysé manuellement pour calibrer votre confiance dans ses résultats.
Mettez en place un modèle local avec Ollama pour le travail sensible. Llama 3 70B avec quantification Q4_K_M fournit une bonne qualité d'analyse sur une machine avec 48 Go de RAM.
Construisez un script PyGhidra qui traite les fonctions par lots et génère un rapport JSON. Commencez avec le nommage de fonctions et étendez à l'analyse de vulnérabilités.
Établissez des habitudes de vérification. Pour chaque suggestion IA que vous acceptez, passez trente secondes à la confirmer contre le code réel. Cela développe l'intuition pour savoir quand l'IA a raison et quand elle confabule.
Suivez vos métriques. Mesurez combien de suggestions IA vous acceptez versus rejetez, et combien souvent les suggestions acceptées s'avèrent fausses lors d'une analyse approfondie. Ces données vous aideront à calibrer votre workflow.

Les outils sont là. Les modèles sont suffisamment capables pour être utiles. Les analystes qui les intègrent réflexivement dans des workflows disciplinés auront un avantage significatif sur ceux qui ignorent complètement l'IA ou lui font confiance aveuglément.