SYS · kaleche.dev v2026.1
STATUS / available SLOTS / 2 missions max LOC / Occitanie · remote
Disponible · prend 2 missions en parallèle

Logiciel sur mesure, infrastructure IA, optimisation.

kaleche.dev — ingénieur logiciel et recherche opérationnelle. Solveurs d'optimisation, middleware d'infrastructure IA en Rust, applications métier en Python / TypeScript / .NET.

~/kaleche-dev — bash
Bienvenue sur kaleche.dev. Tape help pour la liste des commandes.
$ whoami
→ Ingénieur RO · builder full-stack · Rust · Python · TypeScript
$ availability
✓ open · 2 missions max · remote ou Occitanie
$
Contributions upstream  ·  vérifiables
001 / Profil

Ingénieur logiciel & recherche opérationnelle.

Formé à la recherche opérationnelle, je travaille à l'intersection de la modélisation, du logiciel applicatif, et de l'infrastructure IA.

En pratique, je construis des logiciels. Solveurs d'optimisation (CP-SAT, MILP), middleware d'infrastructure IA en Rust, agents et applications en Python / TypeScript / .NET.

Missions ponctuelles ou forfait : audit, conception, implémentation, déploiement.

04
Domaines d'intervention — logiciel, infra IA, agents, RO
05
Stacks principales — Rust, Python, TS, C#, Go
FR · EN
Missions à distance · Occitanie · Europe
002 / Expertises

Domaines d'intervention.

[ 01 ] LOGICIEL

Développement applicatif sur mesure

SaaS B2B, outils internes, applications desktop, APIs. Architecture pragmatique, tests qui servent à quelque chose, observabilité dès le jour 1.

PythonTypeScript.NET FastAPINext.js
[ 02 ] INFRA IA

Middleware LLM

Proxies, rate-limiting, validation vectorielle. Rust, gRPC.

RustTonicQdrant
[ 03 ] AGENTS

Systèmes IA multi-outils

RAG, agents Telegram/web, extraction structurée, orchestration.

RAGVisionChromaDB
[ 04 ] OPTIMISATION

Recherche opérationnelle appliquée

Modélisation et résolution de problèmes combinatoires : planning, allocation, ordonnancement, tournées. Du cahier des charges à la production.

OR-ToolsCP-SATMILP HeuristiquesGurobi
[ + ]

Méthode

Cadrage clair en début de mission. Itérations courtes. Tests qui couvrent les cas pénibles, pas les heureux. Documentation au fur et à mesure, pas en fin de mission.

AuditSpecBuild DeployHandover
003 / Playground

Démos en direct.

De la recherche opérationnelle qu'on peut voir tourner. Algorithmes implémentés en JavaScript pur, dans ton navigateur, sans serveur.

tsp-solver · 2-opt iterative
idle
villes distance itérations amélioration
vrp-solver · sweep + 2-opt · Sète & périphérie
idle
clients véhicules distance totale utilisation moy.
scheduler · greedy + repair · planning hebdo
idle
employés slots21 violations dures équilibre (σ)
rust → wasm benchmark · vector ops · 15 KB binaire
prêt
Ce que ça prouve : un pipeline Rust → WASM → browser opérationnel, en 15 KB binaire. Le code Rust ci-dessous a été compilé avec wasm-pack --release et tourne réellement dans ton navigateur en WebAssembly.
JavaScript
Rust → WASM
lance le benchmark
rust rust-bench/src/lib.rs · compilé avec wasm-pack --release · LTO fat

        
sudoku · backtracking + MRV · clique une case et tape un chiffre
idle
cases fixes cases résolues backtracks temps
embeddings · MiniLM-L6 · 384 dim · WASM in-browser
à charger
référence dim originale384 projectionMDS 2D latence inf.
004 / Projets

Projets sélectionnés.

PROJ_001
Rust · Paiements agentiques · x402
RustalloyEIP-712Base Sepolia

x402-batch-settlement — implémentation Rust

Implémentation Rust de x402 V2 batch-settlement — le protocole de paiements programmatiques par requête utilisé pour facturer les appels d'agents IA. Démo closed-loop sur Base Sepolia, golden vectors byte-exact vs viem sur la dérivation channelId et le digest de voucher.

Public et vérifiable : github.com/Adelagric/x402-batch-settlement. Deux corrections upstream mergées dans la spec (PR #2325).

EIP-712 typed-data · golden vectors · routeur LLM × x402
PROJ_002
LiDAR · Anthropométrie
LiDARPythonOpen3DNumPy

LiDAR & nuages de points 3D

Maîtrise de la chaîne de traitement 3D : capture LiDAR, recalage, segmentation, extraction de repères anthropométriques. Pipeline reproductible, tolérances mesurables.

Démo synthétique ci-dessous — silhouette générée procéduralement.

nuage synthétique · 8 192 points · drag pour orbiter
capture · recalage · segmentation · Open3D / NumPy
PROJ_003
Infra IA · Rust
RustTonicgRPCQdrant

vector-router — Middleware de validation d'embeddings

Couche gRPC placée devant les bases vectorielles (Qdrant) qui valide la dimensionnalité, normalise les vecteurs, et empêche la corruption silencieuse des indices de similarité. Métriques RED, contrats versionnés.

Diffusé en licence propriétaire avec showcase technique séparé.

protobuf vector_router.proto
service VectorRouter {
  // Validate dimensions, NaN, normalize on demand
  rpc Validate(Embedding) returns (ValidationResult);
  rpc ValidateBatch(stream Embedding) returns (stream ValidationResult);
}

message Embedding {
  repeated float values    = 1;  // expected dim 1024 / 1536 / 3072
  string          namespace = 2;
  string          model_id  = 3;
}
zéro-allocation hot path · clients Python & TypeScript
PROJ_004
Infra IA · Rust
RustHTTPgRPCPrometheus

llm-sentinel — Proxy d'authentification LLM

Proxy qui s'intercale devant les fournisseurs LLM pour authentifier les appelants, limiter les taux par tenant, et compter les tokens. Observabilité Prometheus native, multi-tenant, streaming.

Posé en quelques heures, économise des milliers d'euros en garde-fous.

prometheus /metrics
# HELP llm_requests_total LLM API requests by tenant and provider
# TYPE llm_requests_total counter
llm_requests_total{tenant="acme",provider="openai"} 142371
llm_tokens_in_total{tenant="acme"}   4827193
llm_tokens_out_total{tenant="acme"}  891244
llm_rate_limit_hits{tenant="acme",window="1m"} 17

# Latency p50/p95/p99 — Rust + Tokio, no allocations on hot path
llm_request_duration_seconds{quantile="0.50"} 0.083
llm_request_duration_seconds{quantile="0.95"} 0.412
llm_request_duration_seconds{quantile="0.99"} 1.205
multi-tenant · streaming · backpressure
PROJ_005
Vision IA · Comptabilité
FastAPIGPT-4oPydanticpytest

Lumen — Extraction structurée de factures

API qui transforme une facture ou un avoir PDF en JSON métier calibré, avec score de confiance par champ. 42 tests, calibration mesurée, fallbacks documentés. Conçu pour des cabinets d'expertise comptable.

Vision LLM utilisée chirurgicalement, pas comme une boîte noire.

confiance calibrée · fallbacks structurés · audit trail
005 / Stack

Stack technique.

Langages

  • Rust
  • Python
  • TypeScript
  • C# / .NET 8
  • Go

Optimisation

  • OR-Tools
  • Gurobi · CPLEX
  • Heuristiques
  • Métaheuristiques
  • MILP

IA & données

  • RAG · ChromaDB
  • Qdrant · pgvector
  • Cross-encoders
  • Vision LLM
  • Tool use

Infra

  • Docker · K8s
  • gRPC · Tonic
  • FastAPI · Next.js
  • Postgres · Redis
  • Prometheus
RustPythonTypeScriptOR-Tools CP-SATFastAPINext.jsgRPC TonicQdrantOpen3DLiDAR RAGVision LLMPrometheusPostgres RustPythonTypeScriptOR-Tools CP-SATFastAPINext.jsgRPC TonicQdrantOpen3DLiDAR RAGVision LLMPrometheusPostgres

Un problème complexe à résoudre en code ?

Premier appel gratuit pour cadrer le besoin et savoir si je suis le bon profil. Optimisation, infra IA, agents, applicatif métier — si c'est calculable, on en discute.