SYS · kaleche.dev v2026.1
STATUS / available SLOTS / 2 missions max LOC / Occitanie · remote
Disponible · prend 2 missions en parallèle

Logiciel sur mesure, infrastructure IA, optimisation.

kaleche.dev — ingénieur logiciel et recherche opérationnelle. Solveurs d'optimisation, middleware d'infrastructure IA en Rust, applications métier en Python / TypeScript / .NET.

~/kaleche-dev — bash
Bienvenue sur kaleche.dev. Tape help pour la liste des commandes.
$ whoami
→ Ingénieur RO · builder full-stack · Rust · Python · TypeScript
$ availability
✓ open · 2 missions max · remote ou Occitanie
$
001 / Profil

Ingénieur logiciel & recherche opérationnelle.

Formé à la recherche opérationnelle, je travaille à l'intersection de la modélisation, du logiciel applicatif, et de l'infrastructure IA.

En pratique, je construis des logiciels. Solveurs d'optimisation (CP-SAT, MILP), middleware d'infrastructure IA en Rust, agents et applications en Python / TypeScript / .NET.

Missions ponctuelles ou forfait : audit, conception, implémentation, déploiement.

04
Domaines d'intervention — logiciel, infra IA, agents, RO
05
Stacks principales — Rust, Python, TS, C#, Go
FR · EN
Missions à distance · Occitanie · Europe
002 / Expertises

Domaines d'intervention.

[ 01 ] LOGICIEL

Développement applicatif sur mesure

SaaS B2B, outils internes, applications desktop, APIs. Architecture pragmatique, tests qui servent à quelque chose, observabilité dès le jour 1.

PythonTypeScript.NET FastAPINext.js
[ 02 ] INFRA IA

Middleware LLM

Proxies, rate-limiting, validation vectorielle. Rust, gRPC.

RustTonicQdrant
[ 03 ] AGENTS

Systèmes IA multi-outils

RAG, agents Telegram/web, extraction structurée, orchestration.

RAGVisionChromaDB
[ 04 ] OPTIMISATION

Recherche opérationnelle appliquée

Modélisation et résolution de problèmes combinatoires : planning, allocation, ordonnancement, tournées. Du cahier des charges à la production.

OR-ToolsCP-SATMILP HeuristiquesGurobi
[ + ]

Méthode

Cadrage clair en début de mission. Itérations courtes. Tests qui couvrent les cas pénibles, pas les heureux. Documentation au fur et à mesure, pas en fin de mission.

AuditSpecBuild DeployHandover
003 / Playground

Solveur TSP en direct.

Recherche opérationnelle qu'on peut voir tourner. Génère N points, observe l'algorithme construire une tournée par nearest-neighbor, puis l'améliorer par 2-opt jusqu'à l'optimum local. Tout en JavaScript, dans ton navigateur.

tsp-solver · 2-opt iterative
idle
villes distance itérations amélioration
004 / Projets

Projets sélectionnés.

PROJ_001
LiDAR · Anthropométrie
LiDARPythonOpen3DNumPy

LiDAR & nuages de points 3D

Maîtrise de la chaîne de traitement 3D : capture LiDAR, recalage, segmentation, extraction de repères anthropométriques. Pipeline reproductible, tolérances mesurables.

Démo synthétique ci-dessous — silhouette générée procéduralement.

nuage synthétique · 8 192 points · drag pour orbiter
capture · recalage · segmentation · Open3D / NumPy
PROJ_002
Infra IA · Rust
RustTonicgRPCQdrant

vector-router — Middleware de validation d'embeddings

Couche gRPC placée devant les bases vectorielles (Qdrant) qui valide la dimensionnalité, normalise les vecteurs, et empêche la corruption silencieuse des indices de similarité. Métriques RED, contrats versionnés.

Diffusé en licence propriétaire avec showcase technique séparé.

protobuf vector_router.proto
service VectorRouter {
  // Validate dimensions, NaN, normalize on demand
  rpc Validate(Embedding) returns (ValidationResult);
  rpc ValidateBatch(stream Embedding) returns (stream ValidationResult);
}

message Embedding {
  repeated float values    = 1;  // expected dim 1024 / 1536 / 3072
  string          namespace = 2;
  string          model_id  = 3;
}
zéro-allocation hot path · clients Python & TypeScript
PROJ_003
Infra IA · Rust
RustHTTPgRPCPrometheus

llm-sentinel — Proxy d'authentification LLM

Proxy qui s'intercale devant les fournisseurs LLM pour authentifier les appelants, limiter les taux par tenant, et compter les tokens. Observabilité Prometheus native, multi-tenant, streaming.

Posé en quelques heures, économise des milliers d'euros en garde-fous.

prometheus /metrics
# HELP llm_requests_total LLM API requests by tenant and provider
# TYPE llm_requests_total counter
llm_requests_total{tenant="acme",provider="openai"} 142371
llm_tokens_in_total{tenant="acme"}   4827193
llm_tokens_out_total{tenant="acme"}  891244
llm_rate_limit_hits{tenant="acme",window="1m"} 17

# Latency p50/p95/p99 — Rust + Tokio, no allocations on hot path
llm_request_duration_seconds{quantile="0.50"} 0.083
llm_request_duration_seconds{quantile="0.95"} 0.412
llm_request_duration_seconds{quantile="0.99"} 1.205
multi-tenant · streaming · backpressure
PROJ_004
Vision IA · Comptabilité
FastAPIGPT-4oPydanticpytest

Lumen — Extraction structurée de factures

API qui transforme une facture ou un avoir PDF en JSON métier calibré, avec score de confiance par champ. 42 tests, calibration mesurée, fallbacks documentés. Conçu pour des cabinets d'expertise comptable.

Vision LLM utilisée chirurgicalement, pas comme une boîte noire.

confiance calibrée · fallbacks structurés · audit trail
005 / Stack

Stack technique.

Langages

  • Rust
  • Python
  • TypeScript
  • C# / .NET 8
  • Go

Optimisation

  • OR-Tools
  • Gurobi · CPLEX
  • Heuristiques
  • Métaheuristiques
  • MILP

IA & données

  • RAG · ChromaDB
  • Qdrant · pgvector
  • Cross-encoders
  • Vision LLM
  • Tool use

Infra

  • Docker · K8s
  • gRPC · Tonic
  • FastAPI · Next.js
  • Postgres · Redis
  • Prometheus
RustPythonTypeScriptOR-Tools CP-SATFastAPINext.jsgRPC TonicQdrantOpen3DLiDAR RAGVision LLMPrometheusPostgres RustPythonTypeScriptOR-Tools CP-SATFastAPINext.jsgRPC TonicQdrantOpen3DLiDAR RAGVision LLMPrometheusPostgres

Un problème complexe à résoudre en code ?

Premier appel gratuit pour cadrer le besoin et savoir si je suis le bon profil. Optimisation, infra IA, agents, applicatif métier — si c'est calculable, on en discute.