Disponible · prend 2 missions en parallèle

Logiciel sur mesure, infrastructure IA, optimisation.

kaleche.dev — ingénieur logiciel et recherche opérationnelle. Solveurs d'optimisation, middleware d'infrastructure IA en Rust, applications métier en Python / TypeScript / .NET.

Voir les projets → Parler d'une mission

~/kaleche-dev — bash

Bienvenue sur kaleche.dev. Tape help pour la liste des commandes.

$ whoami

→ Ingénieur RO · builder full-stack · Rust · Python · TypeScript

$ availability

✓ open · 2 missions max · remote ou Occitanie

001 / Profil

Ingénieur logiciel & recherche opérationnelle.

Formé à la recherche opérationnelle, je travaille à l'intersection de la modélisation, du logiciel applicatif, et de l'infrastructure IA.

En pratique, je construis des logiciels. Solveurs d'optimisation (CP-SAT, MILP), middleware d'infrastructure IA en Rust, agents et applications en Python / TypeScript / .NET.

Missions ponctuelles ou forfait : audit, conception, implémentation, déploiement.

Domaines d'intervention — logiciel, infra IA, agents, RO

Stacks principales — Rust, Python, TS, C#, Go

FR · EN

Missions à distance · Occitanie · Europe

002 / Expertises

Domaines d'intervention.

[ 01 ] LOGICIEL

Développement applicatif sur mesure

SaaS B2B, outils internes, applications desktop, APIs. Architecture pragmatique, tests qui servent à quelque chose, observabilité dès le jour 1.

PythonTypeScript.NET FastAPINext.js

[ 02 ] INFRA IA

Middleware LLM

Proxies, rate-limiting, validation vectorielle. Rust, gRPC.

RustTonicQdrant

[ 03 ] AGENTS

Systèmes IA multi-outils

RAG, agents Telegram/web, extraction structurée, orchestration.

RAGVisionChromaDB

[ 04 ] OPTIMISATION

Recherche opérationnelle appliquée

Modélisation et résolution de problèmes combinatoires : planning, allocation, ordonnancement, tournées. Du cahier des charges à la production.

OR-ToolsCP-SATMILP HeuristiquesGurobi

[ + ]

Méthode

Cadrage clair en début de mission. Itérations courtes. Tests qui couvrent les cas pénibles, pas les heureux. Documentation au fur et à mesure, pas en fin de mission.

AuditSpecBuild DeployHandover

003 / Playground

Solveur TSP en direct.

Recherche opérationnelle qu'on peut voir tourner. Génère N points, observe l'algorithme construire une tournée par nearest-neighbor, puis l'améliorer par 2-opt jusqu'à l'optimum local. Tout en JavaScript, dans ton navigateur.

tsp-solver · 2-opt iterative

idle

villes— distance— itérations— amélioration—

004 / Projets

Projets sélectionnés.

PROJ_001

LiDAR · Anthropométrie

LiDARPythonOpen3DNumPy

LiDAR & nuages de points 3D

Maîtrise de la chaîne de traitement 3D : capture LiDAR, recalage, segmentation, extraction de repères anthropométriques. Pipeline reproductible, tolérances mesurables.

Démo synthétique ci-dessous — silhouette générée procéduralement.

nuage synthétique · 8 192 points · drag pour orbiter

capture · recalage · segmentation · Open3D / NumPy

PROJ_002

Infra IA · Rust

RustTonicgRPCQdrant

vector-router — Middleware de validation d'embeddings

Couche gRPC placée devant les bases vectorielles (Qdrant) qui valide la dimensionnalité, normalise les vecteurs, et empêche la corruption silencieuse des indices de similarité. Métriques RED, contrats versionnés.

Diffusé en licence propriétaire avec showcase technique séparé.

protobuf vector_router.proto

service VectorRouter {
  // Validate dimensions, NaN, normalize on demand
  rpc Validate(Embedding) returns (ValidationResult);
  rpc ValidateBatch(stream Embedding) returns (stream ValidationResult);
}

message Embedding {
  repeated float values    = 1;  // expected dim 1024 / 1536 / 3072
  string          namespace = 2;
  string          model_id  = 3;
}

zéro-allocation hot path · clients Python & TypeScript

PROJ_003

Infra IA · Rust

RustHTTPgRPCPrometheus

llm-sentinel — Proxy d'authentification LLM

Proxy qui s'intercale devant les fournisseurs LLM pour authentifier les appelants, limiter les taux par tenant, et compter les tokens. Observabilité Prometheus native, multi-tenant, streaming.

Posé en quelques heures, économise des milliers d'euros en garde-fous.

prometheus /metrics

# HELP llm_requests_total LLM API requests by tenant and provider
# TYPE llm_requests_total counter
llm_requests_total{tenant="acme",provider="openai"} 142371
llm_tokens_in_total{tenant="acme"}   4827193
llm_tokens_out_total{tenant="acme"}  891244
llm_rate_limit_hits{tenant="acme",window="1m"} 17

# Latency p50/p95/p99 — Rust + Tokio, no allocations on hot path
llm_request_duration_seconds{quantile="0.50"} 0.083
llm_request_duration_seconds{quantile="0.95"} 0.412
llm_request_duration_seconds{quantile="0.99"} 1.205

multi-tenant · streaming · backpressure

PROJ_004

Vision IA · Comptabilité

FastAPIGPT-4oPydanticpytest

Lumen — Extraction structurée de factures

API qui transforme une facture ou un avoir PDF en JSON métier calibré, avec score de confiance par champ. 42 tests, calibration mesurée, fallbacks documentés. Conçu pour des cabinets d'expertise comptable.

Vision LLM utilisée chirurgicalement, pas comme une boîte noire.

confiance calibrée · fallbacks structurés · audit trail

005 / Stack

Stack technique.

Langages

Rust
Python
TypeScript
C# / .NET 8
Go

Optimisation

OR-Tools
Gurobi · CPLEX
Heuristiques
Métaheuristiques
MILP

IA & données

RAG · ChromaDB
Qdrant · pgvector
Cross-encoders
Vision LLM
Tool use

Infra

Docker · K8s
gRPC · Tonic
FastAPI · Next.js
Postgres · Redis
Prometheus

RustPythonTypeScriptOR-Tools CP-SATFastAPINext.jsgRPC TonicQdrantOpen3DLiDAR RAGVision LLMPrometheusPostgres RustPythonTypeScriptOR-Tools CP-SATFastAPINext.jsgRPC TonicQdrantOpen3DLiDAR RAGVision LLMPrometheusPostgres

Un problème complexe à résoudre en code ?

Premier appel gratuit pour cadrer le besoin et savoir si je suis le bon profil. Optimisation, infra IA, agents, applicatif métier — si c'est calculable, on en discute.

contact@kaleche.dev → GitHub LinkedIn