IA locale avec Ollama — traiter vos données sans les envoyer à l'extérieur

Comment ça fonctionne

Ollama télécharge un modèle de langage (Llama, Mistral, Gemma, Phi) localement et l'exécute via une interface en ligne de commande ou des interfaces graphiques comme Open WebUI. La qualité est inférieure à GPT-4 ou Claude Sonnet — mais pour les usages internes d'une association, c'est souvent suffisant.

Ce que vous pouvez faire concrètement

Analyser un document interne (statuts, règlement) pour en extraire des points clés
Générer un résumé de procès-verbal à partir de notes brutes
Reformuler une communication interne
Répondre à des questions sur vos documents (mode RAG avec PrivateGPT)
Classifier des emails entrants

Configuration minimale réelle

RAM disponible	Modèle recommandé	Qualité attendue
8 Go	Phi-3 Mini, Gemma 2B	Basique — lent mais fonctionnel
16 Go	Mistral 7B, Llama 3.1 8B	Acceptable pour la plupart des usages
32 Go + GPU	Llama 3.1 70B	Proche des services cloud

Installation en 3 étapes

Téléchargez Ollama sur ollama.com (Windows, macOS, Linux)
Dans un terminal : ollama pull mistral (télécharge Mistral 7B, ~4 Go)
Lancez : ollama run mistral et posez vos questions

La limite qu'il faut connaître

Les modèles locaux n'ont pas accès à Internet et ne connaissent pas les événements récents. Pour des tâches complexes avec des informations à jour, un service cloud hébergé en Suisse (Infomaniak IA) reste préférable.

Exercice pratique

✅ À faire maintenant : installez Ollama et le modèle Mistral. Copiez-collez le texte d'un article de vos statuts et demandez-lui : «Explique cet article en trois phrases simples.» Évaluez la qualité — vous saurez immédiatement si cet outil correspond à vos besoins.