Comment ça fonctionne

Ollama télécharge un modèle de langage (Llama, Mistral, Gemma, Phi) localement et l'exécute via une interface en ligne de commande ou des interfaces graphiques comme Open WebUI. La qualité est inférieure à GPT-4 ou Claude Sonnet — mais pour les usages internes d'une association, c'est souvent suffisant.

Ce que vous pouvez faire concrètement

Configuration minimale réelle

RAM disponibleModèle recommandéQualité attendue
8 GoPhi-3 Mini, Gemma 2BBasique — lent mais fonctionnel
16 GoMistral 7B, Llama 3.1 8BAcceptable pour la plupart des usages
32 Go + GPULlama 3.1 70BProche des services cloud

Installation en 3 étapes

  1. Téléchargez Ollama sur ollama.com (Windows, macOS, Linux)
  2. Dans un terminal : ollama pull mistral (télécharge Mistral 7B, ~4 Go)
  3. Lancez : ollama run mistral et posez vos questions

La limite qu'il faut connaître

Les modèles locaux n'ont pas accès à Internet et ne connaissent pas les événements récents. Pour des tâches complexes avec des informations à jour, un service cloud hébergé en Suisse (Infomaniak IA) reste préférable.

Exercice pratique

À faire maintenant : installez Ollama et le modèle Mistral. Copiez-collez le texte d'un article de vos statuts et demandez-lui : «Explique cet article en trois phrases simples.» Évaluez la qualité — vous saurez immédiatement si cet outil correspond à vos besoins.