Comment ça fonctionne
Ollama télécharge un modèle de langage (Llama, Mistral, Gemma, Phi) localement et l'exécute via une interface en ligne de commande ou des interfaces graphiques comme Open WebUI. La qualité est inférieure à GPT-4 ou Claude Sonnet — mais pour les usages internes d'une association, c'est souvent suffisant.
Ce que vous pouvez faire concrètement
- Analyser un document interne (statuts, règlement) pour en extraire des points clés
- Générer un résumé de procès-verbal à partir de notes brutes
- Reformuler une communication interne
- Répondre à des questions sur vos documents (mode RAG avec PrivateGPT)
- Classifier des emails entrants
Configuration minimale réelle
| RAM disponible | Modèle recommandé | Qualité attendue |
|---|---|---|
| 8 Go | Phi-3 Mini, Gemma 2B | Basique — lent mais fonctionnel |
| 16 Go | Mistral 7B, Llama 3.1 8B | Acceptable pour la plupart des usages |
| 32 Go + GPU | Llama 3.1 70B | Proche des services cloud |
Installation en 3 étapes
- Téléchargez Ollama sur ollama.com (Windows, macOS, Linux)
- Dans un terminal :
ollama pull mistral(télécharge Mistral 7B, ~4 Go) - Lancez :
ollama run mistralet posez vos questions
La limite qu'il faut connaître
Les modèles locaux n'ont pas accès à Internet et ne connaissent pas les événements récents. Pour des tâches complexes avec des informations à jour, un service cloud hébergé en Suisse (Infomaniak IA) reste préférable.
Exercice pratique
✅ À faire maintenant : installez Ollama et le modèle Mistral. Copiez-collez le texte d'un article de vos statuts et demandez-lui : «Explique cet article en trois phrases simples.» Évaluez la qualité — vous saurez immédiatement si cet outil correspond à vos besoins.