4.3 KiB
4.3 KiB
🚀 Guide de démarrage rapide - pdf2csv v2.0
⚡ Démarrage ultra-rapide (Docker)
# 1. Construire l'image
docker build -t pdf2csv .
# 2. Créer un dossier avec vos PDFs
mkdir data
cp vos_pdfs/*.pdf data/
# 3. Lancer la conversion
docker run --rm -v $(pwd)/data:/data pdf2csv
# 4. Récupérer le résultat
cat data/fusion_total.csv
📦 Utilisation avec Make (Recommandé)
# Construire
make build
# Placer vos PDFs dans ./data/
mkdir -p data
cp vos_pdfs/*.pdf data/
# Lancer
make run
# Ou en mode verbeux
make run-verbose
# Voir toutes les commandes
make help
🐍 Utilisation locale (sans Docker)
# 1. Installer les dépendances
pip install -r requirements.txt
# 2. S'assurer que Java est installé
java -version # Si erreur, installer: sudo apt-get install openjdk-17-jre
# 3. Lancer
python convert.py ./data --verbose
⚙️ Configuration personnalisée
# 1. Créer un fichier de configuration
cp config.example.env .env
# 2. Éditer .env
nano .env
# 3. Lancer avec la configuration
docker run --rm -v $(pwd)/data:/data --env-file .env pdf2csv --verbose
Ou avec Make:
make run-custom
📊 Options disponibles
# Mode verbeux (logs détaillés)
python convert.py ./data --verbose
# Personnaliser les mots-clés
python convert.py ./data --mot-debut "BALANCE" --mot-fin "TOTAL"
# Conserver les fichiers temporaires (debug)
python convert.py ./data --no-clean
# Aide complète
python convert.py --help
🔧 Variables d'environnement
| Variable | Valeur par défaut | Description |
|---|---|---|
MOT_DEBUT |
SOLDE |
Début des données |
MOT_FIN |
Total des mouvements |
Fin des données |
MOT_DATE |
date |
En-tête à ignorer |
SKIP_LINES |
3 |
Lignes à sauter |
✅ Test de l'installation
# Script de test automatique
./test_script.sh
# Test manuel
python convert.py --help
📁 Structure des fichiers résultants
data/
├── releve1.pdf ← Votre PDF d'origine
├── releve1_brut.csv ← CSV brut (supprimé par défaut)
├── releve1_final.csv ← CSV nettoyé
├── releve2.pdf
├── releve2_final.csv
└── fusion_total.csv ← 🎯 FICHIER FINAL FUSIONNÉ
🆘 Problèmes courants
"Aucun PDF trouvé"
# Vérifier que les PDFs sont bien dans le bon dossier
ls -la data/*.pdf
# Vérifier le montage Docker
docker run --rm -v $(pwd)/data:/data pdf2csv ls -la /data
"Java not found"
# Installer Java
sudo apt-get update
sudo apt-get install openjdk-17-jre-headless
"Module tabula not found"
# Installer les dépendances
pip install -r requirements.txt
Résultats incorrects
# Lancer en mode verbeux pour voir les étapes
python convert.py ./data --verbose
# Ajuster la configuration
python convert.py ./data --mot-debut "VOTRE_MOT" --verbose
📚 Documentation complète
- README.md : Documentation complète
- CHANGELOG.md : Liste des améliorations
- Makefile : Commandes disponibles (
make help) - config.example.env : Exemple de configuration
💡 Exemples d'utilisation
Exemple 1 : Relevés bancaires
docker run --rm -v $(pwd)/relevés:/data pdf2csv
Exemple 2 : Factures personnalisées
docker run --rm \
-v $(pwd)/factures:/data \
-e MOT_DEBUT="FACTURE N°" \
-e MOT_FIN="TOTAL TTC" \
pdf2csv --verbose
Exemple 3 : Traitement par lots
# Traiter tous les PDFs d'un dossier
for dir in client_*; do
echo "Traitement de $dir..."
docker run --rm -v $(pwd)/$dir:/data pdf2csv
done
🎯 Commandes essentielles
# Construction
docker build -t pdf2csv . # Ou: make build
# Utilisation basique
docker run --rm -v $(pwd)/data:/data pdf2csv
# Mode debug
docker run --rm -v $(pwd)/data:/data pdf2csv --verbose
# Avec configuration
docker run --rm -v $(pwd)/data:/data --env-file .env pdf2csv
# Shell interactif (debug)
docker run --rm -it -v $(pwd)/data:/data --entrypoint /bin/bash pdf2csv
# Statut
make status
📞 Aide
Pour plus d'informations :
python convert.py --help
make help
cat README.md
Bon traitement ! 🚀