erase icons in docs

This commit is contained in:
syoul
2025-11-04 17:04:01 +01:00
parent 8c9392b613
commit a7f6c6e569
8 changed files with 325 additions and 325 deletions

View File

@@ -1,23 +1,23 @@
# 📄 pdf2csv
# pdf2csv
Convertisseur de fichiers **PDF** en **CSV** basé sur [tabula-py](https://github.com/chezou/tabula-py) et [pandas](https://pandas.pydata.org/), empaqueté dans une image **Docker** légère.
Il est conçu pour traiter automatiquement les relevés bancaires PDF (ou autres tableaux PDF similaires) en appliquant des opérations de nettoyage et de fusion avant de produire un fichier CSV unique.
## Nouveautés v2.0
## Nouveautés v2.0
- **Gestion d'erreurs robuste** : Traitement gracieux des erreurs avec logs détaillés
- **Logging professionnel** : Logs structurés avec niveaux (INFO, DEBUG, ERROR)
- **Type hints** : Code entièrement typé pour une meilleure maintenabilité
- **Configuration flexible** : Variables d'environnement et arguments CLI
- **Validation des entrées** : Vérification de la validité des fichiers PDF
- **Nettoyage automatique** : Suppression des fichiers temporaires
- **Arguments CLI** : Paramétrage via ligne de commande
- **Requirements.txt** : Gestion des dépendances standardisée
- **Gestion d'erreurs robuste** : Traitement gracieux des erreurs avec logs détaillés
- **Logging professionnel** : Logs structurés avec niveaux (INFO, DEBUG, ERROR)
- **Type hints** : Code entièrement typé pour une meilleure maintenabilité
- **Configuration flexible** : Variables d'environnement et arguments CLI
- **Validation des entrées** : Vérification de la validité des fichiers PDF
- **Nettoyage automatique** : Suppression des fichiers temporaires
- **Arguments CLI** : Paramétrage via ligne de commande
- **Requirements.txt** : Gestion des dépendances standardisée
---
## 🚀 Fonctionnalités
## Fonctionnalités
### Extraction
- Utilise `tabula-py` pour extraire les tableaux depuis tous les fichiers PDF
@@ -44,7 +44,7 @@ Il est conçu pour traiter automatiquement les relevés bancaires PDF (ou autres
---
## 📦 Installation
## Installation
### Option 1 : Docker (Recommandé)
@@ -74,7 +74,7 @@ sudo apt-get install openjdk-17-jre-headless
---
## 🎯 Utilisation
## Utilisation
### Utilisation avec Docker
@@ -141,7 +141,7 @@ python convert.py --help
---
## ⚙️ Configuration
## Configuration
### Variables d'environnement
@@ -174,7 +174,7 @@ Options:
---
## 📝 Exemples
## Exemples
### Exemple 1 : Relevés bancaires standards
@@ -229,7 +229,7 @@ python convert.py ./test_pdfs \
---
## 🔍 Logs et débogage
## Logs et débogage
### Logs normaux
@@ -237,11 +237,11 @@ python convert.py ./test_pdfs \
2025-10-11 14:23:15 - INFO - Trouvé 3 fichier(s) PDF à traiter
2025-10-11 14:23:15 - INFO - Configuration : Configuration(MOT_DEBUT=SOLDE, ...)
2025-10-11 14:23:16 - INFO - Conversion de releve_janvier.pdf...
2025-10-11 14:23:18 - INFO - Converti : releve_janvier.pdf
2025-10-11 14:23:18 - INFO - Converti : releve_janvier.pdf
2025-10-11 14:23:18 - INFO - CSV nettoyé sauvegardé : releve_janvier_final.csv (45 lignes)
2025-10-11 14:23:18 - INFO - Nettoyé : releve_janvier_final.csv
2025-10-11 14:23:18 - INFO - Nettoyé : releve_janvier_final.csv
...
2025-10-11 14:23:25 - INFO - Fichier fusionné créé : fusion_total.csv (132 lignes)
2025-10-11 14:23:25 - INFO - Fichier fusionné créé : fusion_total.csv (132 lignes)
2025-10-11 14:23:25 - INFO - ============================================================
2025-10-11 14:23:25 - INFO - Traitement terminé :
2025-10-11 14:23:25 - INFO - - Fichiers traités avec succès : 3/3
@@ -266,7 +266,7 @@ Affiche des informations supplémentaires sur :
---
## 🐛 Résolution de problèmes
## Résolution de problèmes
### Erreur : "Aucun PDF trouvé"
@@ -292,7 +292,7 @@ Affiche des informations supplémentaires sur :
---
## 🏗️ Architecture du code
## Architecture du code
```
convert.py
@@ -310,7 +310,7 @@ convert.py
---
## 🧪 Tests
## Tests
```bash
# Créer un dossier de test avec des PDFs échantillons
@@ -331,13 +331,13 @@ cat test_pdfs/fusion_total.csv
---
## 📄 Licence
## Licence
Ce projet est sous licence MIT. Voir le fichier LICENSE pour plus de détails.
---
## 🤝 Contribution
## Contribution
Les contributions sont les bienvenues ! N'hésitez pas à :
@@ -349,7 +349,7 @@ Les contributions sont les bienvenues ! N'hésitez pas à :
---
## 📞 Support
## Support
Pour toute question ou problème :
@@ -359,23 +359,23 @@ Pour toute question ou problème :
---
## 🔄 Changelog
## Changelog
### v2.0 (2025-10-11)
- Refactoring complet du code
- Ajout de la gestion d'erreurs robuste
- Logging professionnel avec niveaux
- Type hints pour tout le code
- Configuration via variables d'environnement
- Arguments CLI avec argparse
- Validation des entrées
- Nettoyage automatique des fichiers temporaires
- Documentation complète
- 📦 requirements.txt standardisé
- 🐛 Corrections de bugs divers
- Refactoring complet du code
- Ajout de la gestion d'erreurs robuste
- Logging professionnel avec niveaux
- Type hints pour tout le code
- Configuration via variables d'environnement
- Arguments CLI avec argparse
- Validation des entrées
- Nettoyage automatique des fichiers temporaires
- Documentation complète
- requirements.txt standardisé
- Corrections de bugs divers
### v1.0
- 🎉 Version initiale
- Version initiale
- Conversion PDF → CSV avec tabula
- Nettoyage basique
- Fusion de fichiers