Comment automatiser un crawler avec Crontab ?

Utilisez la commande 'crontab -e' pour éditer la tâche cron et ajoutez une tâche au format 'minute heure jour mois jour_de_la_semaine /chemin_absolu_de_python /chemin_absolu_du_script_de_crawling'.

Comment trouver le chemin absolu de Python sur Mac ou Linux ?

Exécutez la commande 'which python3' dans le terminal pour obtenir le chemin absolu de Python.

Quelle commande utiliser pour trouver le chemin d'un script sous Windows ?

Utilisez la commande 'dir nom_du_script.py /s' dans l'invite de commandes pour localiser le chemin du script.

Quelles sont les étapes pour automatiser un crawler sous Windows ?

Utilisez le Planificateur de tâches (Task Scheduler) et trouvez les chemins de Python et du script à l'aide de 'where python3' et 'dir'.

Méthode de crawl automatique pour concours et activités externes de CampusPick en Python

Q: Comment exécuter un script Python à une heure spécifique avec Crontab ?

Ajoutez une ligne dans Crontab, par exemple '30 15 * * * /usr/local/bin/python3 /votre/chemin/vers/script.py' pour exécuter le script tous les jours à 15h30.

Après avoir créé le "crawler Campus Pick avec Python" la dernière fois, cette fois-ci, nous allons examiner comment exécuter notre crawler aux jours, dates et heures souhaités.

Il existe divers types de planificateurs, mais cette fois, nous allons implémenter l'automatisation du crawling en utilisant Crontab pour les systèmes Unix tels que Mac/Linux et le Planificateur de tâches pour Windows. Vous devrez adapter le code en fonction du système d'exploitation que vous utilisez.

0. Points à vérifier avant de commencer

해당 Crontab과 TaskScheduler(작업스케줄러)는 컴퓨터가 켜져있는 상황에서만 동작합니다.
코드를 실행시키고 컴퓨터를 꺼버리면 작동하지 않습니다!

1. Automatisation avec Crontab

Ouvrez le terminal et saisissez la commande crontab -e pour éditer la tâche cron.

Ajoutez la tâche à planifier en suivant le format ci-dessous.

minute heure jour mois jour_de_la_semaine /chemin_absolu_de_python /chemin_absolu_du_script_de_crawling

2. Trouver le chemin absolu de Python

which python3
/usr/local/bin/python3

En utilisant la commande which dans le terminal, vous obtiendrez le répertoire complet du fichier. Utilisez cette adresse de répertoire pour le chemin absolu de Python.

3. Trouver le chemin absolu du script

find . -name "파일이름"

En utilisant la commande, vous obtiendrez le chemin correspondant au nom du fichier. Utilisez cette adresse de répertoire pour le chemin absolu du script Python.

Par exemple, pour exécuter tous les jours à 15h30 :

30 15 * * * /usr/local/bin/python3 /votre/chemin/vers/script.py

※ Remarque : Crontab nécessite l'utilisation de chemins absolus, veuillez donc entrer correctement les chemins absolus de Python et du script. Comme les variables d'environnement peuvent ne pas être définies, il est recommandé de définir directement les variables d'environnement nécessaires dans le script.

De cette manière, notre crawler sera exécuté tous les jours à 15h30.

4. Automatisation avec Task Scheduler

4.1. Trouver le chemin absolu de Python

La méthode pour trouver le chemin de Python est différente sous Windows. Ouvrez une fenêtre d'invite de commandes CMD et exécutez :

where python3

Utilisez le chemin obtenu comme chemin de Python. Si plusieurs chemins pour python3 sont affichés, déterminez celui que vous utilisez et utilisez ce chemin.

4.2. Trouver le chemin absolu du script

Dans la même fenêtre CMD que précédemment, utilisez la commande dir pour trouver le chemin.

dir campuspickcrawling.py /s

Vous devez spécifier le nom de fichier et l'extension de votre propre script de crawling Python. Une fois que le chemin est renvoyé, utilisez ce chemin.

4.3. Configuration

Recherchez "Planificateur de tâches" dans le menu Démarrer
Sélectionnez "Créer une tâche"
Entrez le nom de la tâche et la description
Dans l'onglet "Déclencheur", ajoutez un nouveau déclencheur pour définir l'heure d'exécution et la fréquence
Dans l'onglet "Actions", ajoutez une nouvelle action pour exécuter le script Python

(*Insérez le chemin du script Python que vous avez trouvé ici.)
Une fois la configuration terminée, cliquez sur "OK" pour enregistrer la tâche.

Ainsi, vous pourrez automatiser également sous Windows.

5. Conclusion

Dans cet article, nous avons examiné comment automatiser notre crawler que nous avons créé sur UNIX et Windows respectivement. Dans le prochain article, maintenant que nous avons automatisé, nous examinerons comment envoyer périodiquement les données de crawling que nous avons collectées par e-mail.