0. Trois façons de faire du crawling sur Instagram
Il existe différentes façons de faire du crawling sur Instagram.
Les exemples de code suivants sont écrits en Ruby.
1. Méthode utilisant l'API publique
Obtention du jeton d'accès
Vous devez créer un compte développeur, enregistrer une application, obtenir une autorisation et recevoir un jeton d'accès.
require 'net/http'
require 'json'
access_token = '발급받은 액세스 토큰'
url = URI("https://graph.instagram.com/me?fields=id,username,followers_count&access_token=#{access_token}")
response = Net::HTTP.get(url)
data = JSON.parse(response)
follower_count = data['followers_count']
puts "팔로워 수: #{follower_count}"
Avantages et inconvénients
Avantages:
- Il s'agit d'une API officielle, donc il n'y a pas de risque de blocage.
Inconvénients:
- Nécessite un compte développeur et un jeton d'accès.
- Limitations en termes de nombre de requêtes et de vitesse.
- Pour des raisons de confidentialité, vous ne pouvez obtenir que le nombre de vos abonnés et pas celui des abonnés d'autres utilisateurs.
2. Méthode utilisant une page web
require 'nokogiri'
require 'selenium-webdriver'
driver = Selenium::WebDriver.for :chrome
url = "https://www.instagram.com/suuu_yeony/"
driver.get(url)
doc = Nokogiri::HTML(driver.page_source)
follower_count = doc.at('button:contains("팔로워")').text
puts "#{follower_count}"
Avantages et inconvénients
Avantages:
- Vous pouvez également obtenir le nombre d'abonnés d'autres utilisateurs.
Inconvénients:
- Risque de blocage de l'IP ou du compte en cas de détection.
- La stabilité peut être compromise en raison des caractéristiques de Selenium.
3. Méthode utilisant une API privée
Il s'agit d'une méthode qui utilise l'analyse des données retournées au format JSON.
Avantages et inconvénients
Avantages:
- Vous pouvez également obtenir le nombre d'abonnés d'autres utilisateurs.
- Grande stabilité.
Inconvénients:
- Risque de blocage de l'IP ou du compte en cas de détection.
4. Conclusion
En dehors des méthodes présentées ci-dessus, il existe de nombreuses autres façons de faire du crawling, adaptées à chaque objectif.
Instagram impose des limitations telles que la récupération des données d'une seule page sans connexion.
Nous vous encourageons à essayer le scraping d'Instagram avec HashScraper pour faire du crawling facilement sans vous connecter.




