L'enfer de la collecte de données, Instagram ? Percez-le avec ces 3 méthodes !

Introduction des méthodes de collecte de données Instagram, leurs avantages et inconvénients, utilisation de l'API officielle, des pages web et des API privées.

4
L'enfer de la collecte de données, Instagram ? Percez-le avec ces 3 méthodes !

0. Trois façons de faire du crawling sur Instagram

Il existe différentes façons de faire du crawling sur Instagram.

Les exemples de code suivants sont écrits en Ruby.

1. Méthode utilisant l'API publique

Obtention du jeton d'accès

Vous devez créer un compte développeur, enregistrer une application, obtenir une autorisation et recevoir un jeton d'accès.

require 'net/http'
require 'json'

access_token = '발급받은 액세스 토큰'
url = URI("https://graph.instagram.com/me?fields=id,username,followers_count&access_token=#{access_token}")

response = Net::HTTP.get(url)
data = JSON.parse(response)

follower_count = data['followers_count']
puts "팔로워 수: #{follower_count}"

Avantages et inconvénients

Avantages:
- Il s'agit d'une API officielle, donc il n'y a pas de risque de blocage.

Inconvénients:
- Nécessite un compte développeur et un jeton d'accès.
- Limitations en termes de nombre de requêtes et de vitesse.
- Pour des raisons de confidentialité, vous ne pouvez obtenir que le nombre de vos abonnés et pas celui des abonnés d'autres utilisateurs.

2. Méthode utilisant une page web

require 'nokogiri'
require 'selenium-webdriver'

driver = Selenium::WebDriver.for :chrome

url = "https://www.instagram.com/suuu_yeony/"
driver.get(url)

doc = Nokogiri::HTML(driver.page_source)
follower_count = doc.at('button:contains("팔로워")').text
puts "#{follower_count}"

Avantages et inconvénients

Avantages:
- Vous pouvez également obtenir le nombre d'abonnés d'autres utilisateurs.

Inconvénients:
- Risque de blocage de l'IP ou du compte en cas de détection.
- La stabilité peut être compromise en raison des caractéristiques de Selenium.

3. Méthode utilisant une API privée

Il s'agit d'une méthode qui utilise l'analyse des données retournées au format JSON.

Avantages et inconvénients

Avantages:
- Vous pouvez également obtenir le nombre d'abonnés d'autres utilisateurs.
- Grande stabilité.

Inconvénients:
- Risque de blocage de l'IP ou du compte en cas de détection.

4. Conclusion

En dehors des méthodes présentées ci-dessus, il existe de nombreuses autres façons de faire du crawling, adaptées à chaque objectif.

Instagram impose des limitations telles que la récupération des données d'une seule page sans connexion.

Nous vous encourageons à essayer le scraping d'Instagram avec HashScraper pour faire du crawling facilement sans vous connecter.

Comments

Add Comment

Your email won't be published and will only be used for reply notifications.

Continuer la lecture

Get notified of new posts

We'll email you when 해시스크래퍼 기술 블로그 publishes new content.

Your email will only be used for new post notifications.