0. Drei Möglichkeiten, um Instagram zu crawlen
Es gibt verschiedene Möglichkeiten, um Instagram zu crawlen.
Die folgenden Beispiele sind in Ruby geschrieben.
1. Verwendung der öffentlichen API
Zugriffstoken erhalten
Sie müssen ein Entwicklerkonto erstellen, Ihre App registrieren, sich authentifizieren und ein Zugriffstoken erhalten.
require 'net/http'
require 'json'
access_token = '발급받은 액세스 토큰'
url = URI("https://graph.instagram.com/me?fields=id,username,followers_count&access_token=#{access_token}")
response = Net::HTTP.get(url)
data = JSON.parse(response)
follower_count = data['followers_count']
puts "팔로워 수: #{follower_count}"
Vor- und Nachteile
Vorteile:
- Es handelt sich um eine offizielle API, daher besteht keine Sperrgefahr.
Nachteile:
- Sie benötigen ein Entwicklerkonto und ein Zugriffstoken.
- Es gibt Beschränkungen hinsichtlich Anfragen und Geschwindigkeit.
- Aus Datenschutzgründen können Sie nur Ihre Follower-Anzahl abrufen, nicht die Anzahl der Follower anderer Benutzer.
2. Verwendung von Webseiten
require 'nokogiri'
require 'selenium-webdriver'
driver = Selenium::WebDriver.for :chrome
url = "https://www.instagram.com/suuu_yeony/"
driver.get(url)
doc = Nokogiri::HTML(driver.page_source)
follower_count = doc.at('button:contains("팔로워")').text
puts "#{follower_count}"
Vor- und Nachteile
Vorteile:
- Sie können auch die Anzahl der Follower anderer Benutzer abrufen.
Nachteile:
- Bei Erkennung können Sie eine IP- oder Kontosperrung erhalten.
- Aufgrund der Natur von Selenium kann die Stabilität beeinträchtigt sein.
3. Verwendung der privaten API
Dies ist eine Methode, bei der die Parsing von Daten im JSON-Format genutzt wird.
Vor- und Nachteile
Vorteile:
- Sie können auch die Anzahl der Follower anderer Benutzer abrufen.
- Hohe Stabilität
Nachteile:
- Bei Erkennung können Sie eine IP- oder Kontosperrung erhalten.
4. Fazit
Es gibt viele verschiedene Möglichkeiten, um zu crawlen, die über die oben genannten Methoden hinausgehen, und sie können je nach Zweck verwendet werden.
Instagram hat Einschränkungen wie die Möglichkeit, nur Daten einer Seite abzurufen, wenn Sie nicht angemeldet sind.
Probieren Sie das Instagram-Scraping mit HashScraper aus, um das Crawlen ohne Anmeldung einfach zu erleben.




