0. Tres formas de hacer crawling en Instagram
Hay varias formas de hacer crawling en Instagram.
Los códigos para los siguientes casos están escritos en Ruby.
1. Método utilizando API pública
Obtención de token de acceso
Debe crear una cuenta de desarrollador, registrar una aplicación, obtener autenticación y recibir un token de acceso.
require 'net/http'
require 'json'
access_token = '발급받은 액세스 토큰'
url = URI("https://graph.instagram.com/me?fields=id,username,followers_count&access_token=#{access_token}")
response = Net::HTTP.get(url)
data = JSON.parse(response)
follower_count = data['followers_count']
puts "팔로워 수: #{follower_count}"
Pros y contras
Pros:
- No hay riesgo de ser bloqueado ya que es una API oficial.
Contras:
- Requiere una cuenta de desarrollador y un token de acceso.
- Hay restricciones en la cantidad de solicitudes y la velocidad.
- Por motivos de privacidad, solo se puede obtener el número de seguidores propios y no el de otros usuarios.
2. Método utilizando páginas web
require 'nokogiri'
require 'selenium-webdriver'
driver = Selenium::WebDriver.for :chrome
url = "https://www.instagram.com/suuu_yeony/"
driver.get(url)
doc = Nokogiri::HTML(driver.page_source)
follower_count = doc.at('button:contains("팔로워")').text
puts "#{follower_count}"
Pros y contras
Pros:
- Puede obtener el número de seguidores de otros usuarios.
Contras:
- Puede ser bloqueado por IP o ID si es detectado.
- La estabilidad puede verse afectada debido a las características de Selenium.
3. Método utilizando API privada
Es un método que utiliza el análisis de datos devueltos en formato JSON.
Pros y contras
Pros:
- Puede obtener el número de seguidores de otros usuarios.
- Buena estabilidad.
Contras:
- Puede ser bloqueado por IP o ID si es detectado.
4. Conclusión
Además de los métodos mencionados anteriormente, existen varias formas de hacer crawling y se pueden utilizar según el propósito.
Instagram tiene limitaciones, como solo poder obtener datos de una página si no se ha iniciado sesión.
Le recomendamos experimentar con la recopilación de Instagram a través de HashScraper sin necesidad de iniciar sesión para hacer crawling fácilmente.




