¿El infierno de la recopilación de datos, Instagram? ¡Supéralo con estos 3 métodos!

Introducción a cómo recopilar datos de Instagram, ventajas y desventajas, uso de API oficial, páginas web y API privada.

4
¿El infierno de la recopilación de datos, Instagram? ¡Supéralo con estos 3 métodos!

0. Tres formas de hacer crawling en Instagram

Hay varias formas de hacer crawling en Instagram.

Los códigos para los siguientes casos están escritos en Ruby.

1. Método utilizando API pública

Obtención de token de acceso

Debe crear una cuenta de desarrollador, registrar una aplicación, obtener autenticación y recibir un token de acceso.

require 'net/http'
require 'json'

access_token = '발급받은 액세스 토큰'
url = URI("https://graph.instagram.com/me?fields=id,username,followers_count&access_token=#{access_token}")

response = Net::HTTP.get(url)
data = JSON.parse(response)

follower_count = data['followers_count']
puts "팔로워 수: #{follower_count}"

Pros y contras

Pros:
- No hay riesgo de ser bloqueado ya que es una API oficial.

Contras:
- Requiere una cuenta de desarrollador y un token de acceso.
- Hay restricciones en la cantidad de solicitudes y la velocidad.
- Por motivos de privacidad, solo se puede obtener el número de seguidores propios y no el de otros usuarios.

2. Método utilizando páginas web

require 'nokogiri'
require 'selenium-webdriver'

driver = Selenium::WebDriver.for :chrome

url = "https://www.instagram.com/suuu_yeony/"
driver.get(url)

doc = Nokogiri::HTML(driver.page_source)
follower_count = doc.at('button:contains("팔로워")').text
puts "#{follower_count}"

Pros y contras

Pros:
- Puede obtener el número de seguidores de otros usuarios.

Contras:
- Puede ser bloqueado por IP o ID si es detectado.
- La estabilidad puede verse afectada debido a las características de Selenium.

3. Método utilizando API privada

Es un método que utiliza el análisis de datos devueltos en formato JSON.

Pros y contras

Pros:
- Puede obtener el número de seguidores de otros usuarios.
- Buena estabilidad.

Contras:
- Puede ser bloqueado por IP o ID si es detectado.

4. Conclusión

Además de los métodos mencionados anteriormente, existen varias formas de hacer crawling y se pueden utilizar según el propósito.

Instagram tiene limitaciones, como solo poder obtener datos de una página si no se ha iniciado sesión.

Le recomendamos experimentar con la recopilación de Instagram a través de HashScraper sin necesidad de iniciar sesión para hacer crawling fácilmente.

Comments

Add Comment

Your email won't be published and will only be used for reply notifications.

Sigue leyendo

Get notified of new posts

We'll email you when 해시스크래퍼 기술 블로그 publishes new content.

Your email will only be used for new post notifications.