달러💰 이렇게 비싸져도 되냐?! AWS를 탈출하고 비용절약하자!
AWS를 사용해오다 자체 서버로 전환한 과정과 이유를 공유합니다. 비용 절감, 보안 강화, 물리 서버 운영의 장점, 그리고 다단계 인증(MFA)을 적용한 방법을 소개합니다. B2B 서비스의 특성을 고려한 성공적인 서버 운영 전략을 확인해보세요.
웹 크롤링과 스크래핑의 기본적인 차이점을 알아보고, Ruby 언어를 사용하여 간단한 크롤링과 스크래핑 예제를 실습해보세요. Nokogiri와 open-uri 라이브러리를 활용한 효과적인 데이터 수집 방법을 배워보십시오.
nokogiri
와 open-uri
라이브러리를 사용하여 간단한 예제 코드 보여드리겠습니다.nokogiri
를 설치하세요. open-uri
는 별도로 설치할 필요가 없습니다.gem install nokogiri
require 'nokogiri' require 'open-uri' # 웹 페이지 URL url = 'http://example.com' # 해당 URL의 HTML을 열고 Nokogiri 객체로 파싱합니다. doc = Nokogiri::HTML(URI.open(url)) # 웹 페이지의 제목을 찾아 출력합니다. title = doc.css('title').text puts "Page Title: #{title}" # 웹 페이지 내의 모든 링크를 크롤링하여 출력합니다. doc.css('a').each do |link| puts "Link: #{link['href']} Text: #{link.text}" end
require 'nokogiri'
와 require 'open-uri'
를 통해 필요한 라이브러리를 불러옵니다.Nokogiri::HTML(URI.open(url))
을 사용하여 주어진 URL의 HTML 문서를 열고 Nokogiri 객체로 변환합니다.doc.css('title').text
로 <title>
태그의 텍스트를 추출하여 페이지의 제목을 얻습니다.doc.css('a')
를 사용하여 모든 <a>
태그 (링크)를 찾고, 각 링크의 href
속성과 텍스트를 출력합니다.nokogiri
와 open-uri
를 이용합니다.ruby코드 복사 require 'nokogiri' require 'open-uri' # 가상 웹 페이지의 URL url = 'https://example.com/news' # HTML 콘텐츠를 가져와 Nokogiri로 파싱합니다. doc = Nokogiri::HTML(URI.open(url)) # 최신 뉴스 헤드라인을 담고 있는 요소를 스크래핑합니다. # 가정: 최신 뉴스는 클래스가 'headline'인 div에 포함되어 있다. headlines = doc.css('div.headline') # 각 헤드라인 요소에서 텍스트를 추출하여 출력합니다. headlines.each do |headline| puts headline.text.strip end
require 'nokogiri'
와 require 'open-uri'
로 필요한 라이브러리를 불러옵니다.Nokogiri::HTML(URI.open(url))
로 주어진 URL의 HTML 문서를 열고 파싱합니다.doc.css('div.headline')
로 클래스가 headline
인 모든 <div>
요소를 선택합니다.