해시스크래퍼 기술 블로그

파이썬으로 캠퍼스픽 공모전 및 대외활동 크롤러 만들기 - 공모전 & 대외활동 자동 크롤링 프로젝트 : 1편

파이썬으로 캠퍼스픽 공모전 및 대외활동 크롤러 만들기 - 공모전 & 대외활동 자동 크롤링 프로젝트 : 1편

0. 개요 해시스크래퍼 개발노트를 읽으시는 분들 중 공모전이나/대외활동 등을 알아보는 취준생, 대학생 여러분들이 많을 것으로 예상되어, 보다 실용적인 크롤링 기술을 전해드리기 위해서 파이썬으로 공모전/대외활동 사이트인 캠퍼스픽 (https://www.campuspick.com/) 크롤러를 만들어 보도록 하겠습니다. 프로젝트는 3개의 시리즈로 나뉘어 작...

더 읽기 →
코드 품질 2배로 올리는 10가지 원칙 | 코딩 최적화 방법

코드 품질 2배로 올리는 10가지 원칙 | 코딩 최적화 방법

0. 개요 우리가 코드를 작성할 때 따라야 하는 몇 가지 기본적인 원칙들이 존재합니다. 물론 무조건 따라야만 한다는 것은 아니지만, 위 원칙을 지켜 코드를 작성할 시 여러가지 이점이 존재합니다. 이러한 원칙들은 코드를 더 읽기 쉽고 유지 보수하기 쉽게 만들어줍니다. 아래에는 몇 가지 중요한 코드 작성 원칙을 소개하겠습니다. 1. 약자로 기억하는 개발 ...

더 읽기 →
우리동네 맛집 데이터 워드클라우드 만들기 실습 - 해시스크래퍼

우리동네 맛집 데이터 워드클라우드 만들기 실습 - 해시스크래퍼

1. 데이터 시각화와 크롤링 1.1. 데이터 시각화란? 데이터 시각화는 복잡한 데이터나 패턴을 직관적으로 표현하여 이해하기 쉽게 만드는 과정입니다. 그림, 차트, 그래프 등 다양한 형태로 정보를 표현할 수 있으며, 효과적인 시각화는 데이터에 숨겨진 통찰력을 발견하는 데 큰 도움이 됩니다. 1.2. 파이썬 데이터 시각화 라이브러리 종류 1.2.1. Ma...

더 읽기 →
어플리케이션 데이터 크롤링의 세 가지 비법: 리버스 엔지니어링, OCR, 패킷 스니핑

어플리케이션 데이터 크롤링의 세 가지 비법: 리버스 엔지니어링, OCR, 패킷 스니핑

1. 리버스 엔지니어링 (Reverse Engineering) 리버스 엔지니어링은 앱의 바이너리 코드(Binary Code)를 디컴파일(Decompile)하여 원래의 소스 코드나 그에 가까운 형태를 복원하는 과정입니다. Android의 APK 파일이나 iOS의 IPA 파일은 각각 디컴파일을 통해 분석할 수 있습니다. 이 방법은 주로 앱의 내부 로직을 ...

더 읽기 →
앞서가는 패션 기업의 데이터 활용 전략 및 팁

앞서가는 패션 기업의 데이터 활용 전략 및 팁

0. 패션 MD, 디자이너, 마케터를 위한 코딩 없이 데이터를 수집하고 활용하는 방법 최근 패션 업계도 디지털화를 빠르게 추진하고 있습니다. 온라인 커머스가 크게 성장하면서 상품, 가격, 리뷰 정보 등 다양한 데이터들이 발생하고 있고, 이 데이터들은 패션 업계의 여러 직무에 인사이트를 제공할 수 있습니다. 이번 게시물에서는 MD, 디자이너, 마케터들이...

더 읽기 →
FastAPI, rembg, extcolors를 활용한 사진 배경 제거 및 색상 추출 API 만들기

FastAPI, rembg, extcolors를 활용한 사진 배경 제거 및 색상 추출 API 만들기

0. 들어가며 디지털 이미지 처리에 관심이 있거나 실제 프로젝트에서 이미지 처리를 해야 하는 개발자들을 위한 포스팅을 준비했습니다. 사진에서 배경을 제거하거나 주요 색상을 추출하는 것은 디지털 아트, 웹 개발, 모바일 앱, 머신러닝 프로젝트 등 다양한 분야에서 활용됩니다. 이러한 작업을 수행하려면 복잡한 알고리즘이나 높은 수준의 기술이 필요할 것 같지...

더 읽기 →
XPath 심화 내용 이해하기: 와일드카드, 노드, 함수

XPath 심화 내용 이해하기: 와일드카드, 노드, 함수

0. 개요 XPath 1편에서는 웹크롤링에 있어 필수적인 XPath의 개념과 기본 문법에 대해 다뤄봤었는데요, 2편에서는 XPath의 심화 내용에 대해서 알려드리겠습니다. 1. 와일드카드에 대한 이해 심화 내용으로 들어가기 전, XPath에서 '*(와일드카드)'가 가지는 의미에 대해서 필수적인 이해가 필요합니다. (와일드카드)는 XPath에서 어떠한 ...

더 읽기 →
XPath 알아보기: 웹 크롤링의 기본

XPath 알아보기: 웹 크롤링의 기본

0. XPath란? XPath는 'XML Path Language'의 줄임말로, XML 문서의 특정 요소 또는 속성에 접근하기 위한 경로를 지정하는 언어입니다. XPath는 주로 웹 크롤링 작업에서 사용되는데, 우선 XPath의 기본 문법에 대해 알아보겠습니다. 1. Xpath의 기본 문법 <!DOCTYPE html> &amp...

더 읽기 →
마이크로소프트 Playwright를 사용한 웹 브라우저 자동화

마이크로소프트 Playwright를 사용한 웹 브라우저 자동화

0. Playwright란? Playwright는 마이크로소프트에서 개발한 오픈 소스 라이브러리로, 웹 브라우저를 자동화하기 위한 것입니다. 본래 웹 스크래핑을 위해 설계된 것은 아니지만, 브라우저와 설정을 적절히 조합하면 이 영역에서 탁월한 성능을 발휘합니다. Node.js와 Python 등 여러 언어에서 사용할 수 있으며, 현재 Chrome, Fi...

더 읽기 →

새 글 알림 받기

해시스크래퍼 기술 블로그의 새 글이 발행되면 이메일로 알려드립니다.

이메일은 새 글 알림에만 사용됩니다.