티스토리 뷰

누구나 할 수 있는 쉬운 엑셀 크롤링입니다.

 

[결과 파일]

01_롯데시네마영화랭킹.xlsx
0.02MB

 

https://youtu.be/6EN92868e40

 

 

엑셀 파워쿼리(Power Query)를 활용하여 웹페이지에서 HTML Table 형식의 데이터를 수집하고 엑셀로 불러와 정리하는 방법을 설명하겠습니다. 자세한 내용은 유튜브 동영상과 위키독스 교재(https://wikidocs.net/162983)를 참고해주세요.

  1. 데이터 수집 과정: 롯데시네마 영화랭킹 페이지의 URL을 엑셀 파워쿼리에 입력해 웹과 연결하여 데이터를 가져옵니다.
  2. 데이터 변환: 데이터를 단순히 로드하는 대신 '데이터 변환'을 통해 필요한 수정 작업을 거칩니다. 예를 들어, 순위를 추가하고 사용하지 않는 열을 제거한 후 열의 이름을 영화제목, 상영시간, 순위로 수정합니다.
  3. 데이터 정리 및 시각화: 순위를 포함한 데이터를 정리하고 조건부 서식을 사용해 변동폭에 대한 시각적 표현을 추가합니다.
  4. 결과 확인: 엑셀에서 데이터를 잘 불러왔는지 확인하고, 새로 고침 기능을 통해 최신 데이터를 쉽게 업데이트할 수 있습니다.

다음에는 구글알리미(Google Alerts)를 활용하여 실시간 뉴스를 수집하는 내용을 같이 실습하겠습니다. 감사합니다.