나도코딩 4

파이썬 셀레니움 (Selenium) headless

파이썬 셀레니움 (Selenium) headless 2021/01/02 - [개발자/파이썬] - 파이썬 Selenium (셀레니움) 스크롤(Scroll) 2021/01/01 - [개발자/파이썬] - 파이썬 (Selenium) 로딩까지 기다림 (feat. WebDriverWait) 2020/12/31 - [개발자/파이썬] - 파이썬 (Python) Selenium (기본, 네이버 로그인) 2020/12/30 - [개발자/파이썬] - 파이썬 웹스크래핑(web scraping)_2 2020/12/30 - [개발자/파이썬] - 파이썬 웹스크래핑(web scraping) 저번 글에서부터 웹 스크래핑을 할 때, 매번 브라우저를 띄우고 웹 스크래핑을 진행했는데 사실 이런 경우, 메모리도 더 잡아먹고, 속도도 좀 더 ..

개발자/파이썬 2021.01.03

파이썬 (Selenium) 로딩까지 기다림 (feat. WebDriverWait)

파이썬 셀레니움 로딩까지 기다림 Waits Selenium (feat. WebDriverWait) 2020/12/31 - [개발자/파이썬] - 파이썬 (Python) Selenium (기본, 네이버 로그인) 저번 글에서 Selenium의 사용방법에 대해서 글을 썼었다. 이번에는 웹 스크래핑을 하다보면 필요한 도구(?) 몇 가지에 대해 글을 써보려고 한다. WebDriverWait를 이용한 Explicit Waits 우리가 웹 스크래핑을 하다보면, 로딩시간이 있다. 즉, 어떤 페이지가 완전히 Load되기까지 일정 시간을 기다려야한다. ex) 비행기항공권(네이버 or 스카이스캐너 등등) (아래의 그림처럼) 완전히 페이지가 Load되고 나서 어떤 정보들을 긁어 올 수 있는데, 이때 사용되는 것이 Webdriv..

개발자/파이썬 2021.01.01

파이썬 웹스크래핑(web scraping)_2

저번 편에선 requests, re, beautifulsoup 모듈들을 각각 어떻게 사용할 수 있는지 알아봤다. 이번엔 그 모듈들을 활용한 예제들을 한번 살펴보려고 한다. (feat. 나도코딩 채널: www.youtube.com/watch?v=yQ20jZwDjTE) 첫 번째 예제는 쿠팡에서 상품의 정보를 가져오는 것이다. import requests from bs4 import BeautifulSoup import re headers = {"User-Agent":"각자의 Useragent"} url = "https://www.coupang.com/np/search?q=%EB%85%B8%ED%8A%B8%EB%B6%81&channel=user&component=&eventCategory=SRP&trcid=&..

개발자/파이썬 2020.12.30

파이썬 웹스크래핑(web scraping)

파이썬 웹스크래핑(web scraping) 내가 정말 좋아하는 코딩유튜버 중에 한 분이신 "나도코딩"님이 좋은 영상을 올려주셔서 이를 보고 공부하고 응용하는 연습도 하고 있다. (나도코딩님 영상: www.youtube.com/watch?v=yQ20jZwDjTE&t=9077s) 주제는 파이썬을 이용한 웹 스크래핑이다. 지금 잘 정리해두고 나중에 까먹게 되면 이 글 보면서, 다시 써먹어야지~~ 먼저 용어부터 좀 다뤄보자. 아래의 세 단어는 꽤나 혼용된다. 내 친구들 중에서도 그냥 웹에서 정보를 긁어오는걸 통째로 웹 크롤링이라고 부르는 친구도 있었고 사람들마다 부르는 용어가 조금씩 다르다는 걸 느꼈다. 엄밀히 말하면 조금 다르니까, 최대한 명확히 나눠보자. ※ 웹 크롤링(web crawing) vs 웹 스크래..

개발자/파이썬 2020.12.30