스크래핑 기술의 방식은 Protocol방식과 Browser방식의 2가지가 있습니다. 기술 구현 방식을 통해 비교했을 때 Protocol 방식이 월등히 뛰어나며, 핑거에서 제공하는 스크래핑 방식이 바로 Protocol 방식입니다.
구분 | Protocol 방식 | Browser 방식 | 평가 |
---|---|---|---|
Performance | 통신 프로토콜 상, 송/수신 데이터를 HTTP 통신 모듈을 통해 직접적으로 스크래핑 | 통신 프로토콜 상의 데이터 송/수신을 위해 브라우저를 기동하고 이후 브라우저가 디스플레이 하는 데이터를 스크래핑 | Protocol 우수 |
Resource 활용 | HTTP 통신 이외 별도의 Resource의 비용 없음. Browser 방식에 비해서 80% 이상의 Resource가 절약 | HTTP 통신 1건 당 Browser 하나씩 기동. Browser기동에 따른 Resource 소비가 크며 Multi-Processing시 더욱 소비가 커져서 문제가 됨 | Protocol 우수 |
Client 환경의 종속성 | Browser의 버전 및 Browser의 환경설정 등에 독립적이다. | Client에 설치된 Browser의 버전 및 Browser의 환경설정 등에 종속적이다. | Protocol 우수 |
유지보수의 편리성(분리성) | UI와 분리된 스크래핑 개발 및 유지보수로 Application의 변경이 없이 스크래핑 유지보수 가능 | UI 및 엔진과 통합된 스크래핑 방식으로 잦은 스크립트 유지보수 시에 Application의 변경을 병행해야 한다. | Protocol 우수 |