저장된 오프라인 웹페이지 HTML 또는 텍스트파일에서
특정 키워드를 검색해 일치하는 하이퍼링크 주소를 텍스트파일로 출력해줍니다.
스스로 필요해서 엑셀매크로도 찾아봤지만 신통치않아
우선 클로드3 Ai한테 요청해 원형틀을 얻어내고
나머진 근 1년만에 도로 파이썬컴맹된 실력을 웹검색 끌올해 30분만에 뚝딱했네요
지난 클리앙에 올린바있는 HTTrack로 대량 긁어올 때 궁합이 좋습니다!
(선 메인웹페이지 저장 - 매크로, 후 HTTrack 크롤링)
사용법 ---- URLtxtMiner.py 편집
FIND_KWD - 검색추출할 공통 URL 키워드
TARGET_FILE - 원본 html,txt파일
EXPORT_FILE - 추출된 파일
실행 (리눅스, 파이 터미널 : python3 URLtxtMiner.py)
* 다모앙보다 팁게 위치나 가독성도 좋은
오늘에 커뮤니티의 발전기원차 올려봅니다
* 6월 20일자 V2.0 업데이트 -
터미널 입력방식으로 바꿨습니다.
Python3 추출기.py 대상.html 출력.txt 키워드1 키워드2 ...
키워드는 AND로 모든 키워드가 일치해야 추출됩니다.
댓글목록
등록된 댓글이 없습니다.