본문 바로가기

지식/정보/강좌

웹페이지나 텍스트에서 URL을 추출 저장하는 간단 파이썬매크로

페이지 정보

댓글 0건 조회 442회 작성일 2024-04-22 23:34:11

본문

저장된 오프라인 웹페이지 HTML 또는 텍스트파일에서

특정 키워드를 검색해 일치하는 하이퍼링크 주소를 텍스트파일로 출력해줍니다.

 

스스로 필요해서 엑셀매크로도 찾아봤지만 신통치않아

우선 클로드3 Ai한테 요청해 원형틀을 얻어내고

나머진 근 1년만에 도로 파이썬컴맹된 실력을 웹검색 끌올해 30분만에 뚝딱했네요

 

 

 

지난 클리앙에 올린바있는 HTTrack로 대량 긁어올 때 궁합이 좋습니다!

(선 메인웹페이지 저장 - 매크로, 후 HTTrack 크롤링)

 

사용법 ---- URLtxtMiner.py 편집

FIND_KWD - 검색추출할 공통 URL 키워드

TARGET_FILE - 원본 html,txt파일

EXPORT_FILE - 추출된 파일

 

실행 (리눅스, 파이 터미널 : python3 URLtxtMiner.py)

 

 

* 다모앙보다 팁게 위치나 가독성도 좋은

오늘에 커뮤니티의 발전기원차 올려봅니다

 

* 6월 20일자 V2.0 업데이트 -

터미널 입력방식으로 바꿨습니다.

Python3 추출기.py 대상.html 출력.txt 키워드1 키워드2 ...

키워드는 AND로 모든 키워드가 일치해야 추출됩니다.

 

 

 

 

 

 

댓글목록

등록된 댓글이 없습니다.

회원로그인

로그인 회원가입

Copyright © onnul.com. All rights reserved.