안녕하세요. 달소입니다.
오늘은 다소 신기한 오픈소스 툴인 아카이브박스를 소개해드리겠습니다.
인터넷 아카이브는 주로 박제용(?)으로 많이 쓰이는데요. 인터넷에 남아있는 기록들이 삭제가 되더라도보존할수있도록 하는것을 의미합니다.
아래 정통의 아카이브처럼 역사적인 사료들이 유실되지 않도록 하는 방법이 일반적이지만요.
인터넷에서 주로 아카이브란 단어가 쓰일때는 이렇게 웹사이트의 상태를 스냅샷 떠서 박제시키는걸 의미합니다.
이렇게 박제나 pdf가 되버리면 삭제하더라고 기록이 남기때문에 주로 고소에 많이쓰이기도 하죠 ㅎㅎ,,
아카이브 박스를 이용하면 이러한 자료들이 유실되지않고 내 서버에 직접 저장되기때문에
자료를 모으시는분들께는 꽤나 훌륭한 툴입니다.
ArchiveBox란?
ArchiveBox는 오프라인으로 보존하려는 사이트를 수집, 저장 및 볼 수 있는 강력한 자체 호스팅 인터넷 보관 솔루션입니다.
리눅스나 도커를 이용해서 손쉽게 구축할 수 있기때문에 아래 가이드를 통해서 쉽게 구축이 가능합니다.
또한 여러 API를 제공하기때문에 봇을이용한 자동 아카이브 등록이나 기타 응용방법도 존재합니다.
https://github.com/ArchiveBox/ArchiveBoxGitHub – ArchiveBox/ArchiveBox: 🗃 Open source self-hosted web archiving. Takes URLs/browser history/bookmarks/Pocket/Pinboard/etc., saves HTML, JS, PDFs, media, and more…🗃 Open source self-hosted web archiving. Takes URLs/browser history/bookmarks/Pocket/Pinboard/etc., s…GitHub
아래처럼 web ui를 사용해서 아카이브를 뜰수도있습니다.
저는 도커를 통해구축해볼텐데 오늘은,, 간단한 소개만 하고 내일 작성 후 업데이트 하겠습니다.[Reference] : 달소, 「서버포럼 – 아카이브를 내 서버에? ArchiveBox」 https://svrforum.com/?document_srl=55674&mid=svr&act=dispBoardContent.