Cách lấy toàn bộ dữ liệu của một trang bloger, thủ thuật blogger
– Sỡ dĩ có thể lấy cắp toàn bộ dữ liệu của blog chính là do 1 tính năng mà blog cung cấp – RSS – ATOM.Bước 1. Xác định trang bloger mà bạn muốn lấy dữ liệu.
Ví dụ: cntt-news.blogspot.comNguồn cấp dữ liệu bài đăng sẽ là: http://cntt-news.blogspot.com/atom.xml.
Lưu ý: Một vài blogspot tạo Feed, Atom sử dụng công cụ của bên thứ 3
Bước 2. Xác định tổng số lượng bài viết của blog mà bạn muốn lấy.
– bạn copy toàn bộ đoạn javascript dưới đây:Lưu ý: Thay địa chỉ blog http://cntt-news.blogspot.com bằng địa chỉ của trang mà bạn muốn lấy.
1 2 3 4 5 6 | function showpostcount(json) { document.write(' + '');} |
– sau đó vào ĐÂY và dán toàn bộ đoạn javascript mà bạn đã copy ở trên rồi ấn submit bạn sẽ nhận được tổng số bài viết của bloger đó.
Bước 3. Tiến hành lấy toàn bộ dữ liệu về máy tính
– bạn copy đoạn code sau.– Thay http://cntt-news.blogspot.com bằng bloger của nạn nhân.http://cntt-news.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y
– X: Bài bắt đầu lấy, tính từ bài viết mới nhất, bài mới nhất là 1.
– Y: Tổng số bài sẽ lấy tính từ X.
VD: http://cntt-news.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=300.
– sau khi xác định được số lượng bài viết muốn lấy, ta cố 2 cách để lấy bài viết.( nên chia nhỏ số lượng file muốn lấy mỗi file khoảng 200 bài)
Cách 1: Sử dụng trình duyệt.
– pase đường dẫn vừa lấy ở trên dán vào thanh địa chỉ của trình duyệt.
– sau đó chọn lưu thành để tải về máy.
Cách 2: Sử dụng trình Internet Download Manager (IDM)
— Mở trình duyệt IDM, vào Task trên thanh menu, chọn “Add new download”.
– Một hộp thoại hiện ra, Paste đoạn bên trên vào thanh Address rồi chọn download là được.
– như vậy là các bạn đã lấy thành công.
Bước 4. Nhập dữ liệu vào blogger.
– Truy cập vào trang quản trị blog của bạn, vào Cài đặt/ Khác, chọn “Nhập blog”– Lần lượt chọn các tập tin atom mà bạn đã tải về, nhớ nhập mã Capcha nha.
Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.