Phục hồi một trang web bị mất không có bản sao lưu?


262

Thật không may, nhà cung cấp dịch vụ lưu trữ của chúng tôi bị mất dữ liệu 100%, vì vậy tôi đã mất tất cả nội dung cho hai trang web blog được lưu trữ:

(Vâng, vâng, tôi hoàn toàn nên đã làm hoàn chỉnh sao lưu ngoại vi Thật không may, tất cả các bản sao lưu của tôi là trên máy chủ riêng của mình Vì vậy, tiết kiệm các bài giảng;.. Bạn 100% hoàn toàn đúng, nhưng điều đó không giúp tôi vào lúc này Hãy. tập trung vào câu hỏi ở đây!)

Tôi đang bắt đầu quá trình chậm chạp, đau đớn để khôi phục trang web từ bộ đệm trình thu thập dữ liệu web.

Có một số công cụ tự động để khôi phục trang web từ bộ đệm web internet (Yahoo, Bing, Google, v.v.), như Warrick , nhưng tôi đã có một số kết quả xấu khi sử dụng:

  • Địa chỉ IP của tôi nhanh chóng bị Google cấm sử dụng
  • Tôi nhận được rất nhiều lỗi 500 và 503 và "chờ 5 phút"
  • Cuối cùng, tôi có thể khôi phục nội dung văn bản nhanh hơn bằng tay

Tôi đã có nhiều may mắn hơn bằng cách sử dụng danh sách tất cả các bài đăng trên blog, nhấp qua bộ đệm Google và lưu từng tệp riêng lẻ dưới dạng HTML. Mặc dù có rất nhiều bài đăng trên blog, nhưng không nhiều bài viết, và tôi cho rằng tôi xứng đáng được tự đánh dấu vì không có chiến lược sao lưu tốt hơn. Dù sao, điều quan trọng là tôi đã may mắn có được văn bản bài đăng trên blog theo cách này và tôi chắc chắn có thể lấy văn bản của các trang web ra khỏi bộ đệm Internet. Dựa trên những gì tôi đã làm cho đến nay, tôi tự tin rằng tôi có thể khôi phục tất cả các văn bản và bình luận bài viết trên blog bị mất .

Tuy nhiên, những hình ảnh đi kèm với mỗi bài đăng trên blog đang chứng tỏ khó khăn hơn.

Bất kỳ mẹo chung nào để khôi phục các trang web từ bộ nhớ cache trên Internet và đặc biệt là các địa điểm để khôi phục hình ảnh lưu trữ từ các trang web ?

(Và, một lần nữa, xin vui lòng, không có bài giảng dự phòng. Bạn hoàn toàn, hoàn toàn, hoàn toàn đúng! Nhưng đúng là không giải quyết được vấn đề tức thời của tôi.


96
Khi ai đó như Jeff Atwood tự mình có thể mất hai trang web trong một cú trượt ... Chà. Tôi sẽ xem xét các thủ tục sao lưu của riêng mình, cho một: P

240
@Phoshi: Jeff có một số bài viết hay về Mã hóa kinh dị khi sao lưu. Bạn nên cho họ đọc nhanh.

34
joshhunt thắng một (1) internet. Ưu đãi này có thể không được kết hợp với các ưu đãi khác, trao đổi hoặc thay thế. Không có mưa.
Adam Davis

28
Độ dài mà một số người sẽ đi tới, để kiếm đại diện trên SU ...

26
Vui lòng không tham khảo những gì bạn đã làm là "bản sao lưu" - nếu các tệp đó nằm trên cùng một máy chủ, thì chúng không phải là "bản sao lưu".

Câu trả lời:


220

Đây là cú hích điên cuồng của tôi trong bóng tối: định cấu hình máy chủ web của bạn để trả lại 304 cho mỗi yêu cầu hình ảnh, sau đó lấy nguồn từ đám đông bằng cách đăng danh sách URL ở đâu đó và yêu cầu podcast cho tất cả người đọc của bạn tải từng URL và thu thập bất kỳ hình ảnh nào tải từ bộ nhớ cache cục bộ của họ. (Điều này chỉ có thể hoạt động sau khi bạn tự khôi phục các trang HTML, hoàn thành với các <img ...>thẻ mà câu hỏi của bạn dường như ngụ ý rằng bạn sẽ có thể làm được.)

Về cơ bản, đây là một cách nói thú vị, "lấy nó từ bộ đệm trình duyệt web của độc giả của bạn." Bạn có nhiều người đọc và người nghe podcast, vì vậy bạn có thể huy động hiệu quả một số lượng lớn những người có khả năng đã xem trang web của bạn gần đây. Nhưng việc tìm và trích xuất hình ảnh thủ công từ bộ nhớ cache của các trình duyệt web khác nhau rất khó khăn và toàn bộ cách tiếp cận hoạt động tốt nhất nếu nó đủ dễ để nhiều người sẽ thử nó và thành công. Do đó, cách tiếp cận 304. Tất cả những gì người đọc yêu cầu là họ nhấp vào một loạt các liên kết và kéo ra bất kỳ hình ảnh nào tải trong trình duyệt web của họ (hoặc nhấp chuột phải và lưu dưới dạng, v.v.) và sau đó gửi email cho bạn hoặc tải chúng lên vị trí trung tâm bạn thiết lập, hoặc bất cứ điều gì. Hạn chế chính của phương pháp này là bộ nhớ cache của trình duyệt web không quay ngược thời gian. Nhưng chỉ cần một độc giả tình cờ tải một bài đăng từ năm 2006 trong vài ngày qua để giải cứu ngay cả một hình ảnh rất cũ. Với một lượng khán giả đủ lớn, bất cứ điều gì cũng có thể.


52
+1 cho cách tiếp cận sáng tạo nhất. Thực sự có thể làm việc vì CH có một số độc giả.

16
thực hiện ở đây? diovo.com/2009/12/ móc
Jeff Atwood

3
Tôi nghĩ rằng bạn có thể thu thập dữ liệu các tệp tĩnh của mình cho các thẻ hình ảnh và sao chép tất cả các tệp đó vào một trang hình ảnh khổng lồ, thay vì để mọi người nhấp vào từng liên kết. Việc triển khai diovo.com trông rất ấn tượng, hy vọng nó hiệu quả với bạn.

2
WOW đó là một tên phù thủy độc ác Tôi <3
Ahmad Alfy 21/03/13

4
Trên thực tế, bạn sẽ có thể truy xuất hình ảnh bằng cách sử dụng canvasvà gửi chúng về nhà bằng AJAX.
Tomáš Zato

65

Một số người trong chúng tôi theo dõi bạn bằng trình đọc RSS và không xóa bộ nhớ cache. Tôi có các bài đăng trên blog xuất hiện từ năm 2006. Không có hình ảnh nào, từ những gì tôi có thể thấy, nhưng có thể tốt hơn những gì bạn đang làm bây giờ.


+1 chắc chắn. Google Reader thì không, nhưng tôi cá là một cái dựa trên máy tính để bàn sẽ.

2
Bạn cũng có thể yêu cầu mọi người kiểm tra bộ nhớ cache của trình duyệt. Những người xem phong cách retro Mã hóa có thể có một số hình ảnh được lưu trong bộ nhớ cache.

Tôi đã có các bài đăng trên blog từ năm 2005 trong GReader, nhưng thật không may, họ không có hình ảnh và họ sẽ không cho phép tôi xuất chúng dưới dạng một loạt các trang ... Tôi có thể gửi email cho bạn cho bạn, Jeff. ..
Glen Solsberry

Vâng, có một ngụ ý "Tôi sẽ gửi cho bạn những gì tôi có nếu bạn yêu cầu." trong câu trả lời của tôi là tốt.

3
Quá nhiều người đọc RSS cho rằng hình ảnh sẽ không bao giờ chết. Tôi biết tôi không :(

62

(1) Trích xuất danh sách tên tệp của tất cả các hình ảnh bị thiếu từ bản sao lưu HTML. Bạn sẽ bị bỏ lại với một cái gì đó như:

  • stay-puft-marshmallow-man.jpg
  • internet-property-đàm.png
  • yahoo-trang chủ-small.png
  • mật khẩu-show-anim.gif
  • tivo2.jpg
  • michael-abrash-đồ họa-chương trình

(2) Thực hiện Tìm kiếm hình ảnh của Google cho các tên tệp đó. Có vẻ như NHIỀU người trong số họ đã, ừm, "nhân đôi" bởi các blogger khác và đã sẵn sàng để tham gia vì họ có cùng tên tệp .

(3) Bạn có thể thực hiện việc này theo cách tự động nếu nó chứng tỏ thành công cho hơn 10 hình ảnh.


Sẽ rất mỉa mai nếu anh ta thực sự có được bất kỳ hình ảnh nào như thế này.
Hashim

51

Bằng cách vào Google Image tìm kiếm và nhập, site:codinghorror.combạn ít nhất có thể tìm thấy các phiên bản thu nhỏ của tất cả các hình ảnh của bạn. Không, nó không nhất thiết phải giúp đỡ, nhưng nó mang lại cho bạn một điểm khởi đầu để lấy ra hàng ngàn hình ảnh đó.

Hình ảnh mã hóa

Có vẻ như Google lưu trữ hình thu nhỏ lớn hơn trong một số trường hợp:

Google so với Bing

Google ở ​​bên trái, Bing ở bên phải.


2
vâng, trường hợp xấu nhất, chúng tôi sẽ phải mở rộng hình thu nhỏ từ Google. Tôi nghe thấy Bing lưu trữ hình thu nhỏ lớn hơn, mặc dù?
Jeff Atwood

Tôi không biết; Tôi không phải là một loại người bing. Tôi thậm chí không biết họ có tìm kiếm hình ảnh như Google không. Tôi sẽ tìm hiểu và cập nhật bài viết.
George Stocker

18
Tôi không biết nếu đây là bạn. Nhưng Imageshack dường như có nhiều hình ảnh blog của bạn. profile.imageshack.us/user/codinghorror
Nick Berardi

Họ dường như có những gì trông giống như hình ảnh 456 có kích thước đầy đủ. Đây có thể là đặt cược tốt nhất để phục hồi tất cả mọi thứ. Có lẽ họ thậm chí có thể cung cấp cho bạn một bãi rác.
Nick Berardi

28
Sử dụng hình thu nhỏ của Google khi bắt đầu, sau đó sử dụng tineye.com để xem có ai đang lưu trữ một bản sao không.
sep32

40

Xin lỗi khi nghe về các blog. Không đi giảng. Nhưng tôi đã tìm thấy những gì dường như là hình ảnh của bạn trên Imageshack. Họ thực sự là của bạn hay có ai đó đang giữ một bản sao của họ xung quanh.

http://profile.imageshack.us/user/codingh khiếp

Họ dường như có những gì trông giống như hình ảnh 456 có kích thước đầy đủ. Đây có thể là đặt cược tốt nhất để phục hồi tất cả mọi thứ. Có lẽ họ thậm chí có thể cung cấp cho bạn một bãi rác.


37

Jeff, tôi đã viết một cái gì đó cho bạn ở đây

Tóm lại những gì tôi đề nghị bạn làm là:

  1. Cấu hình máy chủ web để trả về 304 cho mỗi yêu cầu hình ảnh. 304 có nghĩa là tệp không được sửa đổi và điều này có nghĩa là trình duyệt sẽ tìm nạp tệp từ bộ đệm của nó nếu nó có mặt ở đó. (tín dụng: câu trả lời SuperUser này )

  2. Trong mỗi trang trong trang web, thêm một tập lệnh nhỏ để thu thập dữ liệu hình ảnh và gửi nó đến máy chủ.

  3. Lưu dữ liệu hình ảnh trong máy chủ.

  4. Voila!

Bạn có thể lấy các tập lệnh từ liên kết đã cho.


Câu trả lời của Super User không được liên kết.
Nathaniel

@Nathaniel: CỐ ĐỊNH
alexanderpas

28

Hãy thử truy vấn này trên Wayback Machine :

http://web.archive.org/web/*sa_V_im_/http://codinghorror.com/*

Điều này sẽ giúp bạn có được tất cả các hình ảnh từ mã hóa kinh dị được lưu trữ bởi archive.org. Điều này trả về 3878 hình ảnh, một số trong đó là trùng lặp. Nó sẽ không hoàn thành, nhưng một khởi đầu tốt không kém.

Đối với các hình ảnh còn lại, bạn có thể sử dụng các hình thu nhỏ từ bộ đệm của công cụ tìm kiếm và sau đó thực hiện tra cứu ngược lại bằng cách sử dụng các hình ảnh này tại http://www.tineye.com/ . Bạn cung cấp cho nó hình ảnh thu nhỏ, và nó sẽ cung cấp cho bạn bản xem trước và con trỏ để kết hợp chặt chẽ với hình ảnh được tìm thấy trên web.


1
trả về 404 ngay bây giờ?
rogerdpack

Tôi đã tạo một công cụ để tự động nhận bản sao lưu từ Wayback Machine: github.com/hartator/wayback-machine-doader
Hartator 15/08/2015

26

+1 trên ddđề xuất nếu (1) đĩa thô có sẵn ở đâu đó; và (2) các hình ảnh là các tập tin đơn giản. Sau đó, bạn có thể sử dụng công cụ 'khắc dữ liệu' pháp y để (ví dụ) kéo ra tất cả các phạm vi đáng tin cậy có vẻ là JPG / PNG / GIF. Tôi đã phục hồi 95% + ảnh trên iPhone bị xóa theo cách này.

Các công cụ nguồn mở 'tiên phong' và 'kế thừa' của nó có thể được sử dụng cho việc này:

http://foremost.sourceforge.net/

http://www.digitalforensicssolutions.com/Scalpel/


2
Photorec cũng có thể được sử dụng khi bạn nhận được hình ảnh dd.

Trước hết có sẵn thông qua yum trên Fedora

26

May mắn, thế hệ tương lai sẽ ổn.

Ngay cả khi chỉ có một số tảng đá lớn này, các nhà khoa học / nhà ngôn ngữ học đã tìm ra rất nhiều.

đá Rosetta

Nếu một vài bức ảnh bị mất, hãy để nó cho ai đó tìm ra trong một vài nghìn năm.

Hy vọng rằng, bạn sẽ cười một chút. :)


5
Ok, bạn đã có một tiếng cười khúc khích từ tôi ít nhất ;-)

21

Bạn luôn có thể thử archive.org. Sử dụng máy wayback. Tôi đã sử dụng điều này để khôi phục hình ảnh từ các trang web của tôi.


3
Dường như không có nhiều bộ nhớ cache cho CodingHorror. Tôi thấy hình ảnh cho blog.stackoverflow mặc dù.

Tôi đã xây dựng lại một trang web bằng máy quay ngược internet một lần nhưng tôi đã thử một vài lần kể từ đó và nó thực sự không lưu trữ rất nhiều trang web ...
djangofan

Có vẻ như nó quay trở lại năm 2004 tại đây web.archive.org/web * / mã hóa kinh dị

Ơn trời, nó không có tập tin robot.txt hả? :)
Synetech

14

Vì vậy, trường hợp xấu nhất tuyệt đối, bạn không thể phục hồi một điều. Chỉ trích.

Hãy thử lấy các google đã rút gọn và đưa chúng qua TinEye , công cụ tìm kiếm hình ảnh ngược. Hy vọng rằng nó sẽ lấy bất kỳ bản sao hoặc cải tạo mọi người đã thực hiện.


14

Đó là một cú sút xa, nhưng bạn có thể cân nhắc:

  • Đăng danh sách chính xác của hình ảnh bạn đang thiếu
  • tìm nguồn cung ứng đám đông trong quá trình truy xuất thông qua tất cả bộ đệm internet của độc giả.

Chẳng hạn, hãy xem Nirsoft Mozilla Cache Viewer :

văn bản thay thế
(nguồn: nirsoft.net )

Nó có thể nhanh chóng đào bất kỳ bức ảnh "blog.stackoverflow.com" nào mà người ta vẫn có thể có thông qua một dòng lệnh đơn giản:

MozillaCacheView.exe -folder "C:\Documents and Settings\Administrator\Local Settings\Application Data\Mozilla\Firefox\Profiles\acf2c3u2.default\Cache" 
/copycache "http://blog.stackoverflow.com" "image" /CopyFilesFolder "c:\temp\blogso" /UseWebSiteDirStructure 0

Lưu ý: họ có cùng trình thám hiểm bộ đệm cho Chrome .

văn bản thay thế
(nguồn: nirsoft.net )

(Tôi phải có 15 ngày hình ảnh blog.stackoverflow.com trong đó)

Internet Explorer , hay Opera .


Sau đó cập nhật danh sách công khai để phản ánh những gì độc giả báo cáo tìm thấy trong bộ đệm của họ.


12

Trước đây, tôi đã sử dụng http://www.archive.org/ để tải lên các hình ảnh được lưu trong bộ nhớ cache. Đó là loại hit hoặc miss nhưng nó đã làm việc cho tôi.
Ngoài ra, khi cố gắng khôi phục ảnh stock mà tôi đã sử dụng trên một trang web cũ, www.tineye.com thật tuyệt vời khi tôi chỉ có hình thu nhỏ và tôi cần hình ảnh kích thước đầy đủ.

Tôi hy vọng cái này sẽ giúp bạn. Chúc may mắn.


Tôi đã xem qua archive.org một vài phút trước để xem hình ảnh của trang webhh.com và một vài bài đăng tôi đã nhấp không có bất kỳ hiển thị nào.
George Stocker

Archive.org phát hành dữ liệu vài tháng sau khi lần đầu tiên lập chỉ mục chúng.
Christian

10

Đây có lẽ không phải là giải pháp dễ nhất hoặc đầy đủ nhất, nhưng các dịch vụ như Evernote thường lưu cả văn bản và hình ảnh khi chúng được lưu trữ trong ứng dụng - có thể một số độc giả hữu ích đã lưu bài viết của bạn có thể lưu hình ảnh và gửi lại cho bạn ?


10

Tôi đã có những trải nghiệm tuyệt vời với archive.org . Ngay cả khi bạn không thể trích xuất tất cả các bài đăng trên blog của mình từ trang web, chúng vẫn giữ các ảnh chụp nhanh định kỳ:

văn bản thay thế

Bằng cách này bạn có thể kiểm tra từng trang và xem các bài đăng blog bạn đã thực hiện. Với tên của tất cả các bài đăng, bạn có thể dễ dàng tìm thấy chúng trong bộ đệm của Google nếu archive.org không có nó. Lưu trữ cố gắng giữ hình ảnh, bộ nhớ cache của Google sẽ có hình ảnh và tôi đã xóa bộ nhớ cache của tôi gần đây để tôi có thể giúp bạn với các bài đăng blog gần đây hơn :)


Tôi đã cố gắng để có được một số dữ liệu từ trang web của một công ty tôi đã từng làm việc một thời gian trước đây. Nó là tốt cho văn bản, ít hơn cho hình ảnh. Nhưng YMMV
ChrisF

Tôi tin rằng bộ đệm web của Google không lưu trữ hình ảnh.
Nathaniel

8

Bạn đã thử bộ nhớ cache trình duyệt cục bộ của riêng bạn? Cơ hội khá tốt một số thứ gần đây vẫn còn đó. http://lifehacker.com/385883/resurrect-images-from-my-web-browser-cache

(Hoặc bạn có thể biên dịch danh sách tất cả các hình ảnh bị thiếu và mọi người có thể kiểm tra bộ nhớ cache của họ để xem liệu chúng tôi có thể điền vào chỗ trống không)


8

Một gợi ý cho tương lai: Tôi sử dụng Windows Live Writer để viết blog và nó lưu các bản sao bài đăng cục bộ trên máy của tôi, ngoài việc xuất bản chúng ra blog.


Thêm vào đó, sử dụng Windows Live Writer chỉ là lẽ thường.

7

Khoảng năm năm trước, một phiên bản đầu tiên của một ổ cứng gắn ngoài mà tôi đang lưu trữ tất cả các bức ảnh kỹ thuật số của mình đã thất bại nặng nề. Tôi đã tạo một hình ảnh của ổ cứng bằng cách sử dụng ddvà viết một công cụ thô sơ để khôi phục bất cứ thứ gì trông giống như một hình ảnh JPEG. Có hầu hết các bức ảnh của tôi trong số đó.

Vì vậy, câu hỏi là, bạn có thể lấy một bản sao của hình ảnh đĩa máy ảo chứa hình ảnh không?



7

Tôi đề nghị kết hợp archive.org và một ẩn danh yêu cầu như [Tor] [2]. Tôi khuyên bạn nên sử dụng ẩn danh vì theo cách đó, mỗi yêu cầu của bạn sẽ có một IP và vị trí ngẫu nhiên và theo cách đó bạn có thể tránh bị cấm bởi archive.org (như Google đã làm) với số lượng yêu cầu cao bất thường.

Chúc may mắn, có rất nhiều đá quý trong blog đó.


Cho rằng Jeff muốn quyên góp cho archive.org, vì vậy việc lạm dụng ẩn danh có thể không hoàn toàn không thể chấp nhận được. Nhưng tôi vẫn muốn cho bạn một cú đá cho điều đó. : - |

6

Máy wayback sẽ có một số. Google cache và bộ nhớ cache tương tự sẽ có một số.

Một trong những điều hiệu quả nhất bạn sẽ có thể làm là gửi email cho người đăng ban đầu, yêu cầu trợ giúp.

Tôi thực sự có một số khuyến nghị về cơ sở hạ tầng, vì sau khi tất cả điều này được làm sạch. Vấn đề cơ bản không thực sự là sao lưu, đó là thiếu sự sao chép trang web và thiếu kiểm toán. Nếu bạn gửi email cho tôi tại nội dung của trường email riêng tư, sau này, khi bạn sắp xếp lại đôi chân của mình, tôi rất muốn thảo luận vấn đề với bạn.


6

Nếu hình ảnh của bạn được lưu trữ trên một dịch vụ bên ngoài như Flickr hoặc CDN (như được đề cập trong một trong các podcast của bạn), bạn vẫn có thể có tài nguyên hình ảnh ở đó.

Một số hình ảnh có thể được tìm thấy trên Google Images và nhấp vào "Tìm hình ảnh tương tự" , có thể có bản sao trên các trang web khác.


5

archive.org đôi khi che giấu hình ảnh. Nhận từng URL theo cách thủ công (hoặc viết một đoạn script ngắn) và truy vấn chúng cho nó như thế này:

chuỗi.Format ("GET / * / {0}", nextUri)

Tất nhiên điều đó sẽ khá khó khăn để tìm kiếm thông qua.

Tôi có thể có một số trong bộ nhớ cache trình duyệt của tôi. Nếu tôi làm tôi sẽ lưu trữ chúng ở đâu đó.


4

Nếu bạn đang cố gắng xóa bộ nhớ cache của người dùng, bạn có thể muốn đặt máy chủ đáp ứng 304 Not Modifiedtất cả các yêu cầu có điều kiện-GET ('If-Modified-Because' hoặc 'If-none-Match'), mà trình duyệt sử dụng để xác nhận lại tài liệu lưu trữ của họ.

Nếu các tiêu đề bộ đệm ban đầu của bạn trên nội dung tĩnh như hình ảnh khá tự do - cho phép mọi thứ được lưu trong bộ nhớ cache trong nhiều ngày hoặc nhiều tháng - bạn có thể tiếp tục nhận được yêu cầu xác nhận lại trong một thời gian. Đặt cookie theo các yêu cầu đó và kêu gọi những người dùng đó chạy tập lệnh dựa vào bộ đệm của họ để trích xuất hình ảnh họ vẫn có.

Mặc dù vậy, hãy coi chừng: thời điểm bạn bắt đầu đưa ra bất kỳ nội dung văn bản nào với tài nguyên nội tuyến chưa có, bạn có thể xóa sạch các phiên bản được lưu trong bộ nhớ cache này khi trình xác nhận lại đạt 404s.



4

Có nguy cơ chỉ ra điều hiển nhiên, hãy thử khai thác các bản sao lưu của máy tính của riêng bạn để lấy hình ảnh. Tôi biết chiến lược sao lưu của mình đủ lớn để tôi có nhiều bản sao của rất nhiều tệp được treo trên các ổ đĩa ngoài, đĩa bị ghi và trong các tệp zip / tar. Chúc may mắn!


4

Tôi đã quản lý để khôi phục các tệp này từ bộ đệm Safari của mình trên Snow Leopard:

bad-code-offset-back.jpg
bad-code-offset-front.jpg
code-whitespace-invisible.png
code-whitespace-visible.png
coding-horror-official-logo-small.png
coding-horror-text.png
codinghorror-search-logo1.png
crucial-ssd-128gb-ct128m225.jpg
google-microformat-results-forum.png
google-microformat-results-review.png
kraken-cthulhu.jpg
mail.png
powered-by-crystaltech-web-hosting.png
ssd-vs-magnetic-graph.png

Nếu bất cứ ai khác muốn thử, tôi đã viết một tập lệnh Python để trích xuất chúng thành ~ / mã hóa / tên tệp, mà tôi đã đặt trực tuyến tại đây .

Tôi hi vọng cái này giúp được.


3

Bạn có cơ hội để xem, nhà cung cấp dịch vụ lưu trữ của bạn có bất kỳ bản sao lưu nào không (một số phiên bản cũ hơn)?


có vẻ không ổn .. chương trình sao lưu của họ không thể sao lưu các tệp ổ cứng của máy ảo, do đó không có bản sao lưu.
Jeff Atwood

2

Dữ liệu này đáng giá bao nhiêu với bạn? Nếu nó đáng giá một khoản đáng kể (hàng ngàn đô la) thì hãy xem xét yêu cầu nhà cung cấp dịch vụ lưu trữ của bạn cho ổ cứng được sử dụng để lưu trữ dữ liệu cho trang web của bạn (trong trường hợp mất dữ liệu do lỗi phần cứng). Sau đó, bạn có thể đưa ổ đĩa vào ontrack hoặc một số dịch vụ khôi phục dữ liệu khác để xem những gì bạn có thể thoát khỏi ổ đĩa. Điều này có thể khó khăn để đàm phán do khả năng dữ liệu của người khác không được khôi phục trên ổ đĩa, nhưng nếu bạn thực sự quan tâm đến nó, bạn có thể giải quyết nó.


Theo như tôi biết thì máy chủ là một VM.
splattne

1
@splattne thậm chí như vậy, có một cơ hội khác không rất nhiều dữ liệu có thể được phục hồi.

Sẽ phải là một dịch vụ chuyên môn cao.

2

Rất tiếc khi nghe điều này và tôi rất khó chịu cho bạn, và thời điểm - tôi muốn có một bản sao ngoại tuyến của một vài bài đăng của bạn và đã thực hiện HTTrack trên toàn bộ trang web của bạn nhưng phải ra ngoài (đây là một vài tuần trước) và Tôi đã dừng nó lại.

Nếu máy chủ lưu trữ một nửa - và thực tế tôi đoán bạn là khách hàng tốt ... Tôi sẽ yêu cầu họ gửi cho bạn ổ cứng (như tôi đoán họ nên sử dụng RAID) hoặc tự phục hồi.

Mặc dù đây có thể không phải là một quá trình nhanh, tôi đã làm điều này với một máy chủ cho một máy khách và có thể khôi phục toàn bộ cơ sở dữ liệu (... về cơ bản, máy chủ đã thử nâng cấp cho bảng điều khiển mà chúng đang sử dụng và làm hỏng nó .. nhưng không có gì được ghi đè).

Bất cứ điều gì xảy ra - Chúc may mắn từ tất cả người hâm mộ của bạn trên các trang web SO!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.