有同樣是受災戶的網友詢問我如何從谷哥大神那兒尋找庫存網頁
不過因為沒有留下email
不知道該如何通知對方
所以把我的方法寫在這邊
希望有所幫助


這個方法是遠在荷蘭  同樣是受災戶的遊子吟老公J告訴我的
因為找到的網頁眾多
所以我再加以改善


Q:從哪兒可以找到Goolge的庫存網頁
A:庫存網頁直接上Google網站下搜尋指令即可

Q:搜尋指令該如何下?
A:因為我希望從特定網站(旅人網 loboh.com),找特定網頁(屬於我的網頁)
所以搜尋指定如下

關鍵字1+site:loboh.com 關鍵字2

能從Google找到多少網頁
跟搜尋指令的關鍵字下法有關

因為旅人網在每一網頁上方都會顯示 一個網址 類似 :網站+帳號
所以 我在Google下的指令如下:
mhsiao+site:loboh.com

1) mhsiao==> 關鍵字1, 我使用我的帳號, 如果範圍想縮小,還可換成文章的ID等,我實際抓了一頁後,觀察html檔的內容,試過幾個不同的關鍵字
2) site==> 指定搜尋某網站的網頁,網站位址寫在冒號後方
3) 關鍵字2, optional, 可用可不用,建議一開始不要使用,除非找到的網頁太多,想縮小範圍再使用。例如我想找我去年到荷蘭旅遊的日記,我搜尋指令寫為==>
mhsiao+site:loboh.com 荷蘭

這個指令會找出一堆網址
記得點選每個連結下方的"庫存網頁"的選項

依據我的經驗
Google的庫存網頁有時同一頁會有很多份
分別放在不同伺服器上
所以有時一開始用關鍵字A找不到 換成關鍵字B卻找到了


另外越多人點閱的文章 越可能在Google的庫存網頁找到
所以同一時期的日誌  有的有庫存 有的沒有
可能是因為有的文章很久沒有人點閱的關係 所以沒有庫存網頁


因為我只有找我自己的文章
所以我用最原始的方法
點選每個庫存網頁
然後一頁頁另存新檔


不過後來有個朋友跟我說有種"spider"的軟體
可以自動上網爬網頁 然後存下來
節省不少時間
不過我沒試過


另外我發現庫存網頁消失的很快
五月初的時候
隨便找都有1000多個連結 (大多重複或非日誌內容,如選單等網頁)
總共找回約100多篇日誌 (不含旅遊札記)


不過剛剛試了一下
只找到110個連結
所以要找動作要快

arrow
arrow
    全站熱搜

    小梅子 發表在 痞客邦 留言(3) 人氣()