• 歡迎訪問奇跡の海網站,本站不上傳任何資源,所有資源均來自于網絡,歡迎加入奇跡の海~!奇跡の海-WordPress QQ群
  • 本站下載資源為網絡上收集整理而來,并且以計算機技術研究交流為目的,版權歸原作者所有,僅供大家參考,學習,不存在任何商業目的與商業用途.
  • 本站系統鏡像均來自于官方原版,ed2k可視為P2P下載鏈接。所有操作系統默認均為試用版,如有正版密鑰可以有效激活,本站不提供任何激活和相關服務。

WordPress自動采集發布插件WP-AutoPost使用教程

WP插件 奇跡の海 1年前 (2018-03-25) 504次瀏覽 已收錄 0個評論 掃描二維碼

WP-AutoPost是目前最好用的WordPress自動采集發布插件,最大的特點是可以采集來自于任何網站的內容并自動發布到你的WordPress站點。不像其他大部分WordPress采集插件,只能根據Feed進行采集,使用Feed采集有很大的弊端,首先必須找到全文Feed,而現在網上全文Feed很少,大部分只能采集到文章摘要,就算使用Feed采集到文章摘要也需要點擊鏈接才能查看原文,相當于給別的網站做外鏈。做英文垃圾站用的比較多的WP-Robot也只有20幾個采集來源,文章來源比較單一有限。而WP-AutoPost就沒有上面這些劣勢,真正做到可以采集任何網站的內容并自動發布,采集過程完全自動進行無需人工干預,并提供內容過濾、HTML標簽過濾、關鍵詞替換、自動鏈接、自動標簽、自動下載遠程圖片到本地服務器、自動添加文章前綴后綴、并且可以使用微軟翻譯引擎將采集的文章自動翻譯為各種語言進行發布。

WP-AutoPost中文免費下載地址?http://wp-autopost.org/zh

一、安裝WP-AutoPost

和安裝其他WordPress插件一樣,直接上傳到插件目錄,激活即可使用,無需再進行額外設置或修改代碼。

二、創建采集任務

點擊“新建任務”后,輸入任務名稱,即可創建新任務,創建好新任務之后可以在任務列表中查看到該任務,就可對該任務進行更多設置。

WordPress自動采集發布插件WP-AutoPost使用教程

三、基本設置功能

WordPress自動采集發布插件WP-AutoPost使用教程

在基本設置選項卡下,可以進行如下設置:

  • 任務名稱:可以修改任務名稱
  • 分類目錄:該任務采集文章發布到的分類目錄
  • 作者:該任務采集文章的發布作者,必須是WordPress里的注冊用戶
  • 更新時間間隔:間隔多長時間檢測一次該采集任務下是否有新文章可以更新
  • 字符集:采集目標網站的字符集編碼,默認為UTF8,如果目標網頁字符集編碼不是UTF8,抓取的網頁會出現亂碼,設置正確的字符集即可解決該問題(如何正確設置字符集
  • 下載遠程圖片:如果該任務下采集的文章里包含圖片,可以選擇是否下載遠程圖片到本地服務器,選擇下載遠程圖片,可進一步選擇是否將下載的圖片信息保存到WordPress媒體庫中
  • 自動標簽:選擇是否使用自動標簽
  • 標簽列表:使用自動標簽后如果文章包含列表里的關鍵詞,將自動添加標簽
  • 匹配完整的單詞:該設置對英文文章有效,中文文章請勿啟用該設置

 

四、文章來源設置

在該選項卡下我們需要設置文章來源的?文章列表網址及?具體文章的匹配規則

我們以采集“新浪互聯網新聞”為例,文章列表網址為http://roll.tech.sina.com.cn/internet_worldlist/index.shtml?因此在 手工指定文章列表網址 中輸入該網址即可,如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

之后需要設置該文章列表網址下具體文章網址的匹配規則

 

五、文章網址匹配規則

文章網址匹配規則的設置非常簡單,無需復雜設置,提供兩種匹配模式,可以使用URL通配符匹配,也可以使用CSS選擇器進行匹配,通常使用URL通配符匹配較為簡單。

1. 使用URL通配符匹配

通過點擊列表網址?http://roll.tech.sina.com.cn/internet_worldlist/index.shtml?上的文章,我們可以發現每篇文章的URL都為如下結構

http://tech.sina.com.cn/i/2013-06-27/16328485884.shtml

因此將URL中變化的數字或字母替換為通配符?(*)?即可,如:http://tech.sina.com.cn/i/(*)/(*).shtml

WordPress自動采集發布插件WP-AutoPost使用教程

2. 使用CSS選擇器進行匹配

使用CSS選擇器進行匹配,我們只需要設置?文章網址的CSS選擇器?即可(不知道CSS選擇器為何物,一分鐘學會如何設置CSS選擇器),通過查看列表網址 http://roll.tech.sina.com.cn/internet_worldlist/index.shtml 的源代碼即可輕松設置,找到該列表網址下具體文章的超鏈接的代碼,如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

可以看到,文章的超鏈接a標簽在class為“contList”的標簽內部,因此?文章網址的CSS選擇器?只需要設置為?.contList a ?即可,如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

設置完成之后,不知道設置是否正確,可以點擊上圖中的測試按鈕,如果設置正確,將列出該列表網址下所有文章名稱和對應的網頁地址,如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

 

六、文章抓取設置

在該選項卡下,我們需要設置文章標題和文章內容的匹配規則,提供兩種方式進行設置,推薦使用CSS選擇器方式,使用該方式更為簡單,精確。(不知道CSS選擇器為何物,一分鐘學會如何設置CSS選擇器

我們只需要設置文章標題CSS選擇器文章內容CSS選擇器,即可準確抓取文章標題和文章內容。

在文章來源設置里,我們以采集”新浪互聯網新聞“為例,這里還是以該例子講解,通過查看列表網址 http://roll.tech.sina.com.cn/internet_worldlist/index.shtml 下某一篇文章的源代碼即可輕松設置,例如,我們通過查看某篇具體文章 http://tech.sina.com.cn/n/i/2013-06-10/06308430630.shtml?的源代碼,如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

可以看到,文章標題在id為“artibodyTitle”的標簽內部,因此文章標題CSS選擇器只需要設置為#artibodyTitle?即可;

同樣的,找到文章內容的相關代碼:

WordPress自動采集發布插件WP-AutoPost使用教程

可以看到,文章內容在id為“artibody”的標簽內部,因此文章內容CSS選擇器只需要設置為?#artibody?即可;如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

設置完成之后,不知道設置是否正確,可點擊測試按鈕,輸入測試地址,如果設置正確,將顯示出文章標題和文章內容,方便檢查設置

WordPress自動采集發布插件WP-AutoPost使用教程

 

七、抓取文章分頁內容

如果文章內容過長,有多個分頁同樣可以抓取全部內容,這時需要設置文章分頁鏈接CSS選擇器,通過查看具體文章網址源代碼,找到分頁鏈接的地方,例如某篇文章分頁鏈接代碼如下:

WordPress自動采集發布插件WP-AutoPost使用教程

可以看到,分頁鏈接A標簽在class為 “page-link” 的標簽內部

因此,文章分頁鏈接CSS選擇器設置為?.page-link a?即可,如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

如果勾選當發表時也分頁時,發表文章也將同樣被分頁,如果你的WordPress主題不支持 <!- – nextpage – -> 標簽,請勿勾選。

 

八、文章內容過濾功能

文章內容過濾功能,可過濾掉正文中不希望發布的內容(如廣告代碼,版權信息等),可設置兩個關鍵詞,刪除掉兩個關鍵詞之間的內容,關鍵詞2可以為空,表示刪除掉關鍵詞1之后的所有內容。

如下所示,我們通過測試抓取文章后發現文章里有不希望發布的內容,切換到HTML顯示,找到該內容的HTML代碼,分別設置兩個關鍵詞即可過濾掉該內容。

WordPress自動采集發布插件WP-AutoPost使用教程

如上所示,如果我們希望過濾掉上面<div class=”ep-source cDGray”>和</div>之間的內容,添加如下設置即可

WordPress自動采集發布插件WP-AutoPost使用教程

如果需要過濾掉多處內容,可以添加多組設置。

 

九、HTML標簽過濾功能

HTML標簽過濾功能,可過濾掉采集文章中的超鏈接(a標簽),<script>和<style>等標簽下不必要的代碼。

下面是幾個例子:

  • 如果需要過濾掉文章中的超鏈接,只需輸入 a 即可,是否刪除標簽內容?選擇否
  • 如果要過濾掉文章中包含的<script>或<style>不必要的代碼,只需輸入對應標簽名稱,是否刪除標簽內容選擇是

WordPress自動采集發布插件WP-AutoPost使用教程

 

十、關鍵詞替換、自動添加自定義超鏈接

可以將正文或標題中的關鍵詞進行替換,同時也支持正文自定義超鏈接;

例如:需要將文章里的wordpress自動添加鏈接到http://wordpress.org/,只需設置 wordpress 替換為 <a href=”http://wordpress.org/”>wordpress</a> 即可

如下所示:

WordPress自動采集發布插件WP-AutoPost使用教程

 

十一、解決亂碼問題

為什么產生亂碼

WP-AutoPost 采集網頁時默認字符集為UTF-8,如果目標網頁的字符集不是UTF-8,采集的內容可能會出現亂碼。

解決亂碼問題

解決方法非常簡單,只需查看目標網頁的字符集,設置正確的字符集即可。

打開目標網頁源代碼,一般在最前面的位置,找到有charset的代碼部分:

WordPress自動采集發布插件WP-AutoPost使用教程

如上所示,該網頁的目標編碼為gb2312,設置相同的字符集即可:

WordPress自動采集發布插件WP-AutoPost使用教程


版權聲明:本站所有文章和資源使用CC BY-NC-SA 4.0協議授權發布 , 轉載應當以相同方式注明文章來自“SeaOMC.COM->WordPress自動采集發布插件WP-AutoPost使用教程!在下邊可以分享本文哦!
喜歡 (0)
[]
分享 (0)
奇跡の海
關于作者:
一個WordPress菜鳥!
發表我的評論
取消評論

表情 貼圖 加粗 刪除線 居中 斜體 簽到

Hi,您需要填寫昵稱和郵箱!

  • 昵稱 (必填)
  • 郵箱 (必填)
  • 網址
中国福利彩票36选7开奖结果