㈠ 織夢採集的文章中的圖片怎麼去掉超鏈接這一屬性
您採集文章里的圖片帶有原網站的鏈接嗎?
在你的文檔發布頁勾選刪除回非站內鏈接答
還有內容模型設置那裡貌似也有的,設置為刪除非站內鏈接就行了
如果你用的採集軟體,請參看該軟體刪除站外鏈接的方法
如果是用的採集俠,默認有這個選項,勾選刪除站外鏈接就可以了
然後重新生成網站,如果以前發布的文檔依然存在這樣的鏈接,貌似就無法批量修改了。
夢客吧織夢模板 為您解答
望採納
㈡ 織夢dede採集方法教程
方法/步驟
1、首先我們打開織夢後台點擊
採集——採集節點管理——增加新節點
2、這里我們以採集普通文章為例,我們選擇普通文章,然後確定
3、我們進入了採集的設置頁面,填寫節點名稱,就是給這個新節點取個名字,這里你可以任意填寫。
然後打開你想要採集的文章列表頁,打開鏈接這個頁面,右鍵——查看源文件
找到目標頁面編碼,就在charset後面
4、頁面基本信息其他的一般就不用管了,填完了如圖
5、現在我們來填寫列表網址獲取規則
看看文章列表第一頁的地址jianzhanxinde/list_49_1.html
對比第二頁的地址jianzhanxinde/list_49_2.html
我們發現了他們除了49_後面的數字不一樣,其他的都一樣,所以我們可以這樣寫
/jianzhanxinde/list_49_(*).html
就是把1換成了(*)
因為這里只有2頁,所以我們就填從1到2
每頁遞增當然是1了,2-1...是等於1吧
這里我們就填寫完了
6、可能大家採集的有些列表沒有規則,那就只有手工指定列表網址了,如圖
7、每行寫一個頁面地址
列表規則寫完了,我們就開始寫文章網址匹配規則了,回到文章列表頁
右鍵查看源文件
找到區域開始的HTML,就是找文章列表開始的標志。
8、我們很容易的找到了如圖中的“新聞列表”
。從這里開始,後面就是文章列表裡
我們再找文章列表結束的HTML
9、就是這個了,一個很容易找到的標志
如果鏈接中含有圖片:
不處理
採集為縮略圖
這里根據自己的需要選擇
對區域網址進行再次篩選:
(使用正則表達式)
必須包含:
(優先順序高於後者)
不能包含:
打開源文件,我們可以很清楚的看到,文章鏈接都是以.html結束的
所以,我們在必須包含後面填.html
如果遇到有些列表很麻煩,還可以填寫後面的不能包含
8、我們點擊保存設置進入下一步,可以看到我們獲得的文章網址
看到這些就是對的了,我們保存信息進入下一步設置內容欄位獲取規則
我們看看文章有沒有分頁,隨便進入一篇文章看看。。我們看到這里的文章沒有分頁
所以這里的我們就默認了
9、我們現在來找文章標題等等
隨便進入一篇文章,右鍵查看源文件
看看這些
10、依照源碼填寫
11、我們再來填寫文章內容的開始,結束
和上面的一樣,找到開始和結束標志
12、開始:
12、結束:
13、你想過濾文章中的什麼內容就到過濾規則里寫吧,比如要過濾文章中的圖片
選擇常用規則
14、再勾選IMG,然後確定
15、這樣我們就把正文中的圖片過濾了
設置完畢後點保存設置並預覽
這樣一個採集規則就寫好了,很簡單吧有些網站很難寫,可要多下點功夫了哦
16、我們點保存並開始採集——開始採集網頁
一會的功夫就採集完了
17我們看看我們採集到的文章
18、看來是成功了,我們導出數據吧
㈢ 織夢cms採集的中途502
您好,朋友。跟版網團隊很高興為您解答:
1.502 Bad Gateway 錯誤的網關,這個問題的話通常是因內為服務容器性能引起的。
2.織夢採集的時候會佔用大量的cpu和內存,如果您一次性採集的數據過大,或者採集的時候內容中含有大量圖片的話通常會造成這種情況。
3.個人建議採集的時候不要一次性採集太多的頁面,可以分多次採集。不如有十頁,可以分兩次或者3次採集看是否會出錯。另外如果會其他採集的話,建議用火車頭等軟體採集,速度比較快,圖片可以先保存你本地然後再上傳,這樣的話一般不會出問題。
希望我的回答能夠幫到您。跟版網-專業織夢模板定製下載站。
㈣ 織夢採集俠的功能介紹
1、一鍵安裝,全自動採集
織夢採集俠安裝十分簡單方便,只需一分鍾,立即開始採集,而且結合簡單、健壯、靈活、開源的dedecms程序,新手也能快速上手,而且我們還有專門的客服為商業客戶提供技術支持。
2、一詞採集,無須編寫採集規則
3、RSS採集,輸入RSS地址即可採集內容
只要被採集的網站提供RSS訂閱地址,即可通過RSS進行採集,只需要輸入RSS地址即可方便的 採集到目標網站內容,無需編寫採集規則,方便簡單。
4、定向採集,精確採集標題、正文、作者、來源
定向採集只需要提供列表URL和文章URL即可智能採集指定網站或欄目內容,方便簡單,編寫簡單規則便可精確採集標題、正文、作者、來源。
5、多種偽原創及優化方式,提高收錄率及排名
自動標題、段落重排、高級混淆、自動內鏈、內容過濾、網址過濾、同義詞替換、插入seo詞語、關鍵詞添加鏈接等多種方法手段對採集回來的文章加工處理,增強採集文章原創性,利於搜索引擎優化,提高搜索引擎收錄、網站權重及關鍵詞排名。
6、插件全自動採集,無需人工干預
7、手工發布文章亦可偽原創和搜索優化處理
織夢採集俠並不僅僅是一款採集插件,更是一款織夢必備偽原創及搜索優化插件,手工發布的文章可以經過織夢採集俠的偽原創和搜索優化處理,可以對文章進行同義詞替換,自動內鏈,隨機插入關鍵詞鏈接和文章內包含關鍵詞將自動添加指定鏈接等功能,是一款織夢必備插件。
8、定時定量進行採集偽原創SEO更新
插件有兩個觸發採集方式,一種是在頁面內添加代碼由用戶訪問觸發採集更新,另外種我們為商業用戶提供的遠程觸發採集服務,新站無有人訪問即可定時定量採集更新,無需人工干預。
9、定時定量更新待審核文稿
縱使你資料庫裡面有成千上萬篇文章,織夢採集俠亦可根據您的需要每天在您設置的時間段內定時定量審核更新。
10、綁定織夢採集節點,定時採集偽原創SEO更新
綁定織夢採集節點的功能,讓織夢CMS自帶的採集功能也能定時自動採集更新。方便已經設置了採集規則的用戶定時採集更新。
㈤ 織夢採集文章Fatal error怎麼辦
您好,朋友,跟版網很高新為您解答:
1.如果是獨立伺服器用戶
這個的話應該是您的php.ini中設置問題,找到或者加入以下文件:
memory_limit = 將後面的數值改為:64M或者更大的值
2.如果是虛擬主機用戶:
空間支持.htaccess ,在.htaccess 文件中添加下面這句話。
php_value memory_limit 128M ;
希望我的回答能夠幫到您!