随着互联网的普及,越来越多的企业和个人选择通过建立自己的网站来展示自己的产品或服务。DedeCMS作为一款功能强大、易于上手的开源内容管理系统,受到了广大用户的喜爱。而DedeCMS的采集功能更是让许多新手头疼不已。今天,就让我来为大家详细介绍一下Dedecms采集规则的设置方法,帮助大家轻松打造个性化网站内容。
一、DedeCMS采集规则概述
1. 什么是采集规则?
采集规则是DedeCMS中用于采集网站内容的一套规则,它定义了采集的内容来源、采集的方式、采集的内容格式等。通过设置采集规则,我们可以轻松地采集到所需的内容,并将其展示在自己的网站上。
2. 采集规则的作用
(1)节省人力:通过采集规则,我们可以自动采集网站内容,大大节省了人力成本。
(2)提高效率:采集规则可以让我们快速获取所需内容,提高网站内容的更新速度。
(3)丰富内容:通过采集不同来源的内容,我们可以丰富网站内容,提升用户体验。
二、DedeCMS采集规则设置教程
1. 采集规则的基本设置
(1)打开后台管理界面,找到“采集”菜单,点击进入。
(2)点击“添加采集规则”,进入采集规则设置界面。
(3)填写采集规则名称:为方便管理,建议填写具有代表性的名称。
(4)选择采集网站:在采集网站列表中选择所需采集的网站。
(5)设置采集内容:根据需求,设置采集内容的标题、简介、正文等。
(6)设置采集格式:选择采集内容的格式,如HTML、纯文本等。
(7)设置采集频率:根据需求设置采集频率,如每天、每周等。
2. 采集规则的高级设置
(1)设置采集内容过滤:通过设置关键词、排除关键词等,过滤掉不必要的内容。
(2)设置采集排序:根据需求设置采集内容的排序方式,如按时间、按热度等。
(3)设置采集内容去重:通过设置采集内容去重规则,避免重复内容的出现。
(4)设置采集内容分页:对于长篇内容,可以设置分页采集,提高采集效率。
三、案例分析
1. 采集行业新闻:以某新闻网站为例,设置采集规则,采集网站最新新闻,展示在自己的网站上。
2. 采集产品信息:以某电商网站为例,设置采集规则,采集网站最新产品信息,展示在自己的网站上。
DedeCMS采集规则设置虽然看似复杂,但只要掌握了基本的操作方法,就能轻松实现个性化网站内容的采集。通过设置采集规则,我们可以节省人力、提高效率、丰富内容,让网站更具吸引力。希望本文对大家有所帮助。
以下是一个简单的采集规则设置表格,供大家参考:
参数 | 说明 | 示例 |
---|---|---|
采集名称 | 规则名称 | 行业新闻采集 |
采集网站 | 网站地址 | http://www.example.com/ |
采集内容 | 采集内容字段 | 标题、简介、正文 |
采集格式 | 内容格式 | HTML |
采集频率 | 采集频率 | 每天采集一次 |
采集内容过滤 | 关键词 | 关键词1、关键词2 |
采集排序 | 排序方式 | 按时间排序 |
采集内容去重 | 去重规则 | 标题和简介 |
采集内容分页 | 分页方式 | 每页采集10条 |
通过以上表格,相信大家对DedeCMS采集规则设置有了更深入的了解。祝大家在使用DedeCMS时,能够轻松实现个性化网站内容的采集。
织梦dedecms文档关键字维护获取不到关键词怎么办
解决方案1:
如果是批量上传或者是采集的内容。要运行“自动获取关键词”功能一次。在后台搜索即可
织梦文档关键词批量维护,关键词表在哪里,我要批量…
答:第一步,在FTP上传一个phpmyadmin管理软件,然后通过phpmyadmin进入数据库管理,找到数据库的表名“dede_keywords”,第二步:由于数据表内关键词,系统生成得比较多,所有你需要首先设置显示行数如下图所示,然后全选,进行删除即可:
织梦5.7文档关键词维护不起作用,怎么实现或者修改?
答:article_keywords_main看数据库里有没有这个表(或字段),清空这个就可以了。更新提取的是没有加链接的。要自己手动加
织梦5.7 sp2,文档关键词维护功能没有效果,怎么解…
答:可能是软件出错。建议重新下载安装看看点击下载织梦 dedecms安装教程 1.我们在浏览器中打开,开始进行安装。 2.选中“我已经阅读并同意此协议”点击继续,这里系统跳转到环境检测页面。
织梦dede关键字维护?获取不到关键词链接怎么办?
答:网站关键词内链,是做好网站内部优化的一个重要环节织梦(DedeCms)官方默认规则是: 1.添加关键词和关键词的链接地址设置步骤:进入后台核心->批量维护->文档关键词维护 2.文章内容出现该关键词 3.文章的关键词出现这个词(就是这里)//这个…
dedecms后台”文档关键词维护”中的频率30如何修改?
答:这修改需要你修改html模板文件,如果你对html有些基础可以跟着我的操作来,找到你网站下面的\dede\templets\article_keywords_make.htm这个文件,如果有人修改了后台默认的dede请更换到相应的后台目录下面寻找这个文件,没有更改过的可以忽略打…
织梦dede后台怎么查找文章内容关键词
答:修改一下文件,就能实现织梦dede后台怎么查找文章内容关键词。登录网站ftp后台,找到后台目录,默认是dede,一般都会修改这个目录名称,然后再找到content_list.php这个文件,备份一下,下载下来后用Dreamweaver打开编辑,找到185行的以下内容…
织梦内容标签调用点击关键词显示模板不存在
答:先去看下你自己的模板目录是什么一般是default,tag标签回调用taglist.htm和tag.htm确认有没有存在,
新手建站是否应选择采集
关于采集的优与却点,这个主要看个人是怎么认为的,基本上国内的cms系统都带采集,因方便快捷,普遍被站长们接受,因选择采集过后,就不需要挖空心思的去想如何创建站内容。当然采集不好是因为大家都去采集,可以说大量的内容堆积形成了一个垃圾圈,当然搜索引擎也是拒绝收录或者被k掉。这里我们就不谈采集优点与缺点,因为我自己也是很矛盾的,虽然我认为采集不够好,但我每天仍然会用到它。以下仅仅是我个人的看法,希望能给新手一定的帮助。
采集也就是我们把别人网站上的内容给弄到自己的网站上去。你可以用Ctrl+C然后再Ctrl+V。但是复制与粘贴不同的是,它批量的,是程序智能化的。你手工能在一分钟能复制多少文章?可想而知,当然还要分开文章标题和内容,甚至发布时间,作者等。如果用采集就不一样了,在性能允许的情况下,它可以一分钟采集几百篇文章。从而大大减轻了站长们的时间。
国内的cms一般都带采集功能,并且都在不断完善提升之中,还有一些原来没有的采集功能的论坛及博客程序,都会有人开发出采集插件。因个人比较喜欢使用dedecms也就是(织梦)所以对其他的cms系统不是很了解,但是网络上相关教程很多,大家可以自行查找后,阅读以下即可。除此之外还有哪些程序自带采集了,我们可以百度以下看看,很多的如php168、phpcms、帝国cms、动易、新云、等等。
下面会讲一个比较强大的采集器,那就是火车头,火车采集器是用来批量采集网页,论坛等的内容,直接保存到数据库或发布到网站的一种工具,他们可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容。
DEDECMS:功能强大,新手需要多学习,才能掌握。功能无比强大,相信用过的人都知道。不过DEDE有词语替换,只要你导入词语替换数据,那么它就可以执行替换了,这对伪原创还是比较好的。
php168:
1.自带新浪新闻采集系统,可以很方便自由的采集新浪国内、国际、社会、娱乐、科技、财经、军事、体育精选新闻。
2.可以自由添加采集参数,并且可以共享采集参数,即可把采集参数导出来,分享给其他人。
3.可以很方便的采集类似奇虎这样的新闻,也就是说你可以做一个像奇虎这样的站。
帝国cms:
1.使用简单:无需会任何程序,只需在相应的内容加上相应的标签即可。
2.多重过滤:同一链接可设置不重复采集;设置采集关键字(不包含不采集);内容字符替换;广告过滤;过滤相似信息;过滤标题相同信息;可设置采集前几条记录。
phpcms:整个站点内容页(注意是内容页,就是文章的详细展示页面)的通用规则,这里如果设置好后,以后添加采集任务时,会自动继承这个规则,就会省很多工作量。
火车头:功能强大自定义参数,不过新手可以参照官方教程一步步操作。像这种采集软件,一般只要在网站程序没有采集功能,或者功能不够强大达不到自己要求的朋友可以去使用看看。个人感觉,火车头是比较不错的采集软件。
采集的优缺点
虽然本文章没有提到,这里还是给新手朋友们仔细的分析一下。
优点:可以花少量的时间来完成很多文章的分布。一个小时可以发上千篇文章。减少了网站维护和写作时间,给站长提供了方便。
缺点:内容高度重复,因为你是采集别人的文章,所以你和别人的文章大量的重复,就算你是伪原创也同样,你想想如果100个人都使用伪原创工具,那和采集的不还是同样的吗?先不谈伪原创工具的好与不好,如果互联网上充斥着那样的文章,却一点可读性的价值都没有,你觉得你的网站能留得住客户吗?网站内容的重复带来的结果就只有,收录少,排名低。
建议新手朋友们的方法
在网上看到一些人说做网站是很简单的,只要把程序安装上去,然后采集就ok了。还说什么采集比较适合新手,个人觉得就是扯淡,一个网站没有可读性,有价值的文章,你觉得你这样能留住客户吗?我希望的是新手尽可能的少用采集,多充实一些比较有价值的文章,也就是你的原创文章,不要一咕噜的采集。以下说几点希望对新手有用。
1.新手用了采集,那么就会产生惰性,以后就算做站,都会选用采集器。
2.新手建站本身就是个学习的过程。自己写文章是很重要的。先不说你是否具备能写,或者你写不出来,你改别人的文章也是好的。这样不仅比伪原创的程序高,而且可读性也较高。最重要的是新手朋友可以从中不断学习与提升自己的知识。
3.误导了新手对建站的看法。本来建站就是服务网民,给自己带来收益。而使用采集过后,特别是那些伪原创工具一旦使用过后,那就是向前看,而不管网民是否喜欢。这样会让新手变得目光短浅,不利于长期的发展。
4.不利于新手学习seo,如果用采集器,那基本上就用不到seo了,seo是一个理论+实践的过程。只有在实践中论证理论,改变自身错误的看法,才能真正的把握seo的核心部分。
个人认为新手尽量靠自己的手来写文章,尽管写的不好,我相信以后会好的,如果是想赚钱,那也不要是使用采集器,因为网络上赚钱不是你想的那么简单。别以为,建个网站,就有钱了。这个方法如果在前两年还行得通,而现在却行不通了。如果你要想赚钱,必须有一个过程。所以对新手说,每天写一篇文章都可以,然后不停地学习、实践,我相信目标会离你越来越近。
火车头采集下来怎么发布到网站上
1、运行火车头软件,点击发布到发布窗口界面;
2、点击添加,依次选择发布接口,选择网站编码、填写后台路径、(因为是免登陆接口)选择不需要登录&http请求,然后获取列表看看是否成功,成功后请保持配置。
(注意:如果无法获取列表说明没有配置成功,检测接口文件是否上传,后台路径是否正确等)
3、如果你需要同时发布到多个网站,请重复2操作,原则上可以发布N个。
4、配置完发布接口后回到火车头界面,双击你要发布的采集规则,进入采集规则编辑任务窗口,切换到第三步:发布内容配置;
5、点击启用 Web在线发布到网站,然后添加发布配置,在弹出Web发布配置窗口选择你你的发布配置,点击添加,多个网站发布可以多选;
6、双击你添加的网站发布,点击获取列表绑定你要发布到网站的指定栏目的栏目ID,保存规则,到此你的采集规则发布到网站已经配置好了;
7、如果你要一条采集规则多个网站发布就重复第6步,原则上可以发布N个站。