wordpress 获取参数(wordpress抓取网页)

在WordPress中,获取参数是一个非常重要的技能。它可以帮助我们更好地了解用户的需求,实现个性化定制,提升用户体验。本文将详细介绍WordPress中获取参数的方法和技巧,让你轻松掌握这一技能。

WordPress作为一个强大的内容管理系统,其参数获取功能十分丰富。通过获取参数,我们可以实现以下功能:

1. 获取用户输入的查询参数,如文章标题、分类等;

2. 获取文章或页面的自定义字段;

3. 获取用户在表单中提交的数据;

4. 获取插件或主题提供的参数。

掌握这些参数获取技巧,将让你的WordPress网站更加智能、高效。

一、获取查询参数

查询参数是URL中的一部分,通常用于传递信息。以下是一些获取查询参数的方法:

1. 使用`$_GET`数组

“`php

$keyword = isset($_GET[‘keyword’]) ? $_GET[‘keyword’] : ”;

>

“`

2. 使用`get_query_var()`函数

“`php

$keyword = get_query_var(‘keyword’);

>

“`

3. 使用`get_search_query()`函数

“`php

$keyword = get_search_query();

>

“`

二、获取文章或页面参数

在WordPress中,我们可以通过以下方法获取文章或页面的参数:

1. 使用`get_post()`函数

“`php

$post = get_post();

$author_id = $post->post_author;

>

“`

2. 使用`get_post_meta()`函数

“`php

$meta_value = get_post_meta($post->ID, ‘meta_key’, true);

>

“`

3. 使用`get_the_terms()`函数

“`php

$terms = get_the_terms($post->ID, ‘category’);

>

“`

三、获取自定义字段

自定义字段(Custom Fields)是WordPress中一个非常有用的功能,它可以让我们为文章或页面添加额外的信息。以下是一些获取自定义字段的方法:

1. 使用`get_post_meta()`函数

“`php

$meta_value = get_post_meta($post->ID, ‘meta_key’, true);

>

“`

2. 使用`get_field()`函数

“`php

$meta_value = get_field(‘meta_key’);

>

“`

四、获取用户提交的数据

在WordPress中,我们可以通过表单收集用户提交的数据。以下是一些获取用户提交数据的方法:

1. 使用`$_POST`数组

“`php

$username = isset($_POST[‘username’]) ? $_POST[‘username’] : ”;

>

“`

2. 使用`sanitize_text_field()`函数

“`php

$username = sanitize_text_field($_POST[‘username’]);

>

“`

五、获取插件或主题参数

插件和主题通常会提供一些参数,以便开发者可以自定义功能。以下是一些获取插件或主题参数的方法:

1. 使用插件或主题提供的函数

“`php

$value = get_theme_mod(‘theme_mod_name’);

>

“`

2. 使用插件或主题提供的数据库表

“`php

$value = get_option(‘option_name’);

>

“`

WordPress获取参数是一个非常有用的技能,它可以帮助我们更好地了解用户需求,实现个性化定制,提升用户体验。本文介绍了获取查询参数、文章或页面参数、自定义字段、用户提交数据以及插件或主题参数的方法和技巧。希望本文能帮助你更好地掌握WordPress参数获取技能。

获取参数方法 描述
`$_GET`数组 用于获取URL中的查询参数
`get_query_var()`函数 用于获取URL中的查询参数
`get_search_query()`函数 用于获取搜索查询参数
`get_post()`函数 用于获取当前文章或页面的信息
`get_post_meta()`函数 用于获取文章或页面的自定义字段
`get_the_terms()`函数 用于获取文章或页面的分类或标签
`get_field()`函数 用于获取自定义字段
`$_POST`数组 用于获取用户在表单中提交的数据
`sanitize_text_field()`函数 用于清理用户输入的数据
插件或主题提供的函数 用于获取插件或主题提供的参数
插件或主题提供的数据库表 用于获取插件或主题提供的参数

通过掌握这些参数获取技巧,你的WordPress网站将变得更加智能、高效。

wordpress 万能采集方法,实现任何网站都能采集!

WordPress万能采集方法概述

在WordPress中,通过采集可以获取大量文章资源,但需注意,直接照搬他人内容不仅不道德,还可能对SEO产生负面影响。因此,采集应作为获取底稿的方式,后续需优化完善内容。以下是一套较为通用的WordPress采集方法,旨在帮助用户从任何网站采集内容。

一、准备工具

火车头采集工具:用于从目标网站抓取数据。Office套件:如Word或Excel,用于处理和整理采集到的数据。WordPress插件:Import Export Lite:用于将处理后的数据导入WordPress。二、采集步骤

分析目标网站

确定要采集的内容部分,通常是以分类为中心,而非首页。

观察分类页面的URL结构,找出分类标签和分页逻辑。例如:(分类标签为/news),(分页逻辑为/_2表示第二页)。

若目标网站未显示分页URL变化,可尝试添加常见的分页URL段,如/page/2。

设置火车头采集规则

打开火车头,选择向导添加采集规则。

使用批量添加URL功能,将目标网站的URL粘贴进去。

在链接的分页数字处用“地址参数”表示,并设置采集的页数。可通过测试翻页总数或直到页面404来确定页数。

确定采集页面逻辑,观察文章URL的变化,找出文章的固定格式(如url+文章id+.html)。

在火车头的链接采集规则中添加“包含.html”的要求,以获取准确的文章地址。

采集内容

点击网址采集,获取需要的链接。

检查网址的可用性,确保网址段落完整。

编写采集规则,使用开发者工具检查文章内容是否在源代码中展现。

使用焦点工具获取源代码位置的标签,设置开始标签和结束标签,以采集所需内容。

采集完成后,可在任务数中查看采集到的文章数量,并复制到Word文档中进行处理。

处理采集到的数据

在Word文档中,使用替换功能删除段落标记和手动换行符,以便将数据导入Excel。

将处理后的数据复制到Excel中,进行进一步的整理和分析。

导入WordPress

在WordPress后台安装并激活Import Export Lite插件。

选择新的导出,导出内容选择文章,并自定义字段。

打开下载的CSV文件,匹配文章内容和标题部分。

回到WordPress后台,选择新的导入,上传文件。

插件会自动识别字段信息,选择导入类型为文章,并进行字段映射。

填写主要字段和自定义字段后,点击下一步导入。

在“更新现有字段”中选择更新所有内容,完成导入。

三、特别注意事项

在导入数据前,务必在测试网站上确认无误,以免对生产环境造成不必要的麻烦。备份数据库是一个好习惯,以防万一出现问题时可以恢复。采集内容时应尊重原作者的版权,避免直接照搬或恶意侵权。采集到的内容应作为底稿进行优化和完善,以提升文章质量和SEO效果。四、图片展示

以下图片展示了火车头采集工具的设置过程、采集到的数据以及导入WordPress后的效果:

通过以上步骤和注意事项,您可以实现WordPress的万能采集方法,从任何网站获取所需内容。但请务必遵守相关法律法规和道德规范,尊重原作者的版权。

如何利用robots.txt对wordpress博客进行优化

一、先来普及下robots.txt的概念:

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。这个文件用于指定spider在您网站上的抓取范围,一定程度上保护站点的安全和隐私。同时也是网站优化利器,例如屏蔽捉取站点的重复内容页面。

robots.txt目前并不是一种标准,只是一种协议!所以现在很多搜索引擎对robots.txt里的指令参数都有不同的看待。

二、使用robots.txt需要注意的几点地方:

1、指令区分大小写,忽略未知指令,下图是本博客的robots.txt文件在Google管理员工具里的测试结果;

2、每一行代表一个指令,空白和隔行会被忽略;

3、“#”号后的字符参数会被忽略;

4、有独立User-agent的规则,会排除在通配“*”User agent的规则之外;

5、可以写入sitemap文件的链接,方便搜索引擎蜘蛛爬行整站内容。

6、尽量少用Allow指令,因为不同的搜索引擎对不同位置的Allow指令会有不同看待。

三、Wordpress的robots.txt优化设置

1、User-agent:*

一般博客的robots.txt指令设置都是面对所有spider程序,用通配符“*”即可。如果有独立User-agent的指令规则,尽量放在通配“*”User agent规则的上方。

2、Disallow:/wp-admin/

Disallow:/wp-content/

Disallow:/wp-includes/

屏蔽spider捉取程序文件,同时也节约了搜索引擎蜘蛛资源。

3、Disallow:/*/trackback

每个默认的文章页面代码里,都有一段trackback的链接,如果不屏蔽让蜘蛛去捉取,网站会出现重复页面内容问题。

4、Disallow:/feed

Disallow:/*/feed

Disallow:/comments/feed

头部代码里的feed链接主要是提示浏览器用户可以订阅本站,而一般的站点都有RSS输出和网站地图,故屏蔽搜索引擎捉取这些链接,节约蜘蛛资源。

5、Disallow:/?s=*

Disallow:/*/?s=*

这个就不用解释了,屏蔽捉取站内搜索结果。站内没出现这些链接不代表站外没有,如果收录了会造成和TAG等页面的内容相近。

6、Disallow:/?r=*

屏蔽留言链接插件留下的变形留言链接。(没安装相关插件当然不用这条指令)

7、Disallow:/*.jpg$

Disallow:/*.jpeg$

Disallow:/*.gif$

Disallow:/*.png$

Disallow:/*.bmp$

屏蔽捉取任何图片文件,在这里主要是想节约点宽带,不同的网站管理员可以按照喜好和需要设置这几条指令。

8、Disallow:/?p=*

屏蔽捉取短链接。默认头部里的短链接,百度等搜索引擎蜘蛛会试图捉取,虽然最终短链接会301重定向到固定链接,但这样依然造成蜘蛛资源的浪费。

9、Disallow:/*/comment-page-*

Disallow:/*?replytocom*

屏蔽捉取留言信息链接。一般不会收录到这样的链接,但为了节约蜘蛛资源,也屏蔽之。

10、Disallow:/a/date/

Disallow:/a/author/

Disallow:/a/category/

Disallow:/?p=*&preview=true

Disallow:/?page_id=*&preview=true

Disallow:/wp-login.php

屏蔽其他的一些形形色色的链接,避免造成重复内容和隐私问题。

10、Sitemap:http://***.com/sitemap.txt

网站地图地址指令,主流是txt和xml格式。告诉搜索引擎网站地图地址,方便搜索引擎捉取全站内容,当然你可以设置多个地图地址。要注意的就是Sitemap的S要用大写,地图地址也要用绝对地址。

上面的这些Disallow指令都不是强制要求的,可以按需写入。也建议站点开通谷歌管理员工具,检查站点的robots.txt是否规范。

wordpress怎么设置301重定向

一、什么是301重定向

301重定向是一种非常重要的“自动转向”技术。网址重定向最为可行的一种办法。当用户或搜索引擎向网站服务器发出浏览请求时,服务器返回的HTTP数据流中头信息(header)中的状态码的一种,表示本网页永久性转移到另一个地址。

二、什么情况下使用301重定向

1、网站更换域名时,通过301永久重定向将旧域名重定向至新域名,挽回流量损失和SEO。

2、当出于需要删除网站中的某些目录时,比如我要删除我博客下的博客导航,这时就可以用301永久重定向到网站首页。

3、如果你有多个闲置域名时需要指向同一网站时,通过301永久重定向可以实现。

4、你打算实现网址规范化。

三、301重定向的作用

1、网站改版使用301重定向可以很好地传递老站权重到新站上。

网站改版过程需要用到301重定向。用的过程中合理的操作可以减少权重的流失。这里也捎带的提醒一句,一般的标准是一定要保证老站的所有连接都可以正常的打开或者是跳转到新的页面上。而这个跳转就要是301跳转,而不能是JS跳转或者302跳转。

2、网站多域名汇聚权重要用到301重定向。

一般每一个网站都会有一个带www的和不带www的域名,甚至有的网站还是用了域名泛解析。这个时候我们建议让其他域名不能打开,只保留带www和不带www的那个域名,然后让带www的那个域名301重定向到不带www的域名。

3、网站目录结构的调整可能会用到301重定向。

如果你网站内部要进行目录调整,但是又怕出现404页面,就要做301重定向。做了之后老的链接会跳转到新链接上,传递权重。

四、301重定向的设置方法

wordpress网站常见的设置方法有3种,我今天主要讲解带www.的链接301重定向到不带有www.的链接的网站上。

1、登陆wordpress网站后台,找到设置—常规找到WordPress地址(URL)和站点地址(URL),填写你的网址,然后保存更改。

现在wordpress网站有了这个功能后,以后想带WWW或不想带WWW都变得简单多了,直接后台设置就OK了。对于原先不带WWW想更改为带WWW的方法也是一样,直接登录后台修改即可。建议wordpress升级到最新版本,这种方法比较适合新手朋友。

2、主机空间控制面板设置

首先,你所购买的空间需要支持301重定向,一般情况下所购买的的空间控制面板都应该有 301重定向功能的,建议到正规的空间商购买,购买之前咨询空间商。我所购买的是主机庙空间,就以我空间为例吧。

(1)、登陆空间商网站,进入空间控制面板

(2)、找到301重定向

(3)、设置301重定向,设置完保存

3、DNSpod设置

百度DNSpod进入官网,注册账号,注意DNSpod账号注册后一个月才生效,主要针对的是没有301重定向设置功能的空间,需要输入完整的域名。

五、301重定向检测方法

301重定向现在检测比较简单,利用站长工具就可以检测,在站长工具里找到HTTP状态查询,地址:

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享