当前位置:首页 > 文章 > 帝国CMS > 正文内容

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

3年前 (2022-10-22)帝国CMS12595

在我们做网站用火车头进行内容采集过程中,难免会遇到有的下载站把下载地址进行了隐藏,并且下载地址不统一,如下:

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

 

可以到下载地址有的是相对地址

 <ul class="ul_Address"><script>_downInfo ={Address:"/anzhuo1/homie_v1.0.4_2265.com.apk",TypeID:"1",SoftLinkID:"137056",SoftID:"118759",Special:"0"}</script>

有的是绝对地址:

<script>_downInfo ={Address:"https://ugame.9game.cn/game/downloadGame?pack.cooperateModelId=51319&pack.id=21974768",TypeID:"0",SoftLinkID:"417736",SoftID:"267030",Special:"0"}</script>

 

我们在用火车头进行采集过程中,对这样的就需要进行一个组合判断。

首先新建标签  下载地址1,如图:

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

 

然后新建标签下载地址2:获取

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

数据处理里新建同义词替换:

火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

然后新建标签下载地址,组合下载地址2+下载地址1即可。

 

参考规则附上:生活休闲

目标站地址:

http://www.2265.com/game/267030.html

下载地址typeID路径:

http://www.2265.com/inc/SoftLinkType.js

扫描二维码推送至手机访问。

版权声明:本文由蓝博发布,如需转载请注明出处。

本文链接:https://www.blueboss.cn/p/703.shtml

“火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程” 的相关文章

帝国CMS模板里面灵动标签怎么调用日期时间

帝国CMS模板里面灵动标签怎么调用日期时间

帝国cms模板里面灵动标签怎么调用日期时间? 用以下代码即可: <?=date("Y-m-d H:i:s",$bqr[newstime])?> OK!大家可以去测试看看!...

帝国CMS模板中随机调用文章信息

帝国CMS模板中随机调用文章信息

可以在生成标签的时候,标签参数中的排序参数用:’rand()’。引号不用。 比如: [ecmsinfo]2,10,32,0,0,2,0,”,’rand()’[/ecmsinfo] 但如果信息量很大的时候,比如上万后。严重影响生成速度。不建意使用。 如果确实要使用,可以用下面思路: 先用php随机出...

帝国CMS动态页支持栏目导航标签循环子栏目数据标签万能标签的调用

帝国CMS动态页支持栏目导航标签循环子栏目数据标签万能标签的调用

分享一种利用JS来实现支持栏目导航标签,万能标签,循环子栏目数据标签的方法。   第一步:在【模板】下面增加标签模板,标签模板内容如下:   页面模板内容(*): [!--empirenews.listtemp--]<!--list.var1-->[!--empirenews.list...

帝国CMS灵动标签调用当前栏目下子栏目列表

帝国CMS灵动标签调用当前栏目下子栏目列表

灵动标签调用当前栏目下子栏目,支持栏目自定义排序。下面帝国cms模板网就来告诉大家: [e:loop={"select classname,classpath,classid from phome_enewsclass where bclassid='$GLOBALS[navclassid]' a...

帝国CMS列表页判断文章来源带链接

帝国CMS列表页判断文章来源带链接

帝国CMS列表页内容怎么判断显示文章来源呢?并且来源带链接? 在列表内容模板里面写如下代码即可: $userr=$empire->fetch1("select befrom from {$dbtbpre}ecms_news_data_{$r[stb]} where id='$r[id]'")...

帝国cms专题页面点击率统计代码

帝国cms专题页面点击率统计代码

帝国cms专题页面点击率统计代码 专题访问浏览点击统计 <script src=[!--news.url--]e/public/onclick/?ztid=[!--self.classid--]&enews=dozt></script> 普通内容页 <scr...