威宁热线

威宁团菜到家

[工具软件] 如何提取sitemap.xml中的url生成sitemap.txt

[复制链接]
威宁热线 发表于 2021-2-11 00:17:21 | 显示全部楼层 |阅读模式
其实网上有很多用python和php提取的教程了,而用python和php实现都有技术门槛,并不适合所有人,今天我就来跟大家介绍一种更简单的方式,但是也并不是没有门槛,需要会正则,利用DW正则替换。

  1. <p><?xml version="1.0" encoding="utf-8"?></p><p>
  2. </p><p><urlset></p><p>
  3. </p><p>    <url></p><p>
  4. </p><p>        <loc>https://m.10soo.com/</loc></p><p>
  5. </p><p>        <lastmod>2020-04-11</lastmod></p><p>
  6. </p><p>        <changefreq>daily</changefreq></p><p>
  7. </p><p>        <priority>1.0</priority></p><p>
  8. </p><p>    </url></p><p>
  9. </p><p>    <url></p><p>
  10. </p><p>        <loc>https://m.10soo.com/news.html</loc></p><p>
  11. </p><p>        <lastmod>2020-04-10</lastmod></p><p>
  12. </p><p>        <changefreq>daily</changefreq></p><p>
  13. </p><p>        <priority>0.8</priority></p><p>
  14. </p><p>    </url></p><p>
  15. </p><p>........</p><p>
  16. </p><p></urlset></p>
复制代码

上面是通常情况下sitemap.xml的写法,其实用dw替换能替换掉大部分的内容,不规则的主要是<lastmod>2020-04-11</lastmod>和<priority>0.8</priority>中有不规则的数字,那么就先把他们改成规则的数字就好了,首先把-横线替换掉,所有<lastmod></lastmod>中间得到一串数字。
来源地址:https://www.10soo.com/show-909.html

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表