使用阿里云CDN部署博客404 Page优化
专栏文章
- Hugo 使用介绍
- 网站 SEO 教程
- 使用Jekyll在Github上搭建博客 -- 环境安装
- 基于Github Action自动发布git代码到CDN
- 采用 Algolia 作为 Hugo 搜索方案
- 使用Jekyll在Github上搭建博客 -- 如何将博客上传至github
- 如何在网页中插入关键词
- Hugo/静态网站搜索方案
- 使用阿里云CDN部署博客404 Page优化(当前)
- 图片格式转化和压缩
- 使用Jekyll在Github上搭建博客 -- 分页实现
- 使用Jekyll在Github上搭建博客 -- 子菜单的实现
- Jekyll 页面 liquid 语法介绍
- 采用Docker和解决Github Pages禁止百度爬虫的问题
- jekyll Web服务器列目录漏洞
- Jekyll发布文章时字符乱码解决办法 -- invalid byte sequence in GBK
- Staticgen
- Staticgen
- 静态页面发布服务器
- Surge 使用介绍
- Gitbook 使用
在使用阿里云CDN部署博客后,因页面重构导致URL地址变动,进而搜索引擎经常跳转到 404 Page,损失大量流量,本文提供一种获取跳转到404的原始页面。
原理
若访问的页面不存在,会在 CDN 的日志中出现 MISS 关键字,并且返回 http code 为 302。
脚本
- 从阿里云cdn下载日志
- 执行如下脚本获取错误的url地址
#!/bin/bash
gzip *.gz -d
cat www.xiexianbin.*0000 | grep -v "wp-includes" | grep " 302 " | grep MISS | awk -F " " '{print $8}' | sed 's/"$//' | sort -r | uniq -c | sed 's/https/http/' | sed 's/www.xiexianbin.cn/localhost:1313/'专栏文章
- Hugo 使用介绍
- 网站 SEO 教程
- 使用Jekyll在Github上搭建博客 -- 环境安装
- 基于Github Action自动发布git代码到CDN
- 采用 Algolia 作为 Hugo 搜索方案
- 使用Jekyll在Github上搭建博客 -- 如何将博客上传至github
- 如何在网页中插入关键词
- Hugo/静态网站搜索方案
- 使用阿里云CDN部署博客404 Page优化(当前)
- 图片格式转化和压缩
- 使用Jekyll在Github上搭建博客 -- 分页实现
- 使用Jekyll在Github上搭建博客 -- 子菜单的实现
- Jekyll 页面 liquid 语法介绍
- 采用Docker和解决Github Pages禁止百度爬虫的问题
- jekyll Web服务器列目录漏洞
- Jekyll发布文章时字符乱码解决办法 -- invalid byte sequence in GBK
- Staticgen
- Staticgen
- 静态页面发布服务器
- Surge 使用介绍
- Gitbook 使用
最近更新
最新评论