小知识:Nginx实现非套路镜像站的踩坑记录

缘起

前几天发现一个电子书非常棒,但是是 github 上的,总是打不开,而正好我的服务器是在香港的,所以我想做一个镜像。下面给大家提供了两种方案,下面话不多说了,来一起看看详细的介绍吧。

方案一

做了如下配置:

?
1
2
3
4
5
6
7
8
location ^~ /book-c/
{
proxy_pass http://akaedu.github.io/book/;
proxy_redirect off;
proxy_http_version 1.1;
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection “upgrade”;
}

浏览了下,都 ok,但是有几点不太好

如果以后我发现类似的书很好,都要增加一个 nginx 配置。 如果原始网站完全无法访问了,我这边也挂了,不能缓存到我本地服务器。 我想修改网页内容也不太好操作,比如我想加上原作者的版权和原始访问地址说明等。

完全采集过来,我也懒得写脚本去跑,最终走上了下面这段踩坑路。

尝试改进

所以尝试了如下做法

?
1
rewrite ^/book-(.*?)/  /index.php?m=Book&a=show&book=$1 last;
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
class BookAction extends Action{
private $uri;
public function show(){
$book = $_GET[book];
if (!method_exists($this,$book)){
$this->error404();
}
try{
$this->$book();
}catch (Exception $e){
$this->error404();
}
}
/**
* http://akaedu.github.io/book/
*/
private function c(){
$baseUrl = “http://akaedu.github.io/book/”;
$url = $baseUrl.$this->uri;
echo file_get_contents($url);
}
}

又遇到了一个问题,当我访问 https://mengkang.net/book-c/styles.css 则无法 rewrite 匹配到了。

原因是 nginx 优先匹配了

?
1
2
3
4
location ~ .*\.(js|css)?$
{
expires 12h;
}

正则匹配优先级关系:http://www.tuohang.net/article/38561.html

方案二

添加一条

?
1
2
3
4
location ~ /book-.*?/
{
rewrite ^/book-(.*?)/ /index.php?m=Book&a=show&book=$1 last;
}

location ^~ 不支持正则的,所以没法用

采坑小记

如果是使用的 location ~ /book-.*/ ,根据正则就是贪婪模式,那么

https://mengkang.net/book-c/images/sortsearch.theta.png

匹配到的就是 /book-c/images/ ,也就是说rewrite里面的 $1 就是 c/images ,这样和我们的预期相悖的。

故障:无法匹配到 css 文件

?
1
2
3
4
5
6
7
8
9
$ wget -S https://mengkang.net/book-c/styles.css -O /dev/null
–2018-02-01 13:13:36– https://mengkang.net/book-c/styles.css
Resolving mengkang.net… 203.195.188.207
Connecting to mengkang.net|203.195.188.207|:443… connected.
HTTP request sent, awaiting response…
HTTP/1.1 200 OK
Server: nginx
Date: Thu, 01 Feb 2018 05:13:38 GMT
Content-Type: text/html; charset=UTF-8

所有内容的输出默认都是 text/html ,那么也就是我需要对文件的后缀判断咯。 感觉自己给自己挖坑,不如直接采集得了

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
<?php
class BookAction extends Action{
const BOOK_SAVE_DIR = “/data/book/”;
private $uri;
private $baseUrl;
private $book;
private $bookname;
public function show(){
$book = $_GET[book];
$this->book = $book;
$this->uri = str_replace(“/book-{$book}/”,””,$_SERVER[REQUEST_URI]);
if (!method_exists($this,$book)){
$this->error404();
}
try{
$this->$book();
}catch (Exception $e){
$this->error404();
}
}
/**
* http://akaedu.github.io/book/
*/
private function c(){
$this->baseUrl = “http://akaedu.github.io/book/”;
$url = $this->baseUrl.$this->uri;
$this->output($url);
}
private function output($url){
$ext = pathinfo($url,PATHINFO_EXTENSION);
if (!$ext) {
$url = $url.”/index.html”;
$ext = “html”;
}
switch ($ext){
case “css”:
header(“Content-Type: text/css; charset=UTF-8”);
break;
default:
header(“Content-Type: text/html; charset=UTF-8”);
break;
}
// 如果已经缓存
$filename = self::BOOK_SAVE_DIR.$this->book.”/”.str_replace($this->baseUrl,””,$url);
if (file_exists($filename)){
$data = file_get_contents($filename);
}else{
$data = file_get_contents($url);
$dir = dirname($filename);
if (!file_exists($dir)){
mkdir($dir,755,true);
}
file_put_contents($filename,$data);
}
// 增加原始版权说明
echo $data;
}
}

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对服务器之家的支持。

原文链接:http://mengkang.net/1152.html

声明: 猿站网有关资源均来自网络搜集与网友提供,任何涉及商业盈利目的的均不得使用,否则产生的一切后果将由您自己承担! 本平台资源仅供个人学习交流、测试使用 所有内容请在下载后24小时内删除,制止非法恶意传播,不对任何下载或转载者造成的危害负任何法律责任!也请大家支持、购置正版! 。本站一律禁止以任何方式发布或转载任何违法的相关信息访客发现请向站长举报,会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。本网站的资源部分来源于网络,如有侵权烦请发送邮件至:2697268773@qq.com进行处理。
建站知识

小知识:在 FreeDOS 中设置和使用环境变量

2023-4-20 3:10:04

建站知识

小知识:关于Linux操作系统下终端乱码的完美解决方法

2023-4-20 3:18:24

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索