Files
TCP-IP-NetworkNote/ch24/README.md
riba2534 0d17c981ee chore: 将所有外部图片本地化到仓库
- 下载 110 张外部图片到根目录 images/ 文件夹
- 更新所有 README.md 中的图片引用为统一路径 images/xxx.png
- 55 张图片成功下载(PNG 格式)
- 55 张失效图片创建占位文件(SVG/PNG)
- 移除所有外部图片链接依赖

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-05 16:34:13 +08:00

263 lines
9.9 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
## 第 24 章 制作 HTTP 服务器端
本章代码,在[TCP-IP-NetworkNote](https://github.com/riba2534/TCP-IP-NetworkNote)中可以找到。
### 24.1 HTTP 概要
本章将编写 HTTPHyperText Transfer Protocol超文本传输协议服务器端即 Web 服务器端。
#### 24.1.1 理解 Web 服务器端
web服务器端就是要基于 HTTP 协议,将网页对应文件传输给客户端的服务器端。
#### 24.1.2 HTTP
无状态的 Stateless 协议
<!-- 原图片链接已失效: https://i.loli.net/2019/02/07/5c5bc6973a4d0.png -->
<!-- 图示HTTP 无状态协议,服务器端响应客户端请求后立即断开连接 -->
从上图可以看出服务器端响应客户端请求后立即断开连接。换言之服务器端不会维持客户端状态。即使同一客户端再次发送请求服务器端也无法辨认出是原先那个而会以相同方式处理新请求。因此HTTP 又称「无状态的 Stateless 协议」。
#### 24.1.3 请求消息Request Message的结构
下面是客户端向服务端发起请求消息的结构:
<!-- 原图片链接已失效: https://i.loli.net/2019/02/07/5c5bcbb75202f.png -->
<!-- 图示HTTP 请求消息结构(请求行、消息头、消息体) -->
从图中可以看出,请求消息可以分为请求行、消息头、消息体 3 个部分。其中,请求行含有请求方式(请求目的)信息。典型的请求方式有 GET 和 POST GET 主要用于请求数据POST 主要用于传输数据。为了降低复杂度,我们实现只能响应 GET 请求的 Web 服务器端下面解释图中的请求行信息。其中「GET/index.html HTTP/1.1」 具有如下含义:
> 请求GETindex.html 文件,通常以 1.1 版本的 HTTP 协议进行通信。
请求行只能通过 1 行line发送因此服务器端很容易从 HTTP 请求中提取第一行,并分别分析请求行中的信息。
请求行下面的消息头中包含发送请求的浏览器信息、用户认证信息等关于 HTTP 消息的附加信息。最后的消息体中装有客户端向服务端传输的数据,为了装入数据,需要以 POST 方式发送请求。但是我们的目标是实现 GET 方式的服务器端,所以可以忽略这部分内容。另外,消息体和消息头之间以空行隔开,因此不会发生边界问题。
#### 24.1.4 响应消息Response Message的结构
下面是 Web 服务器端向客户端传递的响应信息的结构。从图中可以看出,该响应消息由状态行、头信息、消息体等 3 个部分组成。状态行中有关于请求的状态信息,这是与请求消息相比最为显著的区别。
<!-- 原图片链接已失效: https://i.loli.net/2019/02/07/5c5bf9ad1b5f9.png -->
<!-- 图示HTTP 响应消息结构(状态行、头信息、消息体) -->
第一个字符串状态行中含有关于客户端请求的处理结果。例如,客户端请求 index.html 文件时,表示 index.html 文件是否存在、服务端是否发生问题而无法响应等不同情况的信息写入状态行。图中的「HTTP/1.1 200 OK」具有如下含义
- 200 OK : 成功处理了请求!
- 404 Not Found : 请求的文件不存在!
- 400 Bad Request : 请求方式错误,请检查!
消息头中含有传输的数据类型和长度等信息。图中的消息头含有如下信息:
> 服务端名为 SimpleWebServer ,传输的数据类型为 text/html。数据长度不超过 2048 个字节。
最后插入一个空行后,通过消息体发送客户端请求的文件数据。以上就是实现 Web 服务端过程中必要的 HTTP 协议。
### 24.2 实现简单的 Web 服务器端
#### 24.2.1 实现基于 Windows 的多线程 Web 服务器端
暂略
#### 24.2.2 实现基于 Linux 的多线程 Web 服务器端
下面是代码:
- [webserv_linux.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch24/webserv_linux.c)
```c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <pthread.h>
#define BUF_SIZE 1024
#define SMALL_BUF 100
void *request_handler(void *arg);
void send_data(FILE *fp, char *ct, char *file_name);
char *content_type(char *file);
void send_error(FILE *fp);
void error_handling(char *message);
int main(int argc, char *argv[])
{
int serv_sock, clnt_sock;
struct sockaddr_in serv_adr, clnt_adr;
int clnt_adr_size;
char buf[BUF_SIZE];
pthread_t t_id;
if (argc != 2)
{
printf("Usage : %s <port>\n", argv[0]);
exit(1);
}
serv_sock = socket(PF_INET, SOCK_STREAM, 0);
memset(&serv_adr, 0, sizeof(serv_adr));
serv_adr.sin_family = AF_INET;
serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_adr.sin_port = htons(atoi(argv[1]));
if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
error_handling("bind() error");
if (listen(serv_sock, 20) == -1)
error_handling("listen() error");
while (1)
{
clnt_adr_size = sizeof(clnt_adr);
clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &clnt_adr_size);
printf("Connection Request : %s:%d\n",
inet_ntoa(clnt_adr.sin_addr), ntohs(clnt_adr.sin_port));
pthread_create(&t_id, NULL, request_handler, &clnt_sock);
pthread_detach(t_id);
}
close(serv_sock);
return 0;
}
void *request_handler(void *arg)
{
int clnt_sock = *((int *)arg);
char req_line[SMALL_BUF];
FILE *clnt_read;
FILE *clnt_write;
char method[10];
char ct[15];
char file_name[30];
clnt_read = fdopen(clnt_sock, "r");
clnt_write = fdopen(dup(clnt_sock), "w");
fgets(req_line, SMALL_BUF, clnt_read);
if (strstr(req_line, "HTTP/") == NULL)
{
send_error(clnt_write);
fclose(clnt_read);
fclose(clnt_write);
return;
}
strcpy(method, strtok(req_line, " /"));
strcpy(file_name, strtok(NULL, " /"));
strcpy(ct, content_type(file_name));
if (strcmp(method, "GET") != 0)
{
send_error(clnt_write);
fclose(clnt_read);
fclose(clnt_write);
return;
}
fclose(clnt_read);
send_data(clnt_write, ct, file_name);
}
void send_data(FILE *fp, char *ct, char *file_name)
{
char protocol[] = "HTTP/1.0 200 OK\r\n";
char server[] = "Server:Linux Web Server \r\n";
char cnt_len[] = "Content-length:2048\r\n";
char cnt_type[SMALL_BUF];
char buf[BUF_SIZE];
FILE *send_file;
sprintf(cnt_type, "Content-type:%s\r\n\r\n", ct);
send_file = fopen(file_name, "r");
if (send_file == NULL)
{
send_error(fp);
return;
}
//传输头信息
fputs(protocol, fp);
fputs(server, fp);
fputs(cnt_len, fp);
fputs(cnt_type, fp);
//传输响应体数据
while (fgets(buf, BUF_SIZE, send_file) != NULL)
{
fputs(buf, fp);
fflush(fp);
}
fflush(fp);
fclose(fp);
}
char *content_type(char *file)
{
char extension[SMALL_BUF];
char file_name[SMALL_BUF];
strcpy(file_name, file);
strtok(file_name, ".");
strcpy(extension, strtok(NULL, "."));
if (!strcmp(extension, "html") || !strcmp(extension, "htm"))
return "text/html";
else
return "text/plain";
}
void send_error(FILE *fp)
{
char protocol[] = "HTTP/1.0 400 Bad Request\r\n";
char server[] = "Server:Linux Web Server \r\n";
char cnt_len[] = "Content-length:2048\r\n";
char cnt_type[] = "Content-type:text/html\r\n\r\n";
char content[] = "<html><head><title>NETWORK</title></head>"
"<body><font size=+5><br>发生错误! 查看请求文件名和请求方式!"
"</font></body></html>";
fputs(protocol, fp);
fputs(server, fp);
fputs(cnt_len, fp);
fputs(cnt_type, fp);
fflush(fp);
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
```
编译运行:
```shell
gcc webserv_linux.c -D_REENTRANT -o web_serv -lpthread
./web_serv 9190
```
结果:
<!-- 原图片链接已失效: https://i.loli.net/2019/02/07/5c5c107deba11.png -->
<!-- 图示HTTP 服务器运行截图 -->
<!-- 原图片链接已失效: https://i.loli.net/2019/02/07/5c5c19cbb3718.png -->
<!-- 图示:浏览器访问 HTTP 服务器截图 -->
经过测试,这个简单的 HTTP 服务器可以正常的显示出页面。
### 24.3 习题
> 以下答案仅代表本人个人观点,可能不是正确答案。
1. **下列关于 Web 服务器端和 Web 浏览器端的说法错误的是**
答:**选项 5 是错误的**。
1. Web 浏览器是通过自身创建的套接字连接服务端的客户端
2. Web 服务器端通过 TCP 套接字提供服务,因为它将保持较长的客户端连接并交换数据
3. 超文本与普通文本的最大区别是其具有可跳转的特性
4. Web 浏览器可视为向浏览器提供请求文件的文件传输服务器端
5. **除 Web 浏览器外,其他客户端都无法访问 Web 服务器端。(错误:任何能发起 HTTP 请求的客户端都可以访问 Web 服务器端,如 curl、wget、编程实现的 HTTP 客户端等)**
2. **下列关于 HTTP 协议的描述错误的是**
答:**选项 1 是错误的**。
1. **HTTP 协议是无状态的 Stateless 协议,不仅可以通过 TCP 实现,还可以通过 UDP 来实现。(错误:标准 HTTP 协议是基于 TCP 的HTTP/3 基于 QUIC 协议即 UDP 实现,但传统意义上 HTTP 是基于 TCP 的)**
2. HTTP 协议是无状态的 Stateless 协议,因为其在 1 次请求和响应过程完成后立即断开连接。因此,如果同一服务器端和客户端需要 3 次请求及响应,则意味着需要经过 3 次套接字的创建过程。
3. 服务端向客户端传递的状态码中含有请求处理结果的信息。
4. HTTP 协议是基于因特网的协议因此为了同时向大量客户端提供服务HTTP 协议被设计为 Stateless 协议。