옥수수, 기록
[네트워크심화] HTTP 본문
HTTP의 역사

HTTP/1.1, HTTP/2는 TCP 기반이며 HTTP/3는 UDP 기반 프로토콜
HTTP의 특징
- 클라이언트 서버 구조
- Request Response 구조
- 클라이언트는 서버에 요청을 보내고 응답을 대기
- 서버가 요청에 대한 결과를 만들어 응답
- 무상태 프로토콜(Stateless)
- 서버가 클라이언트의 상태를 보존하지 않음
- 장점: 서버 확장성 높음(스케일 아웃)
- 단점: 클라이언트가 추가 데이터 전송
- 서버가 클라이언트의 상태를 보존하지 않음
- 비연결성(Connectionless)
- TCP/IP는 기본적으로 연결을 유지, 서버의 자원을 계속 소모
- HTTP는 실제로 요청을 주고 받을 때만 연결을 유지, 최소한의 자원으로 서버 유지
- 일반적으로 초 단위 이하의 빠른 속도로 응답
- 비연결성의 한계
- TCP/IP 연결을 새로 맺어야 함 - 3way handshake 시간 추가
- 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 JavaScript, CSS, 추가 이미지 등 수 많은 자원이 함께 다운로드
- 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
- HTTP초기 각각 자원을 다운로드하기 위해 연결과 종료를 반복해야 했음
- HTTP 지속 연결에서는 연결이 이루어지고 각각의 자원들을 요청, 모든 요청에 대한 응답이 돌아온 후에 연결 종료
- HTTP/2, HTTP/3에서 더 많은 최적화
- HTTP 메세지
- 단순함, 확장 가능
- Stateful(상태유지)과 Stateless(무상태)의 비교(카페에서 음료를 주문한다고 가정)
- 상태유지 : 주문 중간에 다른 점원으로 바뀔경우 상태 정보를 다른 점원에게 알려줘야함(점원이 정보를 갖고 있음)
- 무상태 : 중간에 다른 점원으로 바뀌어도 된다.(고객이 정보를 갖고 있음)
- 갑자기 고객이 증가해도 점원 대거 투입 가능
- 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입 가능
- 무상태는 응답 서버를 쉽게 바꿀 수 있다.
- 무상태의 한계
- 모든 것을 무상태로 설계할 수 있는 경우도 있고 없는 경우도 있음
- 가능 : 로그인이 필요없는 단순한 서비스 소개 화면
- 불가능 : 로그인 - 유저의 상태를 유지해야 하기 때문
- 로그인 상태를 서버에 유지(e.g. 브라우저 쿠키, 서버 세션)
- 상태 유지는 최소한만 사용단순함, 확장 가능
HTTP 헤더
HTTP 헤더와 바디

- 메세지 본문(message body)를 통해 표현 데이터 전달
- 메세지 본문 = 페이로드(payload)
- 표현은 요청이나 응답에서 전달할 실제 데이터
- 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등
HTTP 헤더
형식

용도

- HTTP 전송에 필요한 모든 부가 정보
- e.g. 메세지 바디의 내용, 메세지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보 …
- 표준 헤더가 너무 많음
- 필요 시 임의의 헤더 추가 가능
- e.g. Helloworld: hihi
표현 헤더

- Content-Type: 표현 데이터의 형식
- Content-Encoding: 표현 데이터의 압축 방식
- Content-Language: 표현 데이터의 자연 언어
- Content-Length: 표현 데이터의 길이
- 표현 헤더는 요청, 응답 둘 다 사용
Content-Type
표현 데이터의 형식 설명

- 미디어 타입, 문자 인코딩
- e.g.
- Text/html; charset=uft-8
- application/json
- Image/png
- 레퍼런스 링크
Content-Encoding

- 표현 데이터를 압축하기 위해 사용
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- e.g.
- gzip
- deflate
- identity
- 레퍼런스 링크
Content-Language
표현 데이터의 자연 언어

- 표현 데이터의 자연 언어를 표현
- e.g.
- ko
- en
- en-US
- 레퍼런스 링크
Content-Length
표현 데이터의 길이

- 바이트 단위
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨
- 현재는 Content-Encoding을 사용하며 Transfer-Encoding을 사용하는 경우 chunked의 방식으로 사용
- chunked 방식의 인코딩은 많은 양의 데이터를 분할하여 보내어 전체 데이터의 크기를 알 수 없음
- 표현 데이터의 길이를 명시해야하는 Content-Length 헤더와 함께 사용 불가
- chunked 방식의 인코딩은 많은 양의 데이터를 분할하여 보내어 전체 데이터의 크기를 알 수 없음
- 현재는 Content-Encoding을 사용하며 Transfer-Encoding을 사용하는 경우 chunked의 방식으로 사용
- 레퍼런스 링크
HTTP 요청 / 응답 주요 헤더

요청(Request)에서 사용되는 헤더
From: 유저 에이전트의 이메일 정보
- 일반적으로 잘 사용하지 않음
- 검색 엔진에서 주로 사용
- 요청에서 사용
Referer: 이전 웹 페이지 주소
- 현재 요청된 페이지의 이전 웹 페이지 주소
- A → B로 이동하는 경우 B를 요청할 때 Referer: A를 포함해서 요청
- Referer를 사용하면 유입경로 수집 가능
- 요청에서 사용
- referer는 단어 referrer의 오탈자이지만 스펙으로 굳어짐
User-Agent: 유저 에이전트 애플리케이션 정보
- 클라이언트의 애플리케이션 정보(웹 브라우저 정보, 등등)
- 통계 정보
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- 요청에서 사용
- e.g.
- user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/ 537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36
Host: 요청한 호스트 정보(도메인)
- 요청에서 사용
- 필수 헤더
- 하나의 서버가 여러 도메인을 처리해야 할 때 호스트 정보를 명시하기 위해 사용
- 하나의 IP 주소에 여러 도메인이 적용되어 있을 때 호스트 정보를 명시하기 위해 사용

Origin: 서버로 POSt 요청을 보낼 때, 요청을 시작한 주소를 나타냄
- 여기서 요청을 보낸 주소와 받는 주소가 다르면 CORS 에러가 발생
- 응답 헤더의 Access-Control-Allow-Origin와 관련
Authorization: 인증 토큰(e.g. JWT)을 서버로 보낼 때 사용하는 헤더
- “토큰의 종류(e.g. Basic) + 실제 토큰 문자”를 전송
- e.g.
- Authorization: Basic YWxhZGRpbjpvcGVuc2VzYW1l
응답(Response)에서 사용되는 헤더
Server: 요청을 처리하는 ORIGIN 서버의 소프트웨어 정보
- 응답에서 사용
- e.g.
- Server: Apache/2.2.22 (Debian)
- Server: nginx
Date: 메시지가 발생한 날짜와 시간
- 응답에서 사용
- e.g.
- Date: Tue, 15 Nov 1994 08:12:31 GMT
Location: 페이지 리디렉션
- 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 리다이렉트(자동 이동)
- 201(Created): Location 값은 요청에 의해 생성된 리소스 URI
- 3xx(Redirection): Location 값은 요청을 자동으로 리디렉션하기 위한 대상 리소스를 가리킴
Allow: 허용 가능한 HTTP 메서드
- 405(Method Not Allowed)에서 응답에 포함
- e.g.
- Allow: GET, HEAD, PUT
Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
- 503(Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
- e.g.
- Retry-After: Fri, 31 Dec 2020 23:59:59 GMT(날짜 표기)
- Retry-After: 120(초 단위 표기)
레퍼런스 링크: List of HTTP headers
콘텐츠 협상 헤더
- Accept: 클라이언트가 선호하는 미디어 타입 전달
- Accept-Charset: 클라이언트가 선호하는 문자 인코딩
- Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
- Accept-Language: 클라이언트가 선호하는 자연 언어

- 한국어 브라우저에서 특정 웹사이트에 접속했을 때 콘텐츠 협상(Accept-Language)가 적용되지 않았다면
- 서버는 요청으로 받은 우선순위가 없으므로 기본 언어로 설정된 영어로 응답
- 클라이언트에서 Accept-Language로 KO를 작성해 요청한다면
- 한국어로 된 응답을 돌려줌
- 클라이언트는 한국어를 요청했지만 서버가 한국어를 지원하지 않고 기본 언어가 독일어로 설정되어 있다면

- Quality Value(q) 값 사용
- 0~1, 클수록 높은 우선순위
- 생략하는 경우 1
- Accept-Language: ko-KR; ko;q=0.9, en-US;q=0.8,en;q=0.7 (ko-KR에서는 ;q=1 생략)
- 레퍼런스 링크
- 협상 헤더는 요청시에만 사용