CS
-
headers 설정할 때 User-Agent 문자열을 가져오는 법CS/네트워크 2024. 7. 3. 02:24
웹 스크래핑 공부할 때 주어지는 교안 중 User-Agent 뒤에 오는 문자열은 어디서 오는지 궁금했다. 그전에 User-Agent란?HTTP 요청 헤더는 클라이언트(브라우저or스크립트)가 -> 서버에 요청을 보낼 때 포함하는 추가 정보이다.headers는 사전(dictionary)형태로 구성되어 있고 'User-Agent' 라는 키를 포함한다. 여기서 User-Agent라는 키 = 필드(실제 문자열값=클라이언트의 소프트웨어 및 하드웨어 정보)는웹서버가 요청을 보낸 "클라이언트의 정보를 식별"하게 돕는다. 그러면 서버는 특정 클라이언트에 맞는 최적화된 응답을 제공할 수 있다.웹스크래핑 도구에서는 User-Agent를 설정해서 해당 요청을 브라우저에서 보낸 것처럼 보이게(보냈음을 알게) 해야하는데, 그 이..
-
0829. HTTP 서버CS/네트워크 2023. 8. 29. 18:12
📍HTTP 문자 기반의 프로토콜로, html 문서를 전달하기 위함이다. 여기서 문자는 ASCII 문자를 말한다. *한글 처리시 문제가 생길 수 있다. TCP가 구축된 상태에서 시작된다.(localhost:8080 부분 - 소켓역할) 포트번호 : 80 (default) 서버 주소 뒤에 콜론과 포트번호를 입력하면 해당 포트로 접속하겠다는 뜻이고, 생략하면 default로 접속하겠다는 듯이다 https의 s는 security로 보안이 더 강화된 것인데 요즘 많이 쓰는 형태이다. 접속이 되면 하나의 요청을 보내고, 서버는 이 요청을 보고 무엇인지 분석 파악 후 응답을 메모한다. 이후 연결을 끊는다. 접속에 대한 상태를 유지하지 않는 "statelss" 이다. 이러한 특성으로 웹서버의 구조가 간단하고 안정적인 것..