안녕하세요! 퇴사 부검을 쓸 시간도 없이... 시간이 정말 빠르게 지나갔습니다^^;;;
이번 달의 책 리뷰는 SRE with Java Microservices(한국어 제목 자바 마이크로서비스를 활용한 SRE) 입니다.
책 사진부터 보시죠.

이 책은 한 마디로, __ 입니다.
Java 기반의 애플리케이션을 운영하는 팀을 위한 AtoZ 가이드북입니다.
이 책은 __ 인/한 사람들에게 추천하고 싶습니다.
이 책은, 책의 타깃이 SRE activities이다 보니 기본적으로 엔터프라이즈 레벨의 Java 애플리케이션을 개발 및 운영하는
개발팀을 위한 책입니다. 하지만, 저 개인적으로는 모든 Java 개발자가 읽어 보아도 좋을 것이라 생각합니다.
애플리케이션이 "정상인 상태"를 어떻게 정의하는지를 확인하는 과정에서, Java 애플리케이션의 특성에 대해
이해하는 기회를 제공하기 때문입니다. CPU, Memory, healthcheck 200으로만 상태를 확인하는 과거의 망령은 물러나라!
이 책을 통해 __(한) 정보를 얻어가실 수 있습니다.
이 책의 독자께서는, Java 애플리케이션에 특화된(하지만 많은 내용이 Java에 한정되지 않습니다) SRE activities의 개념과
실천에 대한 지식을 얻어 가실 수 있겠습니다. 개인적으로는 소규모의 개발팀이 다같이 읽기에 정말 좋은 책이 될 거라 생각하는데요,
그 이유는 소규모 개발단에서 놓치기 쉬운, 서비스가 죽기 전 보내는 징조들을 소개해 주고 있기 때문입니다.
과거의 저도 마찬가지이고, 지금도 많은 회사들에서 일정 시간마다 REST endpoint로 healthcheck 요청을 날리고,
200 OK가 떨어지면 아무런 관찰을 하지 않습니다. 시계열 모니터링도 CPU utilization이 전부인 곳도 정말 많습니다.
전자나 후자나 뭔가 이상하다는 낌새가 느껴지고, 급하게 랩탑을 열 때 쯤이면
서버가 죽었거나, 응답이 밀릴 대로 밀린 상태가 되어 있습니다.
그런 가슴아픈 상황을 방지하고자 이 책에서는 "그 외"의 metric들과 이를 수집하는 방법
(Java 애플리케이션 및 인프라 환경에 맞는 메트릭용 태그를 안내한다든가)을 상세하게 가이드합니다.
그리고 장애상황을 설계단에서부터 방지할 수 있는 트래픽 분산형 아키텍쳐도 함께 제시합니다(이 부분이 엄청 상세하지는 않음)
읽으면서 저도 jvm을 겉핥기도 아니고 겉 블루투스 정도로만 써 왔다는 걸 잘 알게 되었습니다^^
총평
장시간의 전면 장애를 겪어 보면 SRE 활동이 얼마나 중요한지 깨닫게 됩니다.
장애 회고를 하면서 재발방지를 하자고 다짐을 하게 됩니다.
"뭘, 어떻게 모니터링할건데?"
회의실에 침묵이 찾아옵니다.
...라는 상황의 팀이라면 강력 추천합니다.
이미 SRE 조직이 갖추어져 있고, 인력이 있다면 굳이 읽으실 필요는 없습니다.
다만, SRE에 대한 개념 자체가 흐릿한 경우라면 저 "뭘, 어떻게" 에 대한 기본 가이드라인을 제시해 줄 수 있는 책입니다.
이 서평은 한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 작성된 서평입니다.
(도서는 제공받았으나 저자와는 어떠한 관계도 없으며, 서평의 내용은 모두 개인의 의견으로 작성되었습니다.)
다음 달에는 제발 쿠베책을 받아볼 수 있을지..오늘부터 기도 들어갑니다. 쿠버네티스 책 받고싶어요 잉잉
** 이 블로그에 작성 또는 공유되는 모든 콘텐츠는 전적으로 저 개인의 의견만 반영되어 있으며,
어떤 경우에도 이 블로그의 내용은 제가 근무하는 회사의 입장을 대변하지 않습니다. **
'Book reviews' 카테고리의 다른 글
[리뷰] SRE를 위한 시스템 설계와 구축 (0) | 2022.08.28 |
---|---|
[리뷰] 클라우드 네이티브 애플리케이션 디자인 패턴 (0) | 2022.07.24 |
[리뷰] 혼자 공부하는 얄팍한 코딩지식 (1) | 2022.06.26 |
[리뷰] 일잘러의 비밀, 엑셀 대신 파이썬으로 업무 자동화하기 (1) | 2022.05.29 |
[리뷰] 팀장부터 CEO까지 알아야 할 기업 정보보안 가이드 (0) | 2022.02.21 |