사이트 안정성 엔지니어

아이콘
빌더 아이콘
아이콘
클립보드 아이콘
아이콘
퍼즐 아이콘
관련 역할: SRE 엔지니어, 데브옵스 엔지니어(SRE), 시스템 신뢰성 엔지니어, 운영 엔지니어(SRE), 인프라 엔지니어(SRE), 사이트 운영 엔지니어, 생산 엔지니어(SRE), 플랫폼 엔지니어(SRE), 사이트 가용성 엔지니어, 신뢰성 엔지니어

스포트라이트

유사한 제목

SRE 엔지니어, 데브옵스 엔지니어(SRE), 시스템 안정성 엔지니어, 운영 엔지니어(SRE), 인프라 엔지니어(SRE), 사이트 운영 엔지니어, 생산 엔지니어(SRE), 플랫폼 엔지니어(SRE), 사이트 가용성 엔지니어, 신뢰성 엔지니어

직무 설명

데브옵스가 탄생하기 전, Google은 문제가 발생했지만 해결 방법을 몰랐습니다. 대규모 사이트를 운영 중이었지만 사이트를 개선하고 더 확장해야 했습니다. 해결책은 무엇이었을까요? Google은 소프트웨어 엔지니어 팀에 문제를 해결하도록 지시했고, 이들의 노력으로 사이트 안정성 엔지니어링(SRE)의 기초가 마련되었습니다. 오늘날 이 소프트웨어 대기업은 SRE를 "운영을 소프트웨어 문제인 것처럼 취급할 때 얻을 수 있는 것"이라고 정의합니다.

SRE 관행은 매우 유익하여 다른 대기업에서도 채택되었고, 시간이 지남에 따라 개선 및 추가되어 오늘날 DevOps의 많은 특성을 공유하지만 몇 가지 중요한 차이점이 있는 커리어 분야로 발전했습니다. 둘 다 개발과 운영의 중간에 존재하지만, SRE는 자동화에 더 중점을 둡니다. 실제로 Google은 엔지니어의 목적을 "업무에서 벗어나는 방법을 자동화하는 것"이라고 설명한 적이 있습니다.

조직마다 SRE를 수행하는 방식이 다르기 때문에 생산 엔지니어링 또는 인프라 엔지니어링이라고 부르기도 합니다. 명칭이 무엇이든 결국 엔지니어의 역할은 웹사이트 안정성을 개선하고, 인시던트 관리 KPI(핵심 성과 지표)를 사용하고, 코드를 작성하고, 서비스를 구축하고, 수동 프로세스를 자동화하기 위해 지속적으로 노력하는 팀원이 되는 것입니다. 사이트는 24시간 가동되기 때문에 SRE는 필요할 때마다 대응하기 위해 대기 상태로 근무하는 경우가 많습니다. 

커리어의 보람 있는 측면
  • 프로젝트에 대한 큰 그림 개요로 작업하기
  • 팀 간의 중요한 가교 역할 
  • 프로세스 개선 및 조직 수익 증대 지원
  • 넉넉한 재정적 보상
$117,295
내부 특종
직무 책임

근무 일정

SRE는 보수가 좋은 직업 분야이므로 풀타임으로 근무하면 높은 급여를 받을 수 있습니다! ParkMyCloud의 설명에 따르면 사이트 안정성은 본질적으로 비즈니스 가용성과 동일합니다. 즉, 비용이 많이 드는 다운타임을 최소화하는 것은 사이트 안정성 엔지니어의 몫입니다. 이는 근무 시간 외 근무 또는 문제에 신속하게 대응하기 위한 대기 상태로 해석될 수 있습니다. 


일반적인 업무

  • 운영 및 지원과 관련된 소프트웨어 생성 또는 개선
  • 프로세스 최적화 및 자동화
  • 릴리스 엔지니어링 일관성 관행 보장
  • 지원 에스컬레이션 해결 및 최소화하기 
  • 런북을 만드는 등 나중에 참조할 수 있도록 새로 학습한 정보를 캡처하고 문서화합니다. 공유 가능한 지식의 '사일로화' 또는 비축 방지
  • 문제 해결
  • 인시던트 검토(사후 검토, 회고 또는 근본 원인 분석이라고도 함)를 수행하여 책임을 묻지 않고 문제가 발생한 원인을 파악합니다. 

추가 책임

  • 문제 해결 및 기타 인시던트 대응 문제를 위한 대기 근무
  • 조직 프로토콜 준수 보장 
  • 소프트웨어 개발 수명 주기 내에서 문제를 해결하고 향후 유사한 문제를 완화하기 위한 실행 항목 목록 만들기
업무에 필요한 기술

소프트 스킬
 

  • 팀 간의 협업을 촉진하는 기능
  • 분석적 문제 해결
  • 디테일에 대한 관심
  • 고객 서비스 
  • 공감
  • 유연성
  • 목표 중심
  • 고도로 조직적이며 시간 관리 능력이 뛰어남
  • 조사적이고 호기심 많은
  • 리더십 및 관리 기술
  • 객관성
  • 프로세스 중심
  • 품질 보증 사고방식
  • 강력한 커뮤니케이션 기술

기술 능력

SRE는 다음과 관련된 몇 가지 기술을 보유해야 합니다:

  • 빌드 자동화 도구
  • 빌드 구성 언어
  • 컴파일러
  • 데이터베이스
  • 분산 시스템 설계
  • 시스템 관리, 개발, 구성 관리, 통합 테스트와 관련된 도메인 지식
  • 일반 소스 코드 관리
  • 설치 관리자
  • 네트워킹
  • 운영 체제
  • 패키지 관리자
  • 보안
  • 소프트웨어 엔지니어링
다양한 유형의 조직
  • 컴퓨터 시스템 설계 대행사
  • 법인/기업
  • 정부/군 기관
  • 헬스케어 
  • 고등 교육 기관
  • 미디어 및 엔터테인먼트
기대와 희생

조직에 사이트 안정성 엔지니어가 필요할 정도로 중요한 사이트가 여러 개 있다면 기대치가 높을 것입니다. Netguru에 따르면 SRE를 고용하는 네 가지 주요 이유는 다운타임 최소화, 위험 예측 및 완화, 더 빠른 개발, 이러한 프로세스와 기타 구현된 프로세스를 통한 비용 절감입니다. 분명한 것은 사이트 안정성 엔지니어는 업무량을 처리하는 동시에 IT 세계의 변화에 앞서 나가야 한다는 점입니다.

교대 근무는 말할 것도 없고 문제가 발생하면 시간이 길어질 수 있으며, 이는 쉬는 시간에도 기술적으로는 계속 근무하고 있다는 것을 의미합니다. 인시던트 대응 시간이 짧을 수 있으며, 근무 시간 외 업무에 대한 보상에 관해서는 고용주마다 다릅니다. 유급 휴가를 부여하는 곳도 있고, 추가 수당을 지급하는 곳도 있으며, "정말 고맙다"는 말만 하고 아무 것도 주지 않는 곳도 있습니다. 

현재 트렌드

SRE는 성장하는 많은 조직에서 아직 비교적 새로운 개념입니다. 따라서 기업들은 여전히 이를 가장 잘 관리할 수 있는 방법을 찾기 위해 노력하고 있습니다. 사이트 안정성 엔지니어링을 추진하는 주요 요인은 사고 해결이며, 이는 기업이 단순히 불을 끄는 데 지쳐서 더 잘 처리하기를 원한다는 개념을 시사합니다.

물론 이는 경영진의 스트레스를 SRE에게 대신 전가함으로써 경영진의 스트레스를 덜어줍니다. 따라서 고용주는 스트레스를 많이 받는 직원들의 건강과 웰빙을 유지하여 인력이 최고의 효율로 운영될 수 있는 방법을 찾아야 할 수 있습니다. 일부 기업은 다른 기업보다 이를 더 잘 수행하지만, 비즈니스를 처리하는 바쁜 근로자를 돌보는 것의 가치를 인식하는 것이 추세입니다!

이 직업에 종사하는 사람들은 어렸을 때 어떤 일을 즐겼나요?

"사이트 안정성 엔지니어"라는 이름에서 이 분야에서 일하는 사람들의 유형에 대한 몇 가지 단서를 알 수 있습니다. 대부분의 SRE는 어렸을 때부터 웹 사이트 작업을 즐깁니다. 이들은 사이트가 '신뢰할 수 있는' 상태인지, 즉 모든 것이 제때 제대로 작동하는지 확인하는 일을 담당합니다. 따라서 작업자 스스로가 신뢰할 수 있어야 하며, 이는 종종 초기에 연마된 또 다른 특성입니다.

이러한 사람은 시간을 잘 지키고 준비하는 것을 좋아하며 학업 성적도 우수할 가능성이 높습니다. 실제로 모든 유형의 엔지니어가 되려면 일반적으로 특히 수학과 과학 분야에서 강력한 학문적 적성이 필요합니다. 하지만 이 분야의 흥미로운 점 중 하나는 소프트 스킬이 얼마나 많이 작용하는가 하는 점입니다.

SRE는 팀과 함께 일하는 데 익숙하고 팀 간의 협업을 촉진할 수 있는 사람이어야 합니다. 따라서 학교에서 리더십 직책을 맡았거나 형제자매가 많아서 경쟁해야 할 수도 있습니다! SRE는 문제를 연구하고 연구를 바탕으로 해결책을 찾아 더 나은 방법을 찾도록 훈련받은 효율성 전문가입니다. 이를 위해서는 마치 뇌의 양쪽 반구가 함께 작동하는 것처럼 창의적이면서도 분석적인 사고방식이 필요합니다. 많은 SRE가 양손잡이이거나 악기 연주에 능숙할 수 있습니다. 

필요한 교육 및 훈련
  • 사이트 안정성 엔지니어는 컴퓨터 과학 또는 관련 분야의 학사 학위가 필요합니다.
  • SRE가 되기 위한 정해진 경로는 없습니다. 인턴십을 통해 입사하는 직원도 있고, 부트캠프를 거쳐 다른 IT 업무를 수행하면서 스스로 기술을 개발하는 직원도 있습니다.
    • 충분한 업무 경험은 대부분의 고용주가 요구하는 핵심 요건입니다(많은 SRE 직원이 개발자나 소프트웨어 엔지니어 또는 DevOps, 시스템 관리자에서 처음 근무합니다).
  • Java, Python, Ruby 또는 C++는 물론 Linux, Kubernetes 및 MySQL에 익숙해지기 위한 클래스
  • 영어, 작문, 말하기, 팀워크, 리더십 등 소프트 스킬을 키울 수 있는 과정
  • 선택적 인증에는 다음이 포함됩니다:
    • 미국 품질 협회 신뢰성 엔지니어 인증
    • 데브옵스 인스티튜트의 SRE 파운데이션 인증 
    • CompTIA의 Linux+ 인증
  • 강좌를 수강하여 스스로 학습하세요:
    • edX - 데브옵스 및 사이트 안정성 엔지니어링 소개
    • Lynda(링크드인) - 데브옵스 파운데이션: 사이트 안정성 엔지니어링
    • Udemy - 신뢰성 엔지니어링 소개
    • 코세라 - 사이트 신뢰성 엔지니어링: 신뢰성 측정 및 관리
      • 동일한 과정은 Pluralsight에서도 제공됩니다.
프로그램에서 확인해야 할 사항
  • 성공적인 사이트 안정성 엔지니어가 되기 위해 알아야 할 대부분의 내용은 대학 프로그램 밖에서 배울 수 있습니다!
  • 위에 나열된 분야의 과정을 제공하는 프로그램을 찾는 것이 가장 이상적입니다.
  • 교수진 약력을 읽고 전문 분야와 배경을 확인하세요.
  • 어떤 유형의 학생 동아리 및 단체가 있나요? 많은 소프트 스킬과 테크닉은 또래와의 충분한 상호작용을 통해 가장 효과적으로 배울 수 있습니다.
  • 학교의 인가 여부 확인
  • 졸업 후 취업 통계를 발표하고 확실한 실적을 보유한 프로그램을 찾아보세요.
  • 온라인 프로그램 등록의 장단점을 잘 따져보세요. 캠퍼스 내 참여는 소프트 스킬을 쌓는 데 매우 유익하므로 때로는 하이브리드 프로그램이 유용할 수 있습니다.
프로그램 목록

U.S. News & World Report의 최고의 컴퓨터 과학 프로그램은 시작하는 데 도움이 될 수 있지만, 한 가지 순위에만 의존하지 마세요. 좋은 기회를 놓치고 싶지 않으시다면 Great Value College의 2020년 컴퓨터 과학 및 엔지니어링을 위한 50개의 저렴한 대학 또는 Best Value School의 투자 대비 수익률이 가장 높은 상위 25개 컴퓨터 과학 프로그램과 같은 목록을 고려해 보실 것을 추천합니다.

대학 학비가 터무니없이 비쌀 수 있지만, 많은 고용주가 매우 실용적이라는 점을 명심하세요. 어느 학교를 졸업했는지보다 여러분의 뛰어난 기술력에 더 관심이 있을 수 있습니다. 즉, 단순히 비싼 사립 대학에서 학위를 받았다고 해서 해당 직종에 취업할 수 있다는 보장은 없습니다. 기술을 쌓는 데 필요한 특정 수업을 집중적으로 수강하고 가능한 한 많은 실무 경험을 쌓으세요. 

고등학교 및 대학교에서 할 일
  • 앞서 언급했듯이 SRE가 되기 위한 단일 경로는 없으므로 몇 가지 옵션을 계획해 보세요.
  • 입사하고 싶은 회사의 채용 공고를 살펴보세요. 필요한 업무 및 학업 경험에 주의를 기울인 다음, 그 목표를 달성하기 위한 커리어 경로를 역설계하세요.
  • 고등학교에서는 가능한 한 많은 IT 선택 과목을 수강하여 탄탄한 기초를 쌓으세요.
  • 최대한 많은 실전 기술 연습을 해보세요! 위의 교육 및 훈련 항목과 관련된 과정을 수강하세요.
  • 글쓰기 연습도 잊지 마세요. 기술 문서 작성도 중요하지만 복잡한 주제를 일반인이 이해하기 쉬운 용어로 번역하는 작업도 필요합니다.
  • SRE는 훌륭한 팀워크와 리더십 기술이 필요합니다. 이러한 자질은 나중에 요구되는 경우가 많으므로 초기에 이를 개발할 수 있는 방법을 찾아보세요.
  • 경험 많은 멘토가 있는 것만큼 좋은 것은 없으므로 동문이나 교수진에게 조언을 구하세요. 
  • 다른 사람을 가르치세요. 가르치는 것은 양쪽 모두에게 새로운 학습 경험을 촉진합니다.
  • Quora, Reddit, Dev.to 및 기타 사이트에서 토론을 읽고 참여하세요.
  • 실력이 충분하다면 Upwork에서 유료 경험을 쌓으세요.
  • Indeed에서 인턴십을 찾거나 대학 프로그램에 기회가 있는지 문의하세요.
  • IT 관련 동아리의 리더가 되어 동료 및 동료들과 방대한 네트워크를 구축하세요!
일반적인 로드맵
사이트 안정성 Gladeo 로드맵
첫 직장을 구하는 방법
  • 소문을 내세요! 이제 대부분의 일자리는 네트워킹을 통해 찾습니다.
  • 트리플바이트 데브옵스 스크리닝 테스트에 응시하세요. 합격하면 네트워크에 속한 고용주와의 인터뷰 기회를 얻게 됩니다.
  • 인디드, 몬스터, USAJobs, 집리크루터, 링크드인, 글래스도어에서 채용공고를 찾아보세요.
  • 고용주가 무엇을 찾는지 알아보세요! Usenix는 SRE 채용에 대한 내부자 팁이 담긴 다운로드 가능한 .pdf를 제공합니다.
  • 일부 고용주는 내부적으로 SRE를 교육하기 때문에 한 직군에서 시작하되 회사 내에서 승진을 계획하는 것이 좋습니다.
  • 인턴십에 참여하세요. 항상 보수가 좋은 것은 아니지만, 인턴십을 통해 경험을 쌓고 정규직으로 전환할 수 있습니다.
  • 취업 박람회가 얼마나 유용한지에 대해서는 의견이 분분하지만, 산업별 박람회를 통해 어떤 기회가 있는지 알아보고 근로자와 대화할 수 있는 기회를 얻을 수 있는 것은 분명합니다.
  • 이력서를 정리하세요. Job Hero에는 다음에서 아이디어를 훔칠 수 있는 훌륭한 사이트 안정성 엔지니어 이력서 템플릿이 있습니다.
  • 전문 이력서 작가(또는 편집자)를 고용하여 문서를 완성하고 최상의 상태로 만들어 보세요. 하지만 각 이력서는 지원하려는 특정 직무에 맞게 조정해야 한다는 점을 잊지 마세요.
  • GitHub의 방대한 리소스 데이터베이스와 인터뷰 질문을 공부하세요!
사다리를 오르는 방법
  • 조직의 규모에 따라 많이 달라집니다. 내부에서 승진하는 회사도 있고 외부에서 승진하는 회사도 있습니다. 승진 기회에 대해 상사와 일찍 논의해야 합니다.
  • 능동적으로 대처하세요. 스스로 훈련하고, 강좌를 수강하고, 계속 배우세요. 새로운 기술 트렌드가 등장하면 이에 대해 가능한 모든 것을 알아보고 해당 분야의 전문가가 되세요.
  • 회사에 대한 충성심을 보여주고 더 많은 책임을 맡을 가치가 있는 신뢰할 수 있는 귀중한 자산이 되세요. 발전할 준비가 되었음을 나타내는 방식으로 행동하세요.
  • 항상 소프트 스킬을 기억하세요. 아무리 기술적으로 뛰어난 직원이라도 다른 사람들과 잘 어울리지 못하면 승진에 어려움을 겪을 수 있습니다.
  • 보스가 되세요. 자신의 역량과 리더십 잠재력을 보여주세요. SRE는 협력적이면서도 단호한(그리고 필요한 경우 단호한) 방식으로 다른 사람들을 지휘할 수 있어야 합니다.
  • 신뢰할 수 있음을 증명하세요. 시간을 잘 지키고, 대기 중인 경우 신속하게 사고에 대응하고 성실하게 업무를 수행하며 향후 유사한 문제를 완화할 수 있는 방법을 찾아야 합니다. 
추천 리소스

웹 사이트

  • 고급 Bash 스크립팅 
  • 멋진 파이썬 
  • Beej의 네트워크 프로그래밍 가이드 
  • 명령 챌린지 
  • 사이버 에이스 
  • 데브옵스 부트캠프 
  • DevOpsDays
  • 컴퓨터 전문가 일라이 
  • Git
  • Git 몰입 
  • SQL 소개: 데이터 쿼리 및 관리
  • 카타코다
  • MIT의 운영 체제 엔지니어링
  • 몽고DB 대학교 
  • 작전 학교
  • 오버 더 와이어 
  • 인형 학습 
  • SQLZOO 
  • SREcon 
  • SRE 위클리
  • 시스템 관리자 캐스트 
  • 정보 보안 교육 자료의 빅 블로그 포스트
  • 괴짜 물건
  • Google SRE 도서
  • Amazon Web Services 오픈 가이드 
  • 시스템 설계 입문서 
  • 유닉스 워크벤치 
  • 유닉스 도구 상자 

도서

플랜 B

현장 신뢰성 엔지니어링은 막중한 책임이 따르는 흥미진진한 직업 분야입니다. 하지만 이 분야로 진입하는 길이 항상 평탄한 것은 아닙니다. 많은 사람이 다른 분야에서 시작하고 때로는 그 분야에 머물기도 합니다. 몇 가지 "플랜 B" 직업 옵션은 다음과 같습니다:

  • 백엔드 개발자
  • 컴퓨터 및 정보 시스템 관리자
  • 컴퓨터 프로그래머
  • 컴퓨터 지원 전문가
  • 컴퓨터 시스템 분석가
  • 데이터베이스 관리자
  • 개발 운영
  • 프론트엔드 개발자
  • 풀스택 개발자
  • 정보 보안 분석가

뉴스피드

온라인 강좌 및 도구