인텔 터보 부스트 기능은 1세대 코어 프로세서 네할렘부터 추가되었습니다. 이미 프로세서의 발전에 클럭 스피드뿐만 아니라 CPU 코어 개수까지 포함되기 시작했지만, 당시 어플리케이션들은 멀티 스레드를 제대로 활용하지 못해 효용성이 떨어졌습니다.
특히 CPU 코어가 늘어나면 자연스럽게 발열 및 전력 소비량도 함께 증가하기 때문에 TDP 제한 이내로 안정적인 작동을 유지하려면 클럭 스피드 감소가 불가피했습니다. 낮은 클럭 스피드는 멀티 스레드를 활용하지 못하는 어플리케이션의 성능 하락을 유발하고 값 비싼 쿼드-코어 프로세서의 성능이 듀얼-코어 프로세서보다 떨어지는 문제를 야기하기도 합니다.
이미 노트북 플랫폼에 도입했던 Intel Dynamic Acceleration 기술을 통해 멀티-코어 프로세서 클럭 조절 방식의 기초를 다졌던 인텔이 차세대 아키텍처인 네할렘의 중고급형 라인업, 코어 i5 시리즈 이상의 제품들에 클럭 스피드 문제를 해결하기 위해 도입한 기술이 바로 터보 부스트입니다.
▌Intel Turbo Boost
▒ 인텔 터보 부스트
터보 부스트의 가장 기본적인 원리는 현재 작동중인 CPU 코어 개수에 따라 클럭 스피드를 달리 한다는 점입니다. 프로세서 내 CPU 코어는 작동 상태에 따라 C0 부터 C6까지 단계적으로 구분되는데 이를 C-States로 부릅니다. 프로세서에 따라서 C7 이상이 존재하는 경우도 있지만 터보 부스트의 작동과는 연관이 없습니다.
인텔 터보 부스트는 정상 작동 상태인 C0 및 즉시 C0 전환이 가능한 C1 상태의 CPU 코어에 대한 가속 여부를 결정합니다. 이 부분까지는 앞서 언급했던 IDA와 동일한 방식이지만, 여기에 더해 CPU 내부에 탑재된 모니터링 센서(PCU, Power Control Unit)를 통해 발열과 전력 상태까지 포함한 열설계전력(TDP, Thermal Design Power) 상한 이내라면 더 높은 클럭 스피드로 동작할 수 있도록 했습니다.
▌Intel Turbo Boost 2.0
▒ 인텔 터보 부스트 2.0
인텔 2세대 코어 프로세서 샌디 브릿지로 전환되면서 터보 부스트도 기능 개선을 통해 2.0 버전으로 업그레이드 되었습니다. 우선 1세대 코어 프로세서 네할렘과 달리 베이스 클럭(BCLK)이 133MHz가 아닌 100MHz로 바뀌었기 때문에 이전보다 미세한 클럭 조정이 가능해졌습니다.
또한 CPU 코어에 추가적인 여유가 있더라도 TDP 상한선 이하로만 클럭을 상승시키던 제한을 완화시켜 짧은 시간이나마 TDP 한계를 뛰어넘는 가속이 허용됩니다. 인텔 개발자 포럼(IDF, Intel Developer Forum)에서 발표된 내용에 따르면 약 25초까지 TDP 상한을 넘어선 부스트를 허용합니다.
인텔 2세대 코어 프로세서부터 CPU와 GPU가 하나의 실리콘 다이에 통합된 모놀리식(Monolithic) 구조를 취하면서 터보 부스트 2.0의 클럭 제어 알고리즘에 GPU까지 포함되었습니다.
1세대 코어 프로세서 중에서도 클락데일 라인업은 CPU와 GPU가 통합되어 있었지만, 각각의 실리콘 다이가 떨어져 있는 멀티 칩 모듈(MCM, Multi-Chip Module) 구조에 중보급형 시장을 목표로 한 제품군이라 크게 주목받지 못했습니다. 하지만 샌디 브릿지부터 일상적인 용도로는 충분한 성능을 갖췄고, 본격적으로 전용 GPU 카드를 탑재하지 않은 PC도 보급되기 시작했습니다.
물론 게임같은 실시간 3D 그래픽을 기대하기에는 부족한 성능이지만, OpenCL 같은 GPU 가속 기능을 사용할 때는 터보 부스트 자원을 CPU 대신 GPU에 투자할 수 있게 되었다는 점에 의의를 둘 수 있습니다.
▌Intel Turbo Boost Max 3.0
▒ 인텔 터보 부스트 맥스 3.0
기존의 터보 부스트 2.0 기술을 베이스로 싱글 또는 듀얼-코어 작업시 클럭 스피드 상승폭이 가장 높은 선별된 CPU 코어를 할당할 수 있도록 개선된 기술입니다.
2016년 브로드웰-E 아키텍처 기반의 하이엔드 제품군에 처음 도입된 이후 줄곧 코어 X 시리즈에만 탑재되었으나, 2020년 10세대 코어 프로세서에 탑재되면서 일반 소비자용 제품군에도 적용되기 시작했습니다.
인텔 터보 부스트 기술이 1세대 코어 프로세서에 도입되어 10세대에 이르기까지 멀티-코어화가 진행되었음에도 여전히 4-스레드 이하의 단일 코어 성능이 중요한 어플리케이션이 존재하고, 이러한 프로그램 성능 향상을 위한 기술 발전이 필요함을 시사합니다.