1. VESA Local Bus
최초로 등장한 로컬버스인 VESA 로컬버스, 줄여서 VL 버스라고 부르는 이 I/O 버스 방식은 기존의 ISA와 호환성을 유지하면서 32bit의 버스폭을 가지도록 디자인되었다.
VL 버스의 모습. 위쪽은 일반적인 ISA 슬롯이며, 아래쪽은 뒤에 VL 버스 확장슬롯이 같이 있는 모습이다
기본적으로는 일반적인 ISA 슬롯의 뒤쪽에 VL 버스 확장 슬롯이 붙어있는 형태를 가진다. 앞쪽의 ISA 버스에서는 전원만을 끌어다 사용하며, 실질적인 신호선은 모두 뒤쪽의 VL 버스쪽에서 담당한다.
컬러 화면과 GUI 등이 본격적으로 사용되면서 점차 발전해온 그래픽 성능은 1991년도에 들어서 시스템에서 상당히 심각한 병목현상을 일으키는 주범이 되어버린다. 당시 이 문제로 인해서 골머리를 앓던 NEC는 자사의 하이엔드 디플레이 제품군과 이를 사용하는 PC 시스템에서의 성능을 향상시키기 위해서 고성능의 I/O 버스의 필요성을 절감하고 새로운 I/O의 개발에 나선다.
관련 홈페이지 : VESA (http://www.vesa.org)
이에 의해서 NEC에 의해서 최초로 설립되었던 VESA(Video Electronics Standards Association : 비디오 전자규격 표준협회)에서는 1992년에 VESA 로컬 버스를 선보인다. VESA는 EISA 위원회와 비슷한 성격을 띄는 비영리 기구로써, VESA 로컬버스의 표준을 제안하고 이를 적용시키는데에 큰 역할을 하였다.
개발 목적에서 드러나듯, VL 버스는 기본적으로 비디오 하드웨어, 즉 그래픽 카드에 사용되기 위해서 만들어졌다. 하지만, 당시의 그래픽 카드 뿐만 아니라 하드디스크 드라이브 역시도 고속의 I/O를 필요로 했기 때문에 VL 버스는 그래픽카드 및 I/O 카드 등에 적용되었다.
VL 버스는 486DX를 위해서 디자인되었으며, 기본적으로 프로세서 버스와 동일한 클럭으로 동작하며, 프로세서의 외부 버스와 동일한 버스폭을 갖는다. 즉, 25/33MHz로 동작하고 32bit의 버스폭을 갖는다. 이러한 특징 때문에 메인보드에 이를 적용시키기 위해서 별도의 칩셋이 필요하지 않았다. 즉, VL 버스를 메인보드에 적용시키는 데에는 별도의 비용이 거의 들어가지 않았으며, 이러한 특징 때문에 486 메인보드는 거의 다 VL 버스를 탑재하였다. 또한 33MHz로 동작할 때 최대 133MB/s의 높은 데이터 전송률을 보일 수 있어서 그래픽카드에서의 병목현상 역시 상당부분 해소해 주었다.
1
하지만, 불행히도 VL 버스는 그 형태부터가 장수할 수 있는 형태가 아니었다. 우선, ISA 슬롯의 뒤쪽에 붙어있는 형태이기 때문에 ISA와 공존해야만 했으며, 전체적인 슬롯의 길이 때문에 확장 카드의 크기 역시 상당히 커졌다. 이는 메인보드 상에서 지나치게 많은 공간을 차지해서 다른 하드웨어들이 장착될 수 있는 공간을 줄이는 문제를 만들어냈다.
호환성에서의 문제 역시 상당히 컸다. 우선, CPU의 FSB와 동일하게 동작한다는 것이 발목을 잡았다. 486 프로세서는 초기에 25MHz, 33MHz 등으로 동작하였고, 이후 DX2가 등장하면서 프로세서 클럭이 지속적으로 높아졌다. 문제는 486 호환 프로세서가 AMD 및 Cyrix 등에서 출시되기 시작하면서 대단히 다양한 FSB가 사용되기 시작한 것이다. 그 결과 33MHz를 넘어서는 40MHz, 심지어 50MHz 등의 FSB도 등장했다. 상황이 이렇다 보니 VL 버스 상에서의 각 확장카드의 동작이 안정적이 될 수가 없었다. 이론적으로는 66MHz까지 동작할 수 있었지만, 캐패시턴스라던가 하는 각종 전기적인 문제로 인해서 실제 동작 클럭은 50MHz도 버거운 상황이었고, 그 결과 호환성의 문제가 나타났다.
프로세서 버스에 직접 연결되어 있다는 것도 문제였다. 486과 펜티엄의 프로세서 버스는 분명히 다르며, 그래서 VESA는 이후 펜티엄 등에는 적용될 수 없었다. (물론 적용된 것도 있기는 하지만 일반적인 방법이 아니었고 성능도 기대 이하였다.)
이러저러한 문제로 인해서 VL 버스는 펜티엄 등장 이후 시장에서 급속히 사라져가고, PCI가 그 자리를 차지하게 된다.
2. PCI
1992년, 인텔은 VESA와 비슷한 목적을 가지는 기구를 만든다. 이 기구는 ISA와 EISA의 한계를 넘어서는 새로운 I/O를 만들고자 하는 것이 목적이었으며, 그것이 바로 PCI(Peripheral Connect Interface)이다. PCI를 만들기 위한 기구는 PCI SIG(PCI Special Interest Group)이라고 명명되었다.
관련 홈페이지 : PCI SIG (http://www.pcisig.org)
PCI의 32bit/64bit 버전이 가지는 사양은 1992년에 완성되었지만, 이에 대한 커넥터와 확장 카드 등의 규격은 1993년에 완성된다. 그리고 그 이후 수년에 한번씩 지속적으로 개량되어 왔는데, 자세한 내용은 다음과 같다.
이러한 구조가 가지는 잇점은 바로 프로세서 버스와 로컬 버스의 분리이다. PCI 버스는 프로세서 버스와 직접 이어져 있는 것이 아니라 브릿지를 사이에 끼운 형태로 이어져 있다. 그래서 프로세서 버스는 프로세서 버스대로 높은 클럭을 사용할 수 있으며, PCI는 주변기기들의 호환을 위해서 일정한 클럭으로 남아있을 수 있게 되었다.
PCI의 도입과 함께 그간의 PCI 구조는 새롭게 변화한다. 앞서도 설명했듯, PCI에서 현대적인 노스브릿지-사우스브릿지의 토폴로지가 확립되었고, '브릿지'라는 개념이 도입되기 시작하였다.
PCI 버스의 토폴로지
이러한 방법의 사용으로 높은 호환성과 범용성을 유지하면서 메모리 및 프로세서의 클럭을 높은 수준으로 끌어올리는 것이 가능해졌다.
32bit PCI의 형태는 다음과 같다.(64bit PCI의 형태는 뒤에서 다시 다룰 것이다.)
PCI 슬롯의 모습
맨 위쪽이 16bit ISA, 가운데가 32bit/33MHz(5V) PCI, 아래쪽이 32bit/66MHz(3.3V) PCI
흔히 사용되는 PCI 슬롯은 32bit의 버스 폭을 가진다. 이들 모델 중에서도 동작전압이 3.3V 인 것이 있고, 5V인 것이 있는데, 3.3V의 동작전압을 가지는 PCI는 보다 높은 클럭인 66MHz로 동작한다. 이들의 구분은 슬롯에 있는 키의 위치로 확인할 수 있다. 막혀 있는 부분이 앞쪽(브라켓 쪽)에 있다면 3.3V 동작이며, 뒤쪽(케이스의 앞쪽)에 있다면 5V의 동작이다. 아래의 사진은 KT133A 칩셋을 사용한 메인보드로써, 가장 일반적인 레이아웃을 보여주는 보드 중의 하나이다. 5V 동작의 32bit/33MHz PCI 슬롯이 있는 것을 볼 수 있다.
사진에서 흰색의 슬롯들이 PCI 슬롯이다.
PCI 방식은 가장 대중화된, 가장 일반적인 I/O가 되었다.
PCI 버스의 전송속도를 계산해보자.
32bit × 33MHz = 1,056Mbit/s = 133MB/s
133MB/s의 데이터 전송 대역폭을 갖는다. 또한, 66MHz 동작에서는 이 두배인 266MB/s의 대역폭을 갖는다. 또한, PCI는 개발 초기부터 PnP를 지향해왔다. 그래서 높은 데이터 전송 대역폭과 플러그 앤 플레이의 편리함 등을 모두 갖추고 있어서 현재는 가장 널리 쓰이는 I/O 버스가 되었다.
3. AGP(Accelerated Graphics Port)
PCI가 133MB/s의 높은 전송속도를 가지고 있다고는 하지만, 그러한 PCI에도 분명한 단점이 존재한다. 바로, 다수의 PCI 기기가 하나의 PCI 버스를 공유하고 있다는 것이다. 위의 일러스트에서도 쉽게 발견할 수 있는 문제점이기도 하다.
PCI 버스는 다수의 기기들에 의해서 공유되어 있다.
그런데, LAN이나 스토리지 등의 디바이스는 '항상' 사용되는 것이 아닌 반면, 그래픽 카드라는 것은 항상 사용되는 것이다. 또한, 3D 그래픽 카드의 등장으로 그래픽 카드가 필요로 하는 데이터 전송 대역폭은 지속적으로 향상되었다. 그 결과, 그래픽카드만으로도 PCI가 제공하는 성능이 부족한 상황에 이르렀고, 그래픽카드와 PCI 버스를 공유해야 하는 다른 주변기기들의 성능저하로 이어졌다.
이러한 문제를 해결하기 위해서 인텔은 PCI와 유사하지만, PCI 버스와 물리적/전기적/논리적으로 완전히 독립되어 있고 보다 높은 전송속도를 가질 수 있는 인터페이스를 개발했는데, 그것이 바로 AGP이다. PCI 버스가 다양한 종류의 하드웨어를 위해서 하나의 버스 위에 여러개의 커넥터를 허용한 것에 반하여, AGP는 오로지 그래픽 카드만을 위한 높은 성능을 구현하기 위해서 1:1 연결구조, 즉 P2P(Point to Point)의 구조를 갖는다는 것이 PCI와의 가장 큰 차이점이다.
위 일러스트에서 보다시피, AGP는 PCI와는 별도로, 노스브릿지에 직접 연결된다. 또한 2개 이상의 디바이스를 허용하지 않고 하나의 시스템에는 1개의 AGP 버스만이 존재한다. 그래서 AGP는 버스를 공유하지 않고 독점적으로 사용하게 되며, 높은 성능을 구현할 수 있다.
이는 왜 그래픽카드가 보다 고속의 64bit/66MHz 등의 PCI를 사용하지 않고 AGP로 이행했는가를 의미한다. PCI는 아무리 64bit/66MHz라 하더라도 버스를 2~3개의 PCI 기기가 공유하며, 대단히 높은 대역폭을 필요로 하는 그래픽카드가 이를 사용하게 되면 주변기기의 성능저하에도 영향을 미치게 된다. 하지만, AGP는 그러한 문제점이 발생하지 않는다.
AGP 규격은 1996년 7월 인텔에 의해서 발표된 이후 지금까지 수차례의 변경이 가해졌다. 자세한 내용은 다음과 같다.
AGP 1X는 PCI와 마찬가지로 32bit의 버스를 가지지만, 동작클럭은 66MHz로 PCI의 2배이다. 그래서 266MB/s의 데이터 전송 대역폭을 가진다. AGP 2X에서는 DDR 기술이 적용되어 있다. 즉, 클럭 신호의 라이징 엣지(rising edge)와 폴링 엣지(falling edge)에서 모두 데이터 전송이 일어나기 때문에 단일 클럭에서 2회의 데이터 전송이 가능해진다.
AGP 4X는 내부적으로 사이드밴드(sideband)라는 클럭이 적용되어 있으며, 그래서 QDR(Quad Data Rate)이 적용되어 있다. 즉, 한번의 클럭에 4회의 데이터 전송이 가능하기 때문에 AGP 1X에 비해서 4배, 즉 1.06GB/s의 데이터 전송 대역폭을 갖는다.
위 일리스트는 32bit/33MHz PCI 슬롯과 AGP 슬롯을 비교한 것이다. AGP 슬롯은 3가지가 있다. 이러한 구분은 동작전압에 따른다. 초기에 발표된 AGP 1X의 경우, 그래픽카드는 3.3V의 전압만을 사용했다. 이들 그래픽카드가 사용하는 AGP 슬롯은 위 사진의 위에서 두번째에 있는 슬롯이다.
그리고 얼마 지나지 않아 4X AGP가 발표되었고, 그때부터는 유니버설 AGP 슬롯이 사용되었다. 유니버설 AGP 슬롯은 중간에 막혀있는 부분이 없어서 3.3V를 사용하는 그래픽카드나 1.5V를 사용하는 그래픽카드를 모두 사용할 수 있다.
그 이후, 보드의 설계 단순화와 보다 높은 클럭을 구현하기 위해서 그래픽 카드에서의 사용전압이 1.5V로 제한되며, 이 때 나오게 된 확장슬롯이 바로 가장 아래에 있는 1.5V 전용 2X/4X AGP 슬롯이다. 이것은 현재 인텔의 845/850 등에 적용되어 있다. 이들 칩셋을 사용한 메인보드는 3.3V용 그래픽카드를 더이상 사용할 수 없기 때문에 주의할 필요가 있다.
3.3V AGP를 사용하는 3D Labs의 GVX1 Pro.
1.5V 전용 AGP 슬롯을 사용하는 845/850 칩셋 기반 보드에는 장착이 불가능하다.
Copyright(c) by 3Dlabs
그 다음에 등장하는 것이 AGP Pro 슬롯이다. AGP Pro 슬롯은 전송속도의 향상이 아닌, 전원공급의 강화를 위해서 만들어진 규격이다. 일반적으로 AGP 슬롯을 통해서는 25W 정도의 전력을 공급하는 것이 가능하다. 그러나 그래픽 카드의 성능이 지속적으로 발전하면서 그래픽 코어 및 메모리의 클럭이 향상되었고, 이는 소모전력의 증가로 이어졌다.
그래서 AGP 슬롯만으로는 그래픽카드가 필요로 하는 전력을 공급해주기가 어려워지기 시작했고, 이를 해결하기 위해서 캐노푸스 등의 그래픽카드 제조사에서는 그래픽카드에 전원 커넥터를 달아서 외부로부터 전력을 끌어오는 방법을 택하기도 했다. 하지만, 이러한 방법은 불편하기도 할 뿐더러 웍스테이션용 그래픽카드들이 필요로 하는 높은 전력을 공급해 주기 위한 보다 근본적인 방법이 필요했다. 그래서 등장한 것이 AGP Pro이다. AGP Pro는 기존의 AGP 슬롯의 앞뒤로 약간씩 긴 모습을 가진다.
맨 위는 유니버설 AGP 슬롯, 가운데는 유니버설 AGP Pro 슬롯, 가장 아래쪽은 1.5V AGP Pro 슬롯
본래의 AGP에 비해서 앞쪽으로 20개의 핀이 추가되어서 이는 3.3V의 전력을 추가로 공급한다. 뒤쪽으로 추가된 28개의 핀은 12V의 전원을 공급해준다. 그래서 총계 110W까지의 전력을 공급할 수 있기 때문에 높은 전력을 소모하는 웍스테이션용 그래픽카드 등에서 외부전원을 끌어오지 않고 사용할 수 있다.
AGP Pro는 단지 슬롯만 길어진 것은 아니다. 보다 많은 열을 발생시키는 칩셋들의 효율적 방열을 위해서 높은 히트싱크를 사용할 수 있도록 하고 있는데, 그래서 AGP 슬롯 바로 옆의 슬롯 1개 혹은 2개를 같이 점유한다. 아래의 사진은 3D Labs의 전문가용 그래픽카드 Wildcat 6110의 사진이다. AGP Pro 슬롯과 2개의 위치를 점유하는 브라켓을 볼 수 있다.
3D Labs사의 Wildcat 6110 그래픽카드
Copyright(c) by 3Dlabs
2세대 I/O 버스의 진화 - 64bit PCI, PCI-X, AGP 8X
1. 64bit PCI
64bit PCI는 PCI에서 버스 폭이 64bit로 늘어난 것이다. 그래서 데이터 전송 대역폭 역시 그만큼 늘어나서 33MHz의 64bit PCI는 266MB/s를, 66MHz의 64bit PCI는 533MB/s의 데이터 전송 대역폭을 갖는다.
64bit PCI 슬롯의 모습. 맨 위쪽은 비교를 위한 32bit/33MHz PCI
가운데는 64bit/33MHz PCI, 맨 아래가 64bit/66MHz PCI
대개의 64bit PCI 카드는 66MHz/33MHz에서 모두 동작할 수 있도록 만들어져 있으나 일부 제품 중 33MHz로만 동작할 수 있게 만든것이 있다. 특히 SCSI 컨트롤러 등의 경우 컨트롤러 칩 자체가 66MHz 및 33MHz 동작용으로 구분되서 만들어지는 것이 있기 때문에 주의할 필요가 있다.(괴롭게도 필자가 33MHz로만 동작하는 64bit PCI 슬롯 방식의 SCSI 컨트롤러를 쓰고있다. -_-;;; 그래서 AMD760MPX 보드로 바꾸지를 못하고 있다는 슬픈 전설이...) 그래서 서버용 메인보드 중에서는 33MHz/64bit PCI 슬롯과 66MHz/64bit PCI 슬롯을 모두 갖추고 있는 제품이 존재한다.
Supermicro사의 펜티엄 III 듀얼보드, P3TDE6
Copyright(c) by Supermicro
64bit PCI는 일반적으로 확장카드와 확장슬롯 모두 하위호환성을 유지하게 만들어진다. 다음의 사진을 보자.
넷기어사의 기가비트 이더넷 컨트롤러 GA620
Copyright(c) by Netgear
이 제품은 33MHz 및 66MHz 환경에서 모두 사용할 수 있도록 만들어져 있다. 즉, PCI 슬롯 부분에서 홈이 파여 있는 부분이 앞뒤에 모두 있음을 알 수 있다. 그리고, 대개 이러한 제품의 경우 64bit PCI가 아닌, 일반적인 32bit PCI 슬롯에서도 정상적으로 동작한다. 32bit PCI 슬롯에 꼽으면 뒤쪽 부분이 남는데, 이 때 이 부분은 동작하지 않게 된다. 그래서 사용자는 기존의 환경에서 큰 변동이 없이 보다 고급 하드웨어로의 이행을 보다 쉽게 할 수 있다.
그러면, 64bit PCI의 시스템상의 토폴로지는 어떻게 구성될까? 간단히 생각할 수 있는 것은 64bit PCI가 가지는 높은 데이터 전송 대역폭으로 인해서 별도의 브릿지를 사용할 것이라는 점이다.
64bit PCI를 사용하는 경우에는 일반적으로 64bit PCI 컨트롤러를 별도로 장착한다.(예외적으로 칩셋 자체가 64bit PCI 컨트롤러를 내장한 AMD760 칩셋의 경우는 별도의 컨트롤러 칩이 없다) 또한, 이러한 구조 하에서 최대한의 성능을 확보하기 위해 하나의 64bit PCI 컨트롤러에는 3~4개 이상의 64bit PCI가 연결되는 경우가 거의 없으며, 대개의 경우 이러한 연결도 PCI 브릿지와 64bit PCI 버스 사이에는 P2P(point to point)로 구성된다. 물론, 64bit PCI 컨트롤러와 노스브릿지 사이에는 1GB/s 또는 2GB/s의 대역폭을 가지는 고속 버스로 구성되어 있어서 64bit PCI 디바이스의 성능을 최대한 발휘하도록 만들어진다.
그래서 64bit PCI가 적용된 메인보드의 경우 컴포넌트가 상당히 많아지고 복잡해지기 때문에 가격이 상당히 비싸진다. 그 결과, 주로 서버용 제품군에만 적용된다.
2. PCI-X
64bit PCI로도 발전하고 있는 다양한 대역폭을 소화해내기 여러운 것이 사실이다. 당장 Ultra320 SCSI만 하더라도 단일채널에서 320MB/s, 그리고 듀얼채널에서는 640MB/s의 데이터 전송속도를 가지게 되어서 64bit PCI가 가질 수 있는 최대 데이터 전송 대역폭인 533MB/s를 가볍게 넘겨버린다. 또한, Gigabit 이더넷 컨틀러의 경우도 듀얼채널(위에 나온 넷기어사의 GA620이 대표적 사례)만 되어도 약 250MB/s의 대역폭을 요구하기 때문에 33MHz의 64bit PCI가 가질 수 있는 최대 대역폭에 근접한다.
이러한 문제점을 해결하기 위해서 등장한 것이 바로 PCI-X이다. PCI-X는 지난 1999년 9월에 1.0 버전의 규격이 완성되었고, 2002년 4월에 PCI-X 2.0 규격이 등장하였다. 기본적으로 PCI-X는 64bit PCI를 그대로 계승하며, 완벽한 하위호환성을 가진다. 즉, 슬롯의 형태가 64bit PCI와 동일하다. 단, 여기에는 5V 동작은 규정되어 있지 않아서 3.3V 동작방식의 PCI만이 지원된다.
PCI-X 슬롯은 기존의 64bit/66MHz PCI와 동일하다.
PCI-X는 기존의 64bit/66MHz PCI에서 동작클럭을 100MHz, 133MHz로 향상시킨 것이라고 생각하면 거의 정확하다. 그래서 데이터 전송대역폭은 100MHz 동작에서 800MB/s, 그리고 133MHz 동작에서 1.06GB/s라는 방대한 규모를 자랑한다.
녹색 슬롯도 있는데?
그런데, 녹색의 슬롯은 무엇일까? 녹색의 PCI-X 슬롯을 사용하는 메인보드들을 살펴보면 모두 아답텍(Adaptec)사의 SCSI 컨트롤러를 탑재하고 있는 것을 알 수 있다. 이들 녹색 PCI-X 슬롯은 아답텍 SCSI 컨트롤러에 연계되는 제로채널 RAID 컨트롤러를 연결하기 위한 슬롯이다.
아답텍사의 제로채널 RAID 컨트롤러인 SCSI RAID 2000S(관련정보보기)
Copyright(c) by Adaptec
이들 메인보드에 온보드된 SCSI 컨트롤러는 녹색의 PCI-X 슬롯과 공유되어 있다. 그래서 여기에 위 사진에서 보이는 RAID 컨트롤러를 연결하면 바로 RAID를 적용할 수 있는 SCSI RAID 컨트롤러가 되는 것이다.
연결 토폴로지 역시 64bit PCI와 거의 유사하다. 아래의 사진을 보자.
Supermicro사의 XeonI 듀얼보드, P4DP8
Copyright(c) by Supermicro
이 사진 역시 슈퍼마이크로의 메인보드이다.(슈퍼마이크로사가 이런 엽기적인 제품을 주로 만든다. 이 회사는 오히려 일반 사용자용 메인보드에는 별 관심이 없다.) PCI-X 슬롯으로 도배가 되어 있는 것을 볼 수 있는데, 그 아래쪽으로 2개의 P64H2 PCI-X 컨트롤러가 2개 위치해 있다. 일반적인 메인보드라면 전체 PCI 슬롯이 하나의 컨트롤러의 제어를 받지만, 이 메인보드의 경우 PCI 슬롯이 총 여섯개임에도 2개의 컨트롤러에 의해서 제어되고 있다. 그 이유는 앞서 64bit PCI에서 설명했던 바와 같다.
PCI-X 2.0은 PCI-X 533으로 표현하기도 하며 원래의 PCI 보다 32배가 빠르다. PCI-X 266은 266MHz, PCI-X 533은 533MHz라는 높은 동작클럭을 통해 2GB/s, 4GB/s라는 방대한 데이터 전송 대역폭을 구현한다. 모두 백워드 호환성을 제공한다.
지금 존재하는 하드웨어로는 PCI-X 133의 데이터 전송 대역폭을 넘길 일이 없지만, 곧 등장할 10Gb 파이버채널, 10Gb 이더넷, 인피니밴드 등이 단일 채널에서 1~GB/s의 방대한 대역폭을 요구하게 된다. 따라서 이를 받쳐주기 위해서는 그보다 강력한 성능을 가지는 버스가 필요하며, 그러한 요구에 의해서 만들어진 것이 PCI-X 2.0이다.
데이터센터 기술의 변화로 10Gbit 네트워크 망이 보편화되면 PCI-X 2.0의 필요성은 더 증대할 것으로 보인다.
PCI-X 2.0은 기존의 PCI-X 및 64bit PCI와 완벽한 하위호환성을 유지하면서 높은 데이터 전송 대역폭을 구현하며, 데이터 신뢰도를 높이기 위한 ECC 기법 등이 적용된다.
3. AGP 8X
AGP 8X는 점점 강력해지는 그래픽카드들이 요구하는 방대한 대역폭을 지원하기 위해서 만들어진 규격이다. 기본 동작클럭은 AGP 1X와 동일하지만 ODR(Octa Data Rate) 기법을 적용하여 한번의 클럭에서 8개의 데이터를 전송하여 AGP 1X에 비해서 8배인 2.13GB/s의 데이터 전송 대역폭을 갖는다. 이 과정에서 새로운 전송방식을 사용하지만, 기존과 마찬가지로 0V~0.8V의 신호폭(swing)을 갖는다.
그래서 기존의 AGP 2.0 규격의 커넥터와 그대로 호환된다. 다만, AGP 4X까지는 1.5V, 3.3V의 동작이 모두 허용되었던 것에 반해서 AGP 8X는 1.5V의 동작만이 허용되기 때문에 AGP 8X 슬롯은 모두 현행의 845/850 칩셋 등에서 볼 수 있는 1.5V 전용 슬롯이 된다.
현재 VIA P4X400 등의 칩셋에 의해서 지원되기 시작하고 있으며, NVIDIA의 NV18/28 등의 그래픽 칩셋 역시 이 인터페이스를 지원할 예정이어서 내년 초가 되면 본격적으로 AGP 4X의 자리를 대체하게 될 것이다.