반도체의 원리와 유형
반도체는 전기 전도성이 도체의 특성과 부도체의 특성을 조절할 수 있는 물질로 대표적인 반도체 물질로는 저마늄(Ge), 실리콘(Si), 갈륨비소(GaAs)이며 현재는 주로 실리콘을 사용한다. 이를 이용해 전류의 흐름을 제어하거나 특정 조건에서만 전류를 흐르게 할 수 있어, 전자 장치의 핵심 부품으로 사용된다.
원자 번호 14번 실리콘 원자는 4개의 최외각 전자를 가지며 주변의 실리콘 원자들과 공유결합을 통해 실리콘 덩어리 내 자유전자가 없고 안정 상태가 되면 실리콘 덩어리는 부도체의 특성을 갖는다. 이 실리콘 원자들 사이에 최외각 전자가 3개 또는 5개인 불안정한 상태의 원자를 불순물로 넣어 새롭게 공유결합을 형성하면서 전자들이 이동하면 도체의 특성을 갖는다. 이렇게 실리콘 같은 반도체 물질의 전기적 특성을 조절하기 위해 불순물을 첨가하는 과정을 도핑(Doping)이라고 하고 도핑에 사용되는 불순물을 도펀트(Dopant)라고 한다.
최외각 전자가 5개인 원자를 불순물(인(P), 비소(As), 안티모니(Sb) 등)로 넣고 충분한 열에너지를 가해주면 새롭게 공유결합을 형성하며 형성 후, 전자가 하나 남는다. 전압을 걸어주면 이 자유전자가 이동하며 전류가 흐르게 된다. 이러한 방식의 반도체를 N형 반도체(Negative Type)라고 부른다.
최외각 전자가 3개인 원자를 불순물(붕소(B), 알루미늄(Al), 갈륨(Ga) 등)로 넣고 충분한 열에너지를 가해주면 새롭게 공유결합을 형성하며 형성 후, 실리콘과 공유결합에서 빈자리가 하나 생긴다. 이 빈자리를 정공(Hole)이라 하고 정공은 (+)전하처럼 작용해 전압을 걸어주면 주변의 전자가 이 정공으로 이동하며 전류가 흐르게 된다. 결과적으로 정공이 이동하는 것처럼 보이는 현상이 전류로 나타난다. 이러한 방식의 반도체를 P형 반도체(Positive Type)라고 부른다. 그리고 이 불순물(도펀트)의 양을 조절하면 전류의 양도 조절할 수 있다.
P형 반도체와 N형 반도체가 결합하면, 반도체 소자의 기본이 되는 PN 접합이 형성된다. 이 접합 구조는 반도체의 중요한 전기적 특성을 만들어내며, 다양한 전자기기의 핵심 부품으로 사용된다. 대표적인 반도체 소자로는 정류 기능을 하는 다이오드와 증폭과 스위치 기능을 하는 트랜지스터가 있다.
N형 영역의 자유 전자와 P형 영역의 정공이 결합하면서 공핍 영역(Depletion Region)이 형성되며 전자가 이동하면서 전하의 균형을 이루고, 내부에 전기장이 형성되어 외부 전압에 따라 전류 흐름을 제어하게 된다. 공핍 영역은 PN 접합의 접합부 근처에 전하 캐리어(전자와 정공)가 거의 없는 영역을 말하며 P형과 N형 사이에 전기적 장벽을 형성해 전류가 자연스럽게 흐르는 것을 막는다. 순방향 바이어스(Forward Bias)가 걸리면 이 장벽이 낮아져 전류가 흐르고, 역방향 바이어스(Reverse Bias)가 걸리면 장벽이 더 높아져 전류가 차단된다.
다이오드(Diode)는 PN 접합의 순방향과 역방향 특성을 이용해 한 방향으로만 전류를 흐르게(정류) 한다. 정류기(AC를 DC로 변환), 신호 처리, 전원 보호 장치 등에 활용된다.
트랜지스터(Transistor)는 소량의 전압이나 전류로 큰 전류를 제어하거나 증폭하는 데 사용되고 대표적으로 BJT(Bipolar Junction Transistor)와 MOSFET(Metal-Oxide-Semiconductor Field-Effect Transistor)가 있다.
BJT는 PNP BJT 또는 NPN BJT가 있으며 전자나 정공을 공급하기 위한 이미터(E:Emitter), 전자나 정공의 흐름을 조절하는 베이스(B: Base), 흐름이 조절된 전자나 정공이 나오는 컬렉터(C: Collector) 세 부분으로 구성되고 가운데의 베이스(B)가 양쪽의 이미터(E)와 컬렉터(C)보다 훨씬 얇은 것이 특징이다. 소량의 베이스 전류를 흘려주면 컬렉터에서 이미터로 큰 전류가 흘러 전류 증폭이 이루어지며, 베이스 전류를 사용해 컬렉터-이미터 전류를 제어하는 원리이다. 주로 신호 증폭(앰프), 아날로그 회로, 오디오 기기 등에 활용된다.
모스펫(MOSFET)은 전압으로 작동하는 트랜지스터로 스위치 역할에 더 특화되어 있다. N형 MOSFET과 P형 MOSFET 두 가지로 나뉘고 전압을 입력받아 전류 흐름을 제어하는 게이트(Gate, G), 전류가 나가는 소스(Source, S), 전류가 들어오는 드레인(Drain, D), 소스와 드레인 사이 바디(Body, B)로 이루어져 있다. 게이트에 전압을 가하면 소스와 드레인 사이에 전도 채널이 형성되고, 이 채널을 통해 전류가 흐르는 원리이며 게이트 전압의 크기에 따라 채널 크기와 전류가 조절된다. N형 반도체가 소스와 드레인이고 바디가 P형 반도체로 게이트에 (+) 전압을 가하면 N형 채널이 형성되어 전류가 흐르는 구조를 N형 MOSFET, P형 반도체가 소스와 드레인이고 바디가 N형 반도체로 게이트에 (-) 전압을 가하면 P형 채널이 형성되어 전류가 흐르는 구조를 P형 MOSFET이라 한다. 주로 디지털 회로(로직 게이트), 전원 제어 회로, 컴퓨터의 메모리 소자, 전력 변환 장치 등에 활용된다. MOSFET의 등장으로 컴퓨터의 크기가 대폭 작아지고 컴퓨터 산업이 성장할 수 있었다.
반도체 개발의 역사와 발전 방향
반도체 기술이 등장하기 전, 다이오드와 트랜지스터 같은 역할을 했던 최초의 전기소자는 진공관(Vacuum Tube)이다. 진공관은 진공 상태의 유리관에 금속을 가열하여 발생하는 전자의 이동을 제어함으로써 정류, 증폭, 스위치의 기능을 수행했다.
최초의 진공관은 2극 진공관인 다이오드로 1905년 영국의 전기 공학자 플레밍에 의해 발명되었다. 전자를 방출하는 음극인 캐소드와 전자를 받아들이는 양극인 애노드, 전자를 방출하기 위해 가열하는 장치인 필라멘트로 구성되었으며 전자들은 캐소드에서 애노드 한 방향으로만 흘러 전류를 형성했다. 이후 1907년 미국의 발명가 포리스트가 3극 진공관인 삼극관을 발명하였다. 2극 진공관에 전류를 제어하는 전극인 그리드가 추가되어, 증폭과 스위칭 기능을 동시에 수행할 수 있게 되었다. 필라멘트가 가열되면 캐소드에서 전자가 방출되어 애노드로 이동하며 전류를 형성하고 그리드에 전압을 가해 전자 흐름을 증가시키거나 차단할 수 있다.
이러한 진공관은 신호의 증폭, 정류, 스위칭에 많이 사용되었다. 라디오 송신기로부터 수신한 AM/FM 라디오 신호를 음성 신호로 변환하고 증폭하여 스피커로 재생할 수 있게 되었고, 텔레비전 화면을 구성하는 영상 신호를 증폭하여 화면에 출력하게 되었다. 안정적인 장거리 전화신호 전송을 위해 진공관 증폭기를 설치해 신호의 세기를 유지하고 걸고자 하는 번호로 전화를 연결하는 스위칭 시스템이 가능해졌다. 또한 1945년, 스위칭 소자와 증폭 소자를 사용해 약 18,000개의 진공관으로 세계 최초의 디지털 컴퓨터인 ENIAC이 탄생했다.
2차 세계 대전 이후 반도체 물질이 떠오르며 도핑을 통해 반도체 물질에 전기 전도성을 부여할 수 있고, 교류 신호를 직류로 변환하는 다이오드의 특성을 얻을 수 있음을 알게 되었고 1947년 미국 연구소에서 트랜지스터가 발명되었다. 트랜지스터는 반도체 재료로 만들어져 진공관보다 훨씬 작고 가벼우며 필라멘트가 없어 발열도 적고 전력 소모도 낮고, 수명이 길어 유지보수가 간단했다. 초기 트랜지스터는 주로 점접촉형(Point Contact) 트랜지스터였으나, 이후 접합형(BJT) 트랜지스터로 발전했다. 트랜지스터 기술이 발전하면서 진공관 기반의 컴퓨터와 통신 장비를 대체하기 시작했으며, 이후 집적회로(IC) 기술이 개발되면서 트랜지스터를 대규모로 집적하여 소형 컴퓨터와 고성능 전자기기를 생산하게 되었다. 트랜지스터는 크기, 성능, 전력 효율 등에서 진공관의 한계를 극복하며 현대 전자기기의 기초가 되었다.
점점 많은 BJT와 전기 소자들을 연결하고 납땜하면서 개별 트랜지스터와 긴 전선의 복잡한 회로 구성, 공간 문제, 비용 문제를 해결해야 했다. 1958년 잭 킬비에 의해 트랜지스터, 다이오드, 저항, 커패시터 같은 소자들을 하나의 하나의 판(칩) 위에 만들어 배치하고 이를 모두 내부적으로 연결하는 '집적'이라는 기술이 개발되었다. 이를 기반으로 판에 있는 반도체 소자들을 연결해 회로로 구성한 제품을 집적 회로(IC, Integrated Circuit)라고 한다. 킬비는 판 위에 소자들을 직접 전선에 연결해 납땜하여 세계 최초 집적회로를 만들었지만 이는 사람이 직접 납땜해야 했기에 대량 생산이 불가능했다.
이후 1959년 노이스와 무어는 반도체의 재료와 배선의 연결방식을 바꾸어 새로운 형태의 집적회로를 개발하였다. 저마늄(Ge) 대신 실리콘(Si)을 반도체의 기본 재료로 사용했고, 실리콘(Si)과 산소(O)를 반응시켜 전기가 통하지 않는 뛰어난 절연체인 이산화규소(SiO₂)를 만들 수 있었고 이를 칩 표면에 박막으로 씌워 외부 오염으로부터 보호하고 전류가 필요한 부분만 연결되도록 설계할 수 있었다. 이에 연결방식은 박막 위에 흠을 파고 금속을 채워 연결하는 방식으로 바꾸었는데 수작업이 아닌 기계로 전부 작업할 수 있어 대량 생산이 가능해지며 본격적인 집적 회로의 시대가 열렸다. 이후 이를 개발한 노이스와 무어는 1968년 인텔(intel)을 창업하였다.
대량 생산의 길이 열렸지만 이후 반도체 기술은 더 작고 효율적이며 낮은 전력 소모를 가진 소자가 필요하였고, 1960년 벨 연구소에서 BJT를 대체하는 MOSFET이 개발되었다. MOSFET은 크기도 훨씬 작고 속도도 더 빨랐으며 게이트에 전압을 인가하면 생성되는 전도채널로 전류 흐름을 조절하는 원리로 전류 소모 없이도 소자를 제어할 수 있었다. 그 결과 MOSFET은 BJT의 한계를 극복하며 현대 반도체 기술의 핵심으로 자리 잡았고 컴퓨터 산업은 폭발적으로 성장할 수 있었다.
산업이 발전할수록 더 많은 데이터 처리와 복잡한 연산이 요구된다. 반도체는 현대 기술의 핵심으로, 앞으로도 우리의 일상과 산업을 변화시킬 중요한 역할을 할 것이다. 현재 반도체 산업은 더 작고, 더 강력하며, 더 효율적인 반도체를 만들기 위해 다양한 방향으로 발전하고 있다.
더 높은 성능을 위해 더 많은 소자들을 집적하여 집적도를 높일수록 제조 난이도는 기하급수적으로 올라간다. 이에 필요한 능력은 설계 능력이다. 수많은 트랜지스터들을 어떻게 배치하고 연결하지에 따라 성능, 전력 효율, 비용이 모두 달라지고 설계능력은 반도체 칩을 최적화하는 기술이다. 또한 반도체 소자를 더 작게 만들어 채워 넣을 수 있는 미세 공정 능력이 필요하다. 트랜지스터의 크기가 작아지면 같은 크기의 반도체 칩에 더 많은 회로를 담을 수 있어 성능이 더 좋아지고 전력 소모도 줄어든다. 현재는 3나노미터(nm) 공정 기술(mm²당 약 3억 개 이상의 트랜지스터 집적 가능)이 사용되고 있으며 이는 이전 세대 공정(5nm, 7nm)에 비해 전력 효율이 25~30% 더 높다.
반도체 산업은 점점 더 작은 소자를 만드는 방향으로 발전해오면서 소자의 크기와 채널의 크기가 작아지면서 여러가지 문제들이 방생했다. 대표적으로 반도체가 OFF 상태에서도 전류가 흐르는 누설 전류가 발생해 전력손실이 심해졌다. 이에 따라 채널의 크기를 줄이는데 한계가 있었다. 이러한 누설 전류 문제를 해결하기 위해 기존 평면구조였던 Planar FET이 3차원 구조인 FinFET으로 바뀌었다. FinFET은 기판 위로 돌출된 핀(Fin) 구조를 가지며, 소스와 드레인이 핀의 양 끝에 위치하고, 게이트가 핀의 3면(양옆과 위)을 감싼다. 게이트에 전압을 가하면 핀의 표면에 채널이 생성되고 전류는 채널을 따라 소스에서 드레인으로 흐른다. 게이트가 채널의 3면을 감싸므로 전류를 더 정밀하게 제어할 수 있다. 이후 FinFET의 구조를 개선해 게이트가 채널의 모든 면을 감싸는 구조인 GAAFET가 개발되었다. 게이트가 채널을 360도 감싸므로 채널 크기를 줄여도 전류 누설이 적고, 더 높은 집적도를 구현할 수 있게 되었다.
그리고 기존 반도체 소재인 실리콘 대신, 갈륨 나이트라이드(GaN)와 실리콘 카바이드(SiC) 같은 고성능 기기에 맞는 새로운 소재가 등장하고 있다. 이 소재들은 고온, 고전압 환경에서도 성능이 뛰어나 전기차, 태양광 발전, 통신 장비와 같은 기기에 적합하다.
앞으로는 최적화 설계 기술과 미세 공정 기술의 시너지를 통해 더 고성능의 반도체를 더 저렴하게 생산할 수 있는 기업이 반도체 산업을 선도할 수 있을 것이다.
컴퓨터가 작동하는 방식
컴퓨터는 데이터를 입력받아 처리하고 결과를 출력하는 정보 처리 기계이다. 컴퓨터는 크게 입력, 처리, 저장, 출력 4가지 과정으로 일을 한다. 이 중 반도체는 주로 '처리'와 '저장' 과정을 담당한다. 시스템 반도체는 데이터를 연산, 제어, 분석하고 명령어를 실행하는 두뇌 역할을 하며 전 과정을 제어하는 '처리' 과정의 핵심이다. 대표적인 시스템 반도체로는 CPU, GPU, DSP, FPGA가 있다. CPU는 데이터를 계산하고 명령어를 실행하는 컴퓨터의 핵심 처리 장치이고, GPU는 그래픽 데이터와 병렬 연산을 처리하고, DSP는 디지털 신호를 실시간으로 빠르게 처리하며, FPGA는 프로그래머가 설계에 따라 하드웨어를 구성할 수 있는 논리 소자이다.
메모리 반도체는 시스템 반도체가 하지 못하는 데이터를 기억하고 저장하여 필요할 때 다시 사용 가능하게 하는역할로 '저장' 과정의 핵심이다. 대표적인 메모리 반도체로는 RAM, ROM, 플래시 메모리가 있다. RAM은 CPU가 즉시 처리해야 할 데이터를 임시로 저장하는 휘발성 메모리이고, ROM은 부팅 시 필요한 기본 명령어와 데이터를 저장하는 비휘발성 메모리이며, 플래시 메모리는 데이터를 영구적으로 저장하는 USB, SSD같은 비휘발성 메모리이다.
예를 들어 우리가 컴퓨터 킬 때를 살펴보면, 우선 컴퓨터에 전원이 들어오면 CPU는 ROM에 저장된 BIOS 프로그램을 RAM으로 로드해 이를 기반으로 하드웨어를 점검, 초기화한 뒤 SSD에서 운영체제를 호출해 RAM으로 로드하여 실행한다. 이 과정을 통해 컴퓨터가 부팅되는 것이다.
시스템 반도체
2024년 전체 반도체 시장에서 시스템 반도체는 전체 시장의 약 77%를 차지하며, 메모리 반도체는 약 23%를 차지한다. 우리나라는 전체 반도체 시장 2위이자, 메모리 반도체(DRAM, NAND 플래시) 강국으로 메모리 점유율은 68%이나 시스템 반도체 점유율은 3%에 불과하다. 글로벌 반도체 시장에서 대만과 한국은 제조, 네덜란드는 장비, 일본은 소재에서 강점을 보유하고 있으며 미국은 전 영역에서 강자이고 선두주자이다.
CPU(Central Processing Unit)는 크게 제어유닛, 산술 논리 유닛, 메로리 유닛으로 구성되어 있다. 제어 유닛(Control Unit)은 사용자의 명령어를 해석하여 전달하고, 다른 하드웨어 장치와의 데이터 흐름을 관리 감독하며 전체 컴퓨터의 동작을 제어한다. 산술 논리 유닛(ALU, Arithmetic Logic Unit)은 명령을 수행하는 역할로 실제 연산 작업을 하고 데이터를 처리하는 핵심 장치이다. 그리고 메모리 유닛(Memory Unit)은 데이터와 명령어를 저장하고, CPU가 필요할 때 읽거나 쓸 수 있도록 데이터를 제공한다. 캐시와 레지스터로 구성되며 RAM과 비슷한 역할을 하지만 RAM보다 훨씬 빠르고 비싸기에 꼭 필요한만큼만 CPU에 설계해 넣는다.
CPU의 성능을 나타내는 지표로는 코어(Core), 스레드(Thread), 클럭(Clock), 아키텍처(Architecture), 캐시 크기가 있다. 코어(Core)는 CPU 안에 독립적으로 작업을 수행할 수 있는 코어(두뇌)의 수를 말하고, 코어 수가 많을 수록 여러 작업 동시에 처리가 가능하며 한 코어에서 여러 스레드를 처리할 수 있다. 스레드(Thread)는 CPU가 처리할 수 있는 작업의 최소 단위로 논리적인 작업 흐름을 말한다. 클럭(Clock)은 CPU가 초당 처리할 수 있는 명령어 수로 얼마나 빠른 속도로 일을 처리하는지를 나타내며 Hz 단위로 나타낸다. 캐시 크기는 CPU 내부 고속 메모리의 용량으로 더 큰 캐시는 더 빠른 데이터 접근을 가능하게 한다. 그리고 아키텍처(Architecture)는 CPU와 주변 부품들의 구성과 동작에 대한 전반적인 구조를 의미하며 어떤 명령어 체계를 사용하고 해석과 연산을 어떻게 분배할 것인지를 결정한다.
대표적인 CPU 예시로 데스크탑에선 Intel의 Core i3, i5, i7, i9 시리즈, AMD의 Ryzen 3, 5, 7, 9 시리즈가 있고, 서버용 CPU로는 Intel Xeon, AMD EPYC, 모바일 CPU로는 Qualcomm Snapdragon, Apple M1/M2 등이 있다.
그래픽은 수많은 픽셀들이 모여 만들어지고, 화면 해상도는 픽셀의 수로 결정된다. 픽셀은 디지털 이미지에서 가장 작은 단위로, 색상을 표현하는 작은 점이다. 예를 들어, FHD는 1920x1080 해상도를 의미하며 약 207만 픽셀로 구성되고, QHD는 2560x1440 해상도를 의미하며 약 368만 픽셀로 구성되고, 4K(UHD)는 3840x2160 해상도를 의미하며 약 830만 픽셀로 구성된다. 해상도가 높을수록 더 많은 픽셀이 들어가므로 이미지와 영상의 디테일이 더 정확하게 표현된다. 각 픽셀은 빨강(Red), 초록(Green), 파랑(Blue) 세 가지 색상의 조합으로 색을 표현하는데 각 색상(R, G, B)당 8비트씩(256단계), 픽셀 당 총 24비트를 사용해 약 1670만 가지 색상을 표현할 수 있다. 모니터에 화면을 구현하기 위해 각각의 픽셀 값을 모두 계산해야 한다. 높은 프레임률(예: 60fps)을 구현하려면 초당 약 5억 픽셀을 처리해야 하며, 이 방대한 연산에 필요한 부품이 그래픽 카드(GPU)이다. GPU(Graphics Processing Unit, 그래픽 처리 장치)는 컴퓨터에서 이미지, 동영상, 그래픽과 같은 대량의 데이터를 처리하고 렌더링해 시각적인 작업을 담당하는 프로세서이다.
CPU가 컴퓨터의 중심적인 "두뇌" 역할을 한다면, GPU는 그래픽 및 병렬 처리에 특화된 "전문 기술자"와 같다. CPU만으로도 컴퓨터를 구동할 수 있지만, GPU가 추가되면 특정 작업을 훨씬 더 빠르고 효율적으로 수행할 수 있다. 소수의 강력한 코어(4-8개)로 구성되어 순차적으로 일을 처리하는 직렬성 CPU와 달리 병렬성 GPU는 수천 개의 작은 코어로 구성되어 방대한 양의 연산을 동시에 처리해야 하는 그래픽 렌더링에서 효율적이다.
GPU의 병렬 처리 능력을 이용해 방대한 작업량이 필요한 과학 계산, 인공지능, 데이터 분석 등 다양한 분야에서 활용할 수 있다. 대표적으로 2017년 암호화폐 채굴에 대규모로 사용되어 GPU 가격이 비정상적으로 상승하는 현상이 있었다. 암호화폐 채굴은 같은 계산을 반복해서 여러 데이터를 처리해 블록체인을 유지하는 작업이기에 대규모 병렬 연산에 특화된 GPU가 많이 사용되었던 것이다. 이후, 비트코인과 일부 암호화폐는 ASIC 채굴 장치로 전환되며 GPU 채굴의 비중이 줄어들었다. 또한 GPU는 딥러닝 모델 학습과 추론을 빠르게 처리할 수 있어 데이터 분석, 자연어 처리, 추천 알고리즘, 이미지 생성 등 다양하게 활용되는 AI와 딥러닝의 핵심적인 하드웨어이다. 그리고 이는 AI 연산을 특화로 하는 AI 반도체가 등장하는 토대가 되었다.
데스크탑, 데이터센터의 GPU 시장은 NVIDIA와 AMD가 주도하고, 모바일, IoT 시장에서는 ARM, Qualcomm, Apple이 큰 비중을 차지한다.
스마트폰이나 태블릿 같은 모바일 기기는 모바일 환경에 맞게 저전력, 소형화, 통합성에 초점을 맞추어 설계된다. 모바일 기기는 배터리로 작동하고, 작은 공간에 모든 부품이 들어가야 하므로 주요 부품들을 하나의 칩 안에 집적해서 넣는다. CPU, GPU, DSP, ISP을 포함해 집적한 칩 AP(Application Processor)는 애플리케이션 실행, 데이터 처리, 시스템 제어와 같은 중심적인 작업을 담당한다. 이렇게 여러 부품들이 하나의 반도체에 통합되어 하나의 시스템을 구성하는 형태를 단일 칩 시스템(SoC)라고 한다. 데스크톱이나 노트북은 메인보드에 CPU, GPU, 메모리, 네트워크 칩 등을 별개의 부품으로 연결하는 것과 달리, SoC는 이런 모든 하드웨어 기능을 하나의 칩으로 통합해 스마트폰, 태블릿에서 메인보드와 같은 기능을 한다.
2007년, Apple이 iPhone을 발표하며 스마트폰 시대가 시작되고 AP 시장은 빠르게 변화하며 많은 경쟁과 혁신을 거쳤다. 삼성, Qualcomm, TI, Marvell 등이 AP 시장에 가장 먼저 진출했는데 TI와 Marvell은 경쟁력 부족으로 시장에서 철수했고, 삼성은 Exynos로 자체 AP를 개발하며 Galaxy 시리즈에 탑재하고 Qualcomm은 Snapdragon으로 LTE 모뎀 통합 AP를 제공해 시장을 선도하였다. 이후 MediaTek은 중저가 시장을 타깃으로 점유율을 확대해 보급형 스마트폰 시장이 열린다. 삼성과 협력해 AP를 공급받던 Apple은 2010년 반도체 설계 업체 인트린시티를 인수해 A4 칩을 출시하며 자체 AP 설계를 시작했고, 현재 AP 시장의 점유율은 Qualcomm, Apple, MediaTek이 주도하고 있다.
머신러닝은 인공지능의 한 분야로 데이터를 통해 컴퓨터가 스스로 학습하고 개선하는 기술이고, 딥러닝은 머신러닝의 한 분야로 인공신경망(Neural Network)을 기반으로 한 학습 방식을 말한다. AI 반도체는 기존의 CPU나 GPU와 달리, 인공지능(AI) 특히 딥러닝 작업에 특화된 연산을 수행하기 위해 설계된 반도체 칩이다. 딥러닝 작업은 위해선 대규모 데이터셋을 기반으로 모델을 학습하는 학습과정(training)과 학습된 모델을 활용하여 실시간으로 데이터를 처리하고 결과를 예측하는 추론과정(inference)을 포함한다. 이 두 과정은 방대한 양의 데이터를 효율적으로 처리해야 하므로 빠른 고성능의 연산이 필수적이며, 이는 대규모 병렬 연산에 특화된 GPU가 AI 분야에서 가장 먼저 각광받았던 이유이다. 이후 딥러닝의 학습과 추론 과정에 최적화된 AI 반도체가 등장한 것이다.
NPU(Neural Processing Unit)는 주로 스마트폰이나 임베디드 디바이스에서 AI 연산을 지원하는 AI 반도체로 딥러닝 추론 작업에 특화되었다. NPU는 주로 AP 제조업체에서 만드는데 자신들이 설계한 AP 안에 NPU를 넣어 성능을 테스트하고 정보를 수집해 데이터베이스를 구축하고 또 이를 바탕으로 NPU의 성능을 고도화할 수 있기 때문이다. 따라서 NPU 시장에서는 전통적인 반도체 기업보다 IT 기업들이 경쟁우위에 있다. NPU 기술을 AP에 통합함으로써 모바일 기기에서 실시간 AI 연산이 가능하여 Face ID, 사진 보정, 음성 인식 등 사용자 경험도 크게 향상하고 있다. 애플의 시리, 삼성의 빅스비, 구글의 구글 어시스턴트 같은 인공지능 비서 서비스들은 모두 단순히 클라우드 서버에 의존하던 과거 방식에서 벗어나, AP에 NPU가 탑재(On-Device)된 후 성능이 크게 향상되었다.
테슬라가 자율주행 기술을 위해 자체 개발한 AI 반도체 FSD와 구글이 TensorFlow에 최적화되도록 자체 개발한 AI 반도체 TPU도 특정 AI 작업에 특화된 NPU의 한 종류라고 볼 수 있다.
인공지능 분야의 연구가 활발해지면서 기존의 프로그래머블 반도체인 FPGA(Field-Programmable Gate Array)도 다시 주목 받고 있다. FPGA는 이름 그대로 "현장에서(Field)" 프로그래밍하여 다양한 용도로 사용할 수 있다. 연구 단계에서는 실험과 수정이 빈번하게 이루어지므로 설계를 쉽게 변경할 수 있는 하드웨어가 필요해 등장한 반도체로, 칩 내부에 논리 게이트와 스위치들이 배치되어 있으며, 사용자가 하드웨어 동작 방식을 소프트웨어로 프로그래밍하여 변경할 수 있는 재구성이 가능한 칩이다. 하드웨어 구조를 다양한 AI 모델과 알고리즘에 맞게 최적화할 수 있으며, 특정 작업에 최적화된 병렬 연산을 수행할 수 있도록 하드웨어를 설계 단계에서부터 재구성할 수 있어 AI 워크로드의 변화에 빠르게 대응할 수 있다.
또한 특정 작업에 최적화되도록 설계되는 맞춤형 칩 ASIC(Application-Specific Integrated Circuit)이 있다. 이는 특화된 기능만 수행하기 때문에 범용성은 작지만 동작 속도가 빠르고 소비전력도 적으며 대량생산에 유리해 단가가 크게 줄어든다. 대표적으로 ASIC은 암호화폐 채굴에 많이 사용되고 빠른 처리 속도와 낮은 전력 소모로 AI 작업의 추론 단계에서도 유리하지만, 활용 가능 분야를 벗어나면 사용할 수 없기에 설계변경이 빈번한 경우에는 불리하다.
위 NPU에서 언급한 Google TPU, Tesla FSD처럼 딥러닝 연산에 특화된 맞춤형 하드웨어는 ASIC으로 설계된 NPU이다. 그리고 AP에서 언급한 AP에 탑재되는 NPU Qualcomm Snapdragon, Apple A시리즈는 SoC 기반 NPU로 볼 수 있다.
2세대 AI 반도체 ASIC, FPGA가 본격화되던 비슷한 시기에 3세대 AI 반도체도 개발되었다. 3세대 AI 반도체는 인간의 뇌 구조와 동작 원리를 모사하여 연산과 저장을 동시에 수행하는 뉴로모픽 칩과, 메모리와 프로세서를 통합하여 데이터 이동 병목 현상을 해소하는 PIM 칩으로 구분된다.
PIM과 뉴로모픽 반도체는 프로그램 명령어와 데이터가 같은 메모리 공간에 저장되고 프로세서는 메모리와 분리되어 CPU가 메모리와 지속적으로 상호작용하는 폰 노이만 구조의 한계를 극복하기 위해 개발되었다. 메모리와 프로세서 간 데이터를 주고받는 과정에서 발생하는 데이터 이동 병목현상을 제거하였으며, 연산과 저장을 분리하지 않고 통합된 방식으로 설계하여 데이터 이동을 최소화하여 성능과 전력 효율성을 극대화하였고 기존 CPU와 같이 순차적 데이터 처리 대신 병렬 연산을 강조하여 딥러닝, 자율 시스템, 실시간 데이터 처리와 같은 현대 AI 작업에 적합하다.
PIM(Processing-In-Memory) 반도체는 기존 메모리 칩에 처리 기능을 추가하여 데이터가 메모리에서 프로세서로 이동하지 않아도 메모리 내부에서 직접 처리가 가능하다. 2021년 삼성전자는 고대역폭 메모리에 AI 연산 기능을 추가해 세계 최초 HBM-PIM 기술을 발표했고, SK하이닉스는 2022년 PIM DRAM 기술을 발표하였다. 뉴로모픽 반도체(Neuromorphic Semiconductor)는 인간의 뇌 구조와 동작 원리를 하드웨어적으로 구현한 반도체이다. 뇌에서 정보를 처리하는 뉴런과 뉴런 간 연결을 담당하는 시냅스 구조를 본떠 데이터 처리와 저장을 동시에 수행할 수 있고 뇌처럼 학습 및 적응을 수행하며 실시간 데이터 처리에 초점을 맞추었다. 기존 딥러닝 신경망(CNN, RNN)과 달리 연속적인 숫자나 행렬의 신호가 아닌, 이산적이고 시간에 의존하는 스파이크(Spikes) 신호 형태로 이루어진다. 데이터가 발생할 때만 뉴런이 활성화돼 연산이 이루어지는 방식으로 전력 소모가 극도로 낮아진다. 대표적으로 2014년 IBM이 발표한 TrueNorth은 뉴런 1백만 개, 시냅스 2억 5천 6백만 개를 구현하여 뉴로모픽 컴퓨팅이 실질적으로 시작하였고, 2017년 Intel이 Loihi 뉴로모픽 칩을 발표하며 뉴로모픽 칩 연구를 가속화하였다. 이에 대한 연구는 아직 활발히 진행중이며 실험 중심적인 단계이다.
뉴로모픽 반도체는 초저전력 설계와 실시간 학습 및 적응에 특화되어 배터리 기반 환경이나 의료 기기나 자율 시스템 같이 실시간 처리가 필요한 곳에 활용할 수 있고, PIM은 대규모 데이터 처리와 병렬 연산에 최적화되어 데이터센터와 고성능 컴퓨팅 환경에서 주로 활용할 수 있다.
컴퓨터의 경우 모바일 기기에 비해 전력 공급에 대한 제약이 적기 때문에, 전력 효율보다는 고성능을 우선시하는 설계 철학을 따른다. 고성능의 코어를 설계하는 회사로는 인텔과 AMD가 있으며 이를 '인텔 진영'이라고 부른다. 복잡한 명령어 집합 구조(CISC)를 사용하는 x86 아키텍처 기반의 프로세서가 주로 사용되며, 고클럭 속도, 다중 코어 구조, 대규모 캐시 메모리 등으로 성능을 극대화한다. 반면 배터리로 작동하는 모바일 기기 같은 경우 배터리 용량에 한계가 있으므로 저전력과 발열 관리가 필수적이다. 따라서 단순 명령어 집합 구조(RISC)를 사용하는 ARM 아키텍처 기반의 프로세서가 선호되며, 저전력과 효율성을 강조한다. 퀄컴, 애플, 삼성, 미디어텍 등은 ARM 아키텍처를 기반으로 칩을 설계하며 이를 'ARM 진영'이라고 부른다. 현재는 ARM 기반이 모바일 기기뿐 아니라 서버와 노트북 시장에도 진출하고 있다.
메모리 반도체
메모리 반도체는 정보를 저장하고, 저장된 정보를 읽는 데 특화된 반도체이다. 메모리 반도체 시장은 전체 반도체 시장에서 약 23%를 차지하며 우리나라의 삼성전자와 SK하이닉스에서 선도하고 있다.
RAM(Random Access Memory)은 컴퓨터와 같은 전자 기기에서 임시 데이터를 저장하고 빠른 읽기/쓰기를 가능하게 하는 휘발성 메모리이다. Random Access라는 이름처럼, 데이터가 메모리의 특정 위치에 순차적으로 저장되지 않아도 원하는 데이터를 즉시 접근할 수 있어 CPU가 데이터를 즉시 처리할 수 있도록 도와 연산에 필요한 많은 정보를 RAM에 저장하게 되었고, RAM은 주기억 장치라고 불리게 되었다.
RAM은 크게 SRAM(Static RAM)과 DRAM(Dynamic RAM) 두 가지 유형으로 나뉜다. SRAM과 DRAM은 각기 다른 특성을 바탕으로 최적의 용도로 사용된다. SRAM은 데이터를 저장하기 위해 6개의 트랜지스터를 사용하며 플립플롭(flip-flop) 회로를 이용하여 데이터를 저장한다. 이로 인해 제조 비용이 높지만, 데이터에 접근하고 저장하는 데 속도가 매우 빨라 고속 연산이 요구되는 환경에 적합하다. 주로 CPU 내부의 고속 메모리로 사용되어 CPU의 연산 속도를 극대화한다. 일반적으로 이야기하는 RAM은 바로 DRAM이다. DRAM은 트랜지스터와 커패시터 쌍으로 셀을 구성하고 커패시터에 데이터를 저장한다. 이 커패시터는 전자를 저장하거나 방출하여 1과 0을 표현할 수 있다. MOSFET을 켜서 커패시터에 전자를 채워 넣으면 DRAM 셀에 데이터 1이 저장되고, MOSFET을 꺼서 커패시터에 전자가 없는 상태가 되면 DRAM 셀에 데이터 0이 저장된다. 하지만 커패시터는 시간이 지남에 따라 전하가 방전되므로 커패시터의 전하를 유지하기 위해 주기적으로 전자를 채워주는 새로고침(refresh)이 필요하다. 이 과정에서 속도가 다소 느려질 수 있다. 따라서 이러한 새로고침이 필요하지 않은 SRAM보다는 느리지만, 용량 대비 경제성이 뛰어나다.
RAM과 같은 메모리는 클럭 신호에 따라 데이터를 읽고 쓰는 작업을 한다. 클럭 신호는 디지털 회로에서 동작의 타이밍을 제어하는 데 사용되는 주기적인 신호로 상승과 하강이 있다. 상승 엣지에서만 데이터를 전송하는 방식을 SDR(Single Data Rate)이라 하고 상승엣지와 하락엣지 두 시점 모두에서 데이터를 전송하는 방식을 DDR(Dual Data Rate)라고 한다. 단일 클럭 주기 동안 두 번 데이터를 전송하므로 SDR 방식보다 2배 더 빠르다. 현재 나오는 DRAM은 모두 DDR 방식이며 2021년에 출시된 DDR5가 가장 빠른 최신 버전이다.
DRAM 시장에서 점유율은 삼성전자 41%, SK하이닉스 34%, 마이크론 22%로 이 세 회사가 독점하고 있다.
ROM(Read Only Memory)은 컴퓨터와 전자 기기에서 중요한 데이터를 영구적으로 저장하는 데 사용되며 전원이 꺼져도 데이터를 유지하는 비휘발성 메모리이다. 이름 그대로, 초기에는 저장되어 있는 데이터를 읽는 것만 할 수 있었지만 현대에는 쓰기와 수정이 가능한 자유로운 ROM이 있다. ROM은 보조 기억 장치로 주기억 장치 RAM을 보조하는 동시에 데이터를 저장하는 역할을 한다.
과거 컴퓨터의 주요 저장 장치는 HDD(Hard Disk Drive)였다. HDD는 자성 물질이 발라져 있는 알루미늄 원판인 플래터에 자석의 N극과 S극을 촘촘히 배치해서 데이터를 기록하고, 표면의 자성을 읽어내는 헤드가 플래터 위를 옮겨 다니면서 필요한 데이터를 읽어내는 방식이다. 플래터가 1분당 5400-10000번 회전하면서 데이터를 읽고 쓰는 방식으로 작동하는데 데이터를 읽으려면 헤드가 플래터의 특정 위치로 이동해야 하므로, 시간이 더 걸린다. 이러한 기계적 부품으로 인해 물리적 충격, 소음 발생, 속도에도 한계가 있다. 반면 현재 주로 사용하는 저장장치인 SSD(Solid State Drive)는 기계적 방식이 아닌 전자적 방식으로 데이터를 처리하기 때문에 더 빠르고 안정적이다. SSD는 점점 보편화되어 HDD를 대체해 저장 장치의 중심이 되었고, SSD에 사용되는 반도체인 NAND 플래시 메모리가 DRAM과 함께 메모리 반도체의 대표 주자로 자리매김하고 있다. NAND 플래시 메모리는 데이터에 접근하는데 DRAM보다는 느리지만 비휘발성이라는 특성 덕분에 데이터 저장 장치로 적합하다.
NAND 플래시 메모리의 기본 구조는 데이터를 저장하기 위한 플로팅 게이트 트랜지스터(Floating Gate Transistor)를 기반으로 한다. 플로팅 게이트를 산화막이 둘러싼 형태로 전자를 가둘 수 있으며 전자를 가두거나 방출함으로써 1과 0을 표현할 수 있다. 데이터를 삭제할 때는 플로팅 게이트에 저장된 전자를 방출하여 초기 상태로 복원하는데 이러한 전기적 삭제 방식은 빠르고 효율적이며 데이터를 지우는 과정이 번개처럼 빠르다는 의미에서 "플래시"라는 이름이 붙었다. 플래시 메모리의 연결 구조에 따라 NAND 플래시 메모리와 NOR 플래시 메모리로 나뉜다. NAND 플래시 메모리는 셀을 직렬로 연결한 스트링이 병렬로 연결된 구조이다. 이러한 구조에 따라 셀 정보를 읽기 위해선 스트링을 먼저 선택하고 셀을 선택해서 읽으며 데이터를 지우거나 쓸 때는 스트링 통째로 한번에 지우거나 기록한다. 반면 NOR 플래시 메모리는 셀을 병렬로 연결한 구조로 셀 하나에 바로 접근할 수 있어 읽기 속도는 NAND보다 빠르다. 하지만 지우거나 쓸 때는 셀 하나하나에 개별적으로 선택해야 하므로 NAND보다 느리다. 아래 이미지를 보면 NOR는 빨간선이 셀에 바로 연결되어 있지만 NAND는 빨간선이 스트링에 연결되어 셀을 순차적으로 읽는다. NOR의 이러한 병렬구조는 저장 밀도가 낮고 제조 공정이 복잡해 비용이 높다는 단점이 있어 현재 시장에서는 NAND 플래시 메모리가 대세로 자리잡아 대용량 데이터 저장이 필요한 SSD, USB, SD 카드 등에서 사용되고, NOR 플래시 메모리는 데이터 크기가 작고 빠른 실행 속도가 중요한 펌웨어, BIOS등에서 사용된다.
NAND 플래시 메모리 시장도 삼성전자와 SK하이닉스에서 선도하고 있다. 더 큰 용량의 NAND 플래시 메모리를 만들기 위해 NAND 플래시 메모리를 아파트처럼 위로 쌓는 3D NAND 플래시 메모리가 등장했다. 삼성전자는 2013년 세계최초로 24단을 쌓으며 3D NAND 플래시 메모리를 선보이고 현재 200단 이상의 3D NAND를 구현하며 업계를 선도하고 있다.
컴퓨터 시스템에서는 속도, 용량, 비용의 균형을 맞추기 위해 여러 종류의 메모리가 있다. 이러한 메모리들이 이루는 계층적인 구조는 아래 이미지와 같다. 메모리 계층 구조는 컴퓨터 시스템에서 데이터를 저장하고 처리하는 방식에 대한 개념이다. 가장 빠르고 비싼 메모리부터 가장 느리고 저렴한 메모리까지 계층적으로 구성된다.
가장 상위 계층의 레지스터(Register)는 CPU 내부의 고속 메모리로 가장 빠르며 CPU 클럭 속도와 동일하게 작동하므로 지연 시간이 거의 없다. 다만, 제조 비용이 매우 비싸고 용량이 제한적이기 때문에 소량만 사용된다. 그 다음 캐시 메모리(Cache Memory)는 CPU와 RAM 사이에 위치해 자주 사용되는 데이터를 임시로 저장해 CPU가 빠르게 접근하도록 돕는다. 캐시는 L1, L2, L3로 나뉘며, L1 캐시는 CPU에 내장되어 가장 빠르고 L3 캐시는 CPU 모든 코어 간에 공유된다. 다음 계층 메인 메모리(RAM)는 실행 중인 프로그램과 데이터를 임시로 저장하는 주기억 장치로 속도는 캐시보다는 느리지만 여전히 빠른 편이다. 마지막 보조 기억 장치(Secondary Storage)는 SSD, HDD가 이에 해당하며 메인 메모리보다 훨씬 더 큰 용량을 제공하지만 속도는 느리다. 이와 같이 자주 사용되는 데이터를 상위 계층(레지스터, 캐시)에서 처리하고, 덜 사용되는 데이터를 하위 계층(RAM, 보조 기억 장치)으로 이동시킴으로써 성능과 비용의 균형을 유지하며 컴퓨터 시스템이 효율적으로 작동하도록 돕는다.
메모리 반도체 시장의 전쟁
삼성과 SK하이닉스가 메모리 반도체 시장에서 글로벌 선두로 자리 잡게 된 과정은 기술 혁신, 대규모 투자, 전략적 방향 설정, 그리고 시장 환경의 변화가 어우러진 결과이다.
메모리 반도체의 시작은 미국이다. 미국의 IBM에서 1966년 세계 최초의 DRAM을 개발하였고 1971년 인텔은 이를 상용화하며 큰 성공을 거두었다. 혁신적인 기술력과 시장 선점을 통해 1974년 인텔의 DRAM 점유율은 무려 82.9%에 이르며 반도체 시장을 독식하였다. 이런 미국에 도전장을 내민 국가는 바로 일본이었다.
일본은 세계대전 패배 후 경제 재건을 위해 미국 기업들로부터 트랜지스터 제조 기술을 도입해 중공업 및 전자 산업 육성에 집중하였다. 반도체를 국가 전략 산업으로 지정하며, 트랜지스터 라디오와 휴대용 계산기 등을 만들어 반도체 산업의 노하우를 축적하였고 1971년 일본의 NEC, 도시바, 히타치 등은 DRAM 시장에 본격적으로 진입하였다. 그런데 2년 뒤 중동전쟁으로 인해 오일쇼크가 발생하며 유가가 400% 이상 폭등해 에너지 의존도가 높은 중공업(제철, 조선, 석유화학) 산업은 침체되고 세계 경제는 순식간에 얼어붙었다. 이에 따라 미국의 반도체 기업들은 투자를 축소하였지만 일본은 이를 기회로 중공업에서 반도체 및 전자 산업으로 산업 중심을 이동하며 투자에 박차를 가한다. 오일쇼크로 인한 경제 위기 속에서 일본은 공장의 규모를 확대하고 공정을 정교화해 수율을 높이고 생산 원가를 낮추는데 성공하며 고효율 생산 방식과 고품질 반도체 제품을 내세워 세계 시장에서 점유율을 빠르게 확대했다. 당시 일본은 반도체 제조 자동화 시스템을 도입해 일관된 품질을 유지했고, 정부의 강력한 지원을 바탕으로 미국보다 낮은 인건비와 생산 원가로 더 높은 수율의 DRAM을 생산할 수 있었다. 그리고 1984년 일본의 작전이 시작되었다. 일본 기업들은 자국 시장을 넘어 해외로 뻗기 위해 미국을 압박하는 공격적인 전략을 펼쳤다. DRAM을 초저가로 공급하여 미국 반도체 기업들이 가격 경쟁에서 완전히 밀려나도록 유도하였다. 당시 64K DRAM의 가격은 1년만에 3달러에서 0.3달러로 곤두박칠쳤으며, 1983년 64K DRAM 개발에 성공해 막 메모리 반도체 시장에 진입하였던 삼성은 DRAM 하나를 팔 때마다 1.4달러의 적자가 발생하여 한 해 누적 적자가 약 2억 달러에 달했고, 선두주자였던 인텔의 시장 점유율은 1.3%까지 추락하며 1985년 DRAM 사업에서 철수하였다. 미국의 많은 기업들이 도산 위기에 처하고, 일본은 세계 반도체 시장의 50%, DRAM 시장의 70% 이상을 차지하며 미국을 압도하게 된다.
위기를 맞은 미국 반도체 산업에 1986년 미국 정부가 직접 개입하였다. 미국은 일본이 불공정 경쟁을 하고 있다고 주장하며 조사한 결과, 일본 기업들이 미국 시장에서 자국(일본) 내보다 21.7%-188% 더 낮은 가격으로 메모리 반도체를 판매하고 있음을 확인하였다. 이에 따라 미국 정부는 일본산 메모리 반도체에 높은 덤핑 방지 관세를 부과했으며, 일본과 미·일 반도체 협정을 체결하였다. 이 협정은 반도체 가격을 인위적으로 낮추지 않으며 반도체 시장에서 미국 기업들의 일정 점유율(20%)을 보장하는 일본에 매우 불리한 협정이었다. 이 협정으로 일본 기업들은 생산량을 줄이며 DRAM의 가격은 다시 상승했다.
미국이 일본 반도체 산업을 견제하는 사이 한국의 반도체 기업들이 서서히 두각을 드러내기 시작한다. 가전제품을 판매하던 삼성전자는 한국반도체를 인수하며 1979년 반도체 연구소를 설립하여 본격적인 연구개발을 시작했다. 초기에는 일본의 덤핑 전략으로 인해 심각한 적자로 큰 타격을 받았지만 삼성은 과감히 투자를 단행하며 256K DRAM 개발에 성공하고, 미·일 반도체 협정으로 일본의 DRAM 독주가 제한되며 삼성전자가 시장에서 성장할 수 있는 기회가 생겼다. 1970년대 등장한 PC는 1980년대 후반부터 기업, 연구소, 학교에서 본격적으로 보급되었고 1990년대 초반 가정에도 보급되기 시작했다. PC가 본격적으로 보급되면서 DRAM 수요가 급증하게 되었는데, 당시 고품질 제품을 고수하던 일본의 DRAM은 가격이 비싸 슈퍼 컴퓨터나 서버용으로는 적합했지만 보급형 PC에는 적합하지 않았다. 시장에서 필요로 하는 제품을 싸게 만들기 위해 기술을 개발하는 삼성의 DRAM은 가격이 저렴하면서도 품질이 충분히 우수했기에, PC 제조업체(IBM, 컴팩, HP 등)들은 가성비가 좋은 삼성 DRAM을 선호하기 시작했다. 일본의 품질 우선주의는 격변하는 PC 시장에 맞지 않았던 것이다. 또한 삼성전자는 트렌치 방식 대신 스택 방식을 선택하며 시장에서 승기를 잡는다. 반도체 기술이 발전하면서 DRAM의 집적도를 높이기 위해 새로운 셀 구조가 필요했다. 기존 DRAM은 반도체 기판 위에 단순한 평면 구조로 트랜지스터와 커패시터를 배치하는 구조였고, 더 높은 용량(256K DRAM, 1M DRAM 등)을 만들기 위해 트렌치(Trench) 방식과 스택(Stack) 방식 두가지 방식이 있었다. 반도체 기판을 수직으로 깊게 파서 커패시터를 형성하는 트렌치 방식은 칩 면적이 작고 상대적으로 안정적이었지만, 깊게 파야 하므로 고용량 DRAM 개발에는 한계가 있었다. 반면 반도체 기판 위에 커패시터를 쌓아서 배치하는 스택 방식은 초기에는 수율이 낮았지만 집적도가 높아질수록 유리했다. 일본의 NEC, 도시바, 미국의 TI, IBM, 한국의 현대전자와 금성반도체 등은 트렌치 방식을 채택하였고, 일본의 히타치, 미츠비시, 마츠시타, 한국의 삼성전자 등은 스택 방식을 채택하였고 결과는 스택 그룹의 승리였다. DRAM 기술이 발전하며 더 높은 용량을 요구하면서 트렌치 방식은 고용량 DRAM을 만드는 데 한계가 있어 수율이 하락하였고, 트렌치 그룹들은 대부분 밀려났다. 삼성전자는 빠른 연구 개발과 양산을 통해 시장을 선점하였고, 특히, 1988년 PC 시장의 급성장과 함께 DRAM 가격이 폭등하면서 삼성은 엄청난 이익을 기록했다. 삼성전자는 1983년 반도체 시장에 본격적으로 진입한 이후 3년간의 적자를 기록했지만, 1988년 단 1년 만에 이를 모두 극복하였다. 1980년대 중반 일본과 미국의 주요 반도체 기업들은 150mm(6인치)에서 200mm 웨이퍼 전환을 고려하여 점진적으로 전환하기 시작하였다. 웨이퍼 크기가 커지면 같은 공정에서 더 많은 반도체 칩을 생산할 수 있어 생산성이 증가하며 원가도 절감할 수 있기 때문이다. 1988년 삼성전자는 이러한 추세에 맞게 200mm(8인치) 웨이퍼 도입을 결정하였고, 후발주자였지만 시장을 빠르게 선점하기 위해 대규모로 투자하여 한 번에 전환하는 전략을 택하여 1989년 삼성은 4M DRAM 양산과 함께 200mm 공정 체제를 본격적으로 가동하였다. 기술 변화에 다소 보수적이었던 일본과 달리, 급변하는 시장에 맞춰 기술 개발을 추진할 수 있는 삼성의 이러한 과감한 선택은 150mm 웨이퍼를 사용하는 경쟁사보다 80% 높은 생산성을 달성하고, 일본을 따라잡고 1위로 올라설 수 있는 기반이 되었다. 1992년 세계최초 64M DRAM을 개발에 성공하고 DRAM 시장 점유율 1위 기록한 삼성은 이후 계속 세계최초 수식어가 따라 붙었다.
1990년대 초반부터 미국 반도체 업계는 한국 반도체 기업들의 가격 경쟁력을 경계했고 반덤핑 혐의로 제소하였다. 조사 결과 삼성전자 0.74%, 현대전자 7.19%, 금성반도체 4.97%의 덤핑 마진을 확정하였다. 이 덤핑 수치는 의도적으로 가격을 낮춰 시장 질서를 왜곡한 일본의 수치(21.7%-188%)에 비하면 턱없이 낮은 수준이며, 이는 한국 기업들이 실제 기술력과 생산성에서 경쟁 우위를 점하고 있다는 것을 증명해주는 결과였다. 삼성은 이러한 DRAM의 기술력과 안정적인 수익을 바탕으로 새로운 사업에도 투자하기 시작했으며 반도체 및 전자 사업으로 확장할 수 있었다.
그런데 1997년 IMF 외환위기가 발생한다. 한국 경제가 무너지고 기업들은 줄도산 했으며, 현대전자와 금성반도체는 심각한 타격을 받았다. LG반도체로 이름을 바꾼 금성반도체는 1999년 정부의 구조조정에 의해 현대전자에 인수되었으며, 비슷한 시기 일본 반도체 업계에서도 구조조정이 진행되어 NEC, 히타치의 메모리 반도체 부문, 미츠비시의 DRAM 부문이 합쳐져 엘피다가 설립되었다. 이에 더불어 90년대 후반 비정상적으로 주가가 상승한 IT 기업들의 거품은 2000년에 닷컴 버블 붕괴가 시작되며 PC·서버 시장은 급격히 위축되었다. 급격히 위축된 시장에서 이미 대량생산된 DRAM은 공급과잉 상태가 되어 가격이 폭락한다. 정부의 압박과 시장 점유율 확대를 위해 무리하게 LG 반도체를 인수했던 현대전자는 DRAM 시장 침체로 떠안게 된 엄청난 적자를 감당하지 못했다. 이에 심각한 자금난에 빠진 현대그룹은 반도체 부문을 현대그룹에서 완전히 분리하며 현대전자를 하이닉스(Hynix)라는 새로운 회사로 독립시켰다. 이러한 반도체 시장 침체에도 불구하고 삼성전자는 재무구조가 비교적 탄탄했기에 과감한 반도체 투자를 지속했다. 미세 공정 기술을 계속 도입하며 DRAM 시장을 선도했고, DRAM 시장의 불안정성에 대비해 NAND 플래시 메모리에도 발빠르게 투자해 대량 양산을 하며 모바일, 디지털 카메라, SSD 시장을 공략하였으며, 2003년 NAND 플래시 메모리 시장 점유율 1위, 2005년 애니콜 휴대폰 시장 점유율 2위, 2006년 LCD TV 시장 점유율 1위를 기록했다. NAND 플래시 메모리는 1987년 일본 도시바에서 처음 개발되어 1990년대 후반 본격적으로 시장이 형성됐으며, 2005년 애플이 하드디스크 기반 아이팟에서 NAND 플래시 기반 아이팟으로 전환하면서 시장이 폭발적으로 성장하였고, 애플에 NAND 플래시를 공급한 삼성은 시장 점유율을 더욱 확대하였다. 삼성전자가 2000년대 초반 NAND 플래시에 과감히 투자한 것은, 이후 스마트폰, SSD, 모바일 기기 시장 성장에 결정적인 영향을 미친 선택이었다.
2001년 현대그룹에서 독립한 하이닉스는 대주주 없이 채권단들이 관리하는 워크아웃 구조였고 당시 부채가 9조 원에 달할 정도로 심각한 상황이었다. 이러한 상황에서 삼성과 같이 투자 유치와 같은 의사결정은 쉽지 않았고, 하이닉스는 살아남기 위해 구조조정을 하여 공장 인력, 비용을 감축하고, 시스템 반도체 사업을 마이크론에 매각하며 DRAM과 NAND 플래시 사업에 집중하였다. 이러한 구조조정으로 2004년에 워크아웃에서 벗어났고 반도체 가격이 다시 상승하면서 2005년 하이닉스는 흑자로 전환할 수 있었다. 이후 2012년 SK그룹에서 하이닉스를 인수하며 SK하이닉스로 새롭게 출발한다.
이러한 시기 메모리 반도체 시장에 치고 올라온 곳은 대만이다. 대만의 TSMC는 1987년 세계최초 설립된 순수 반도체 위탁 생산을 하는 파운드리 기업이다. 같은 시기 대만의 UMC도 파운드리 사업으로 전환하였다. 이들은 메모리 반도체가 아니라 파운드리(위탁 생산)에 집중하는 전략을 선택해 이들은 현재까지 파운드리 시장을 선점하고 있다. 그리고 대만의 난야, 파워칩, 윈본드 등은 1990년대 말부터 DRAM을 생산하기 시작했다. 2000년대 초반 DRAM 시장이 회복되면서 대만과 일본 기업들은 시장 점유율을 확대하기 위해 생산량을 급격히 늘리며 가격을 낮추는 저가 공세로 기업들을 다시 압박했다. 그런데 2008년 글로벌 금융위기가 더해져 전 세계적인 경기 침체로 DRAM 수요는 다시 한번 급감한다. 이에 한국 기업들은 큰 적자에도 더 큰 투자를 감행해 공장 건설을 앞당기며 공급량을 증대시키고, 같은 가격에 더 고용량의 DRAM을 공급하는 방식으로 대만 기업들의 공격에 대응했다. 금융위기에 더해 이러한 저가 공세로 시장을 흔들어놓은 결과는 참담했다. 독일의 키몬다는 파산했고, 일본의 엘피다는 마이크론에 인수되었다. 그리고 대만 기업들도 DRAM 사업을 철수하거나 저용량 DRAM 제품을 제작하는 쪽으로 사업을 조정하였다. 이후 살아남은 삼성전자와 하이닉스, 마이크론은 메모리 시장을 과점하며 막대한 이윤을 창출하며 빅3 체제가 되었다.