딥러닝1998

합성곱 신경망 (CNN) — LeNet

얀 르쿤이 손글씨 숫자 인식용 CNN 아키텍처를 발표

LeNet-5 아키텍처: 합성곱 → 풀링 → 완전연결 파이프라인 (Wikimedia Commons)

CNN은 합성곱 레이어를 사용하여 이미지의 공간적 특징을 자동으로 추출합니다. 필터가 이미지 위를 슬라이딩하며 엣지, 텍스처 등의 패턴을 감지하고, 풀링 레이어로 차원을 축소합니다.

합성곱 연산

(I * K)(i,j) = \sum_m \sum_n I(i+m, j+n) \cdot K(m,n)

I=입력 이미지 (픽셀 값의 2D 행렬)

K=커널/필터 — 감지할 패턴 (예: 엣지, 블러)

(i, j)=출력 특징 맵의 좌표 위치

(m, n)=필터 내부 좌표 (필터 크기만큼 순회)

Σ=필터 영역의 픽셀×필터 값을 모두 합산

합성곱(Convolution)

필터를 이미지 위로 슬라이딩하며 특징을 추출하는 연산

풀링(Pooling)

공간 크기를 줄여 계산량을 감소시키고 위치 불변성을 확보

특징 맵(Feature Map)

합성곱 결과로 얻어지는 2D 행렬 — 특정 패턴의 위치 정보

얀

얀 르쿤

LeNet-5 설계, CNN의 선구자 (현 Meta AI 수석 과학자)

이미지 인식의 패러다임을 바꾸었으며, 이후 AlexNet, VGG, ResNet 등 모든 비전 모델의 기반 아키텍처가 되었습니다.

CNNConvolutional Neural Network

합성곱 신경망. 필터를 슬라이딩하여 이미지의 공간적 특징을 자동 추출

커널/필터Kernel / Filter

작은 가중치 행렬(보통 3×3). 이미지 위를 이동하며 특정 패턴(엣지 등)을 감지

특징 맵Feature Map

합성곱 결과로 나오는 2D 행렬. 특정 패턴이 어디에 있는지를 나타냄

풀링Pooling

공간 크기를 줄이는 연산 (Max Pooling, Average Pooling). 계산량 감소 + 위치 불변성

스트라이드Stride

필터가 이동하는 칸 수. 1이면 한 칸씩, 2이면 두 칸씩 건너뜀

AI 발전사