Lemma
수학, 거꾸로
도입 · 자취가 되려는 화살표

곡선은 지금 무엇을 하고 있는가?

움직이는 점은 자취를 남긴다. 미분은 그 자취가 아니다. 지금 이 순간, 자취가 되려고 하는 화살표다. 평균 속도는 두 점을 두고 나누면 그만이지만, 순간 속도는 점 하나뿐인데도 기어이 하나의 수로 정해진다. 그 수 — 물리·ML·공학의 모든 변화율이 결국 이것이다 — 는 두 점을 지나는 할선이 한 점에서의 접선으로 무너지도록 몰아붙여 얻는다.

아래 위젯: y=x2y = x² 위의 두 점을 잇는 주황색 할선. h를 0으로 끌면 할선이 갈색 접선으로 회전해 무너진다. 그 기울기가 수렴하는 값이 그 점에서의 미분 — 곡선의 순간 방향이 한 숫자로 응축된 것.

도구 사양
정의

순간 변화율. f(a)=limh0(f(a+h)f(a))/hf'(a) = \lim h→0 (f(a+h) − f(a)) / h. 자취가 지금 이 순간 되려는 화살표 — 두 번째 점이 첫 번째 점으로 무너져 들어가면서, 할선 기울기들이 하나의 접선 기울기로 좁혀진다.

적용

변화율이 등장하는 모든 곳. 속도 (위치 → 속력), 경사하강 (손실 → 한 걸음 방향), 작은 각 근사 (0 근처 sin θ ≈ θ), 물리·ML·제어의 국소 선형화. 한 기계, 네 이름: 기울기·속도·변화율·그래디언트.

한계

극한이 존재해야 한다. 뾰족한 모서리 (0에서의 |x|), 점프 (계단 함수), 병적인 진동 (어디서도 미분 불가능한 바이어슈트라스 함수)에는 미분이 없다. ML에서는 숨은 비미분 지점들 — ReLU의 0, 맥스풀링, 지시 함수 — 을 관례로 메운다. 수학이 아니라 합의로 메운다는 뜻이다 — 그 지점을 통과하는 그래디언트는 사실이 아니라 선택이다.

위젯 — 할선 → 접선
할선 기울기(f(a+h) − f(a))/h = 3.0000
접선 기울기f'(1.00) = 2·1.00 = 2.0000
차이 (= h)1.0000
주황색 Q를 초록색 P 쪽으로 끌거나 슬라이더로 h를 줄여 보자. 주황색 할선이 회전하며 갈색 점선 접선으로 무너진다. 할선 기울기 2a + h가 접선 기울기 2a로 다가가고, 위 차이 칸은 정확히 h로 작아진다. 그 수 — 두 점이 합쳐질 때 할선 기울기가 *수렴하는* 값 — 이 미분 f'(a). P를 움직이면 기울기가 단위 당 2의 속도로 바뀐다 — 그게 d/da [2a] = 2, 한 번 더 미분.
흐름
1

Δ 분의 Δ — 평균 변화율

t=0st = 0 sx=1kmx = 1 km에서 출발해 t=4st = 4 sx=9kmx = 9 km에 도착했다. 평균 속도는 (91)/(40)=2km/s(9 − 1) / (4 − 0) = 2 km/s. 이 수는 여정 전체를 요약할 뿐, t=2st = 2 s무엇을 하고 있었는지는 말해주지 않는다. 위치 그래프 위 (0,1)(0, 1)(4,9)(4, 9)를 잇는 직선이 , 그 기울기가 평균이다. 극한 없이도 계산할 수 있다.

# Average rate of change — the secant slope. Two points, one division.
def average_rate(f, a, b):
    return (f(b) - f(a)) / (b - a)

f = lambda t: t * t            # x(t) = t² — toy "position"
average_rate(f, 1, 3)          # → 4.0   (position went 1 → 9 in 2 seconds)
2

구간을 0으로 — 순간 변화율

t=2st = 2 s에서 무엇을 하고 있었나”는 할선의 두 점이 하나로 합쳐져야 답이 나온다. 기준점 a=2a = 2를 고정하고 작은 구간 hh를 잡아 (f(a+h)f(a))/h(f(a+h) − f(a)) / h를 계산하면서 hh를 줄여 나가자. f(t)=t2f(t) = t²이라면:

(f(2+h) − f(2)) / h
 = ((2+h)² − 4) / h
 = (4 + 4h + h² − 4) / h
 = 4 + h            ← independent of how big h is, except for the +h tail

h0h → 0일 때 식은 44로 수렴한다. 막연히 “다가간다”는 뜻이 아니다 — 값은 정확히 4+h4 + h이고, hh는 얼마든지 작게 만들 수 있다. 극한에서 살아남는 수 4t=2t = 2에서 t2이다 — f(2)=4f'(2) = 4. 기하적으로는 (2,4)(2, 4)를 지나는 의 기울기다.

# Instantaneous rate — shrink the interval and watch the secant slope
# converge to the tangent slope. No epsilon-delta; just shrink and look.
def secant_slope(f, a, h):
    return (f(a + h) - f(a)) / h

[secant_slope(f, 3, h) for h in (1, 0.1, 0.01, 0.0001)]
# → [7.0, 6.1, 6.01, 6.0001]
# The pattern: 6 + h. The limit as h → 0 is 6.
# That's f'(3) for f(t) = t².  In general, f'(t) = 2t.
3

기계는 하나, 이름은 셋 — 기울기·속도·변화율

레시피 — 두 점을 잡고, 할선 기울기를 계산하고, 구간을 줄이고, 극한을 취한다 — 는 무엇을 넣어도 같은 종류의 수를 낸다. ff가 시간 대 위치 함수면 미분은 . 가격 대 수익 그래프면 미분은 “한계수익.” 종이에 그린 곡선이면 미분은 각 점에서의 접선 기울기. 연산은 같고, 축에 무엇을 놓았는지에 따라 물리적 해석이나 기하적 해석이 달라질 뿐이다.

표준 패턴: xnx^n의 미분은 nx(n1)n·x^(n−1). 위젯은 n=2n = 2 경우를 보여준다 — 기준 a를 끌면 2a2a가 읽힌다. 같은 기계를 sinx\sin x에 돌리면 cosx\cos x가 나오고, exe^x에 돌리면 exe^x가 그대로 돌아오고, 상수에 돌리면 0. 이 이름들 — “미분법” — 은 장부일 뿐, 바닥에 깔린 연산은 단 하나, _할선 기울기의 극한_이다.

4

두 번 미분하면 — 가속도

함수의 미분은 그 자체로 함수다. 한 번 더 미분할 수 있다. f(t)=t2f(t) = t²이라면 f(t)=2tf'(t) = 2t (직선), f(t)=2f''(t) = 2 (상수). 위치를 두 번 미분하면 — 속도의 변화율 — 이 나오고, 자유낙하에서는 그 값이 상수 g−g다.

이 사다리 — 위치, 속도, 가속도 — 는 미분이라는 도구만 손에 쥐면 “뉴턴 제2법칙” 그 자체가 된다: 힘 = 질량 × 위치의 두 번째 미분. 입문 물리의 대부분은 이 한 사실의 대수·기하적 따름결과다.

5

이게 어디에 나타나나 — 같은 연산, 세 필러

미분은 단순히 기울기가 아니다. 국소적인 변화다 — 한 양을 아주 조금 건드렸을 때 다른 양이 어떻게 반응하는가. 같은 연산이 필러마다 다른 이름으로 나타나지만, 대수는 같다.

물리 : 위치가 속도로 바뀌고, 속도가 가속도로 바뀐다.
     그 변화를 결정하는 것이 힘.
ML   : 매개변수가 움직일 때 손실이 변한다.
     그래디언트가 손실이 떨어지는 방향을 말해준다.
금융 : 금리가 움직일 때 가격이 변한다. 미분이 그 민감도를 잰다 —
     채권에는 듀레이션, 옵션에는 그릭스.

포물선 운동 — 식 x(t)=v0cosθtx(t) = v₀ \cos θ · ty(t)=v0sinθt12gt2y(t) = v₀ \sin θ · t − \tfrac{1}{2} g t²를 미분하면 vx=v0cosθvₓ = v₀ \cos θ (상수)와 vy(t)=v0sinθgtv_y(t) = v₀ \sin θ − g t (선형)가 나온다. 위치를 미분하면 바로 속도가 되고, 한 번 더 미분하면 상수 g−g 가속도다.

진자시계 — 운동 방정식 θ¨=(g/L)sinθ\ddot{θ} = −(g/L) \sin θ왼쪽이 θ의 두 번 미분, 오른쪽이 θ의 함수다. sinθ\sin θθθ로 갈아끼우면 (선형화 트릭) θ¨=(g/L)θ\ddot{θ} = −(g/L) θ 방정식, 미분 도구가 알아보고 풀어낼 수 있는 형태가 된다.

종단속도 — 미분방정식 dv/dt=gkvdv/dt = g − k v는 왼쪽이 한 번의 미분, 오른쪽이 단위 질량당 알짜힘이다. — 종단속도 — 은 미분을 0으로 놓고 푼다 — gkvt=0g − k v_t = 0. 힘의 균형이란 정확히 “여기서 미분이 사라진다”는 뜻이다.

감쇠 진동자 — 식 x¨+2γx˙+ω02x=F(t)\ddot{x} + 2γ\dot{x} + ω₀² x = F(t)의 왼쪽에 미분이 두 번 깔린다 — 속도 항과 가속도 항. 바로 그 1계 도함수에 곱해진 항이고, 2계 도함수 기하와 외부 구동이 맞는 자리다. 페이지 전체가 미분 사다리를 두 번 돈 것이다.

경사하강법 — 손실 L(w)L(w)는 다변수 함수다. 그 L∇L은 편미분으로 이루어진 벡터. 한 스텝 wwηLw ← w − η · ∇L은 모든 매개변수에 대한 미분을 한꺼번에 쓴다. 손실이 떨어지는 비율은 L2\|∇L\|² — 학습이 진전하고 있는지를 판가름하는, 미분에서 나온 양이다.

현재가치 — 같은 연산, 금융 어휘로. 채권 가격은 PV(r)=0Tc(t)ertdtPV(r) = \int_0^T c(t) · e^{-rt} dt이고, 수정 듀레이션 D=(PV/r)/PVD = -(\partial PV / \partial r) / PV는 정규화된 미분 — 금리가 움직일 때 채권 가격이 얼마나 움직일지를 예측한다. 옵션의 그릭스도 같은 가족 — Δ=Price/S\Delta = \partial \text{Price} / \partial S, Γ\Gamma는 그 2계 도함수, 등등. 금융의 derivative수학의 미분 (derivative) 이 같은 단어인 데에는 이유가 있다.

이름은 달라도 같은 생각이다 — 물리에서는 속도, ML에서는 그래디언트, 금융에서는 민감도. 셋 다 미분이 국소적인 변화 규칙을 말해준다.

# Position → velocity → acceleration. Same machine, applied twice.
# Projectile: y(t) = v₀ sin θ · t − ½ g t²    (from /physics/projectile-motion)
#   dy/dt = v₀ sin θ − g t                    (vertical velocity)
#   d²y/dt² = −g                              (vertical acceleration — constant)
#
# Pendulum (small-angle): θ(t) = θ₀ cos(ω t),  ω = √(g/L)
#   dθ/dt  = −θ₀ ω sin(ω t)
#   d²θ/dt² = −θ₀ ω² cos(ω t) = −ω² · θ(t)   ← simple harmonic motion
#
# Each application's equation of motion is one or two derivatives applied
# to the position function. The derivative is the shared tool.

Δ는 구간을 안다. d는 순간을 안다. 미분은 구간이 0으로 줄어들 때 Δ가 도달하는 자리 — 그리고 그 살아남는 극한이, 물리가 변화율이라 부르는 모든 것이다.

exercises · 손으로 풀기
1평균 변화율 손계산계산기 없이

f(t)=t2f(t) = t²에서 구간 [1,3][1, 3]의 평균 변화율을 계산하라. 이어서 [1,1.1][1, 1.1], 그다음 [1,1.001][1, 1.001]. 어떤 패턴이 보이는가?

2t = 3에서 순간 변화율계산기 없이

f(t)=t2f(t) = t²에서 할선 기울기 정의로부터 f(3)f'(3)를 유도하라. 대수 과정을 한 단계도 빼지 말고 모두 보여라.

3곡선에서 접선 기울기

위젯은 y=x2y = x²를 보여준다. 공식을 쓰지 말고 a를 움직이고 h를 줄여서 x=0.5x = 0.5x=1.5x = 1.5에서 접선 기울기를 읽어내라. 두 수를 모두 설명하는 규칙을 한 줄로 적어라.

4포물선 운동 미분계산기 없이

포물선 운동의 세로 위치는 y(t)=v0sinθt12gt2y(t) = v₀ \sin θ · t − \tfrac{1}{2} g t²다. 같은 (f(a+h)f(a))/h(f(a+h) − f(a)) / h 레시피로 vy(t)=dy/dtv_y(t) = dy/dt를 유도하라. 포물선 위젯이 표시하는 v_y 값과 맞아떨어지는지 확인하라.

용어집 · 이 페이지에서 쓰임 · 10
secant·할선
곡선 위의 두 점을 지나는 직선. 기울기는 그 두 점 사이 구간에서의 함수의 _평균_ 변화율: `(f(b) − f(a)) / (b − a)`. 할선은 극한 없이 _계산할 수 있는_ 양 — 두 점, 한 번의 나눗셈. 접선은 그 두 점이 *합쳐지도록 강제*했을 때 할선이 도달하는 극한.
derivative·미분
한 점에서의 함수의 _순간_ 변화율 — 두 표본점 사이의 구간이 0으로 줄어들 때 할선 기울기의 극한으로 정의: `f'(a) = lim_{h→0} (f(a+h) − f(a)) / h`. 위치를 미분하면 속도, 속도를 미분하면 가속도, 시간에 대한 질량 미분은 질량 유량. 기하적으로는 접선의 기울기. 대수적으로는 `x²`를 `2x`로, `sin x`를 `cos x`로 바꾸는 연산. 물리·ML·공학에서 *변화율*이라 불리는 거의 모든 양이 무언가의 미분.
tangent line·접선
곡선과 한 점에서만 닿고 그 점에서 곡선의 방향과 *일치*하는 직선. 접점에서의 기울기가 그 점에서의 함수의 미분값: `m_접선 = f'(a)`. 두 교점이 합쳐질 때 할선이 도달하는 극한 — 곡선의 *순간 방향*을 직선으로 가시화한 것. 삼각함수의 *탄젠트*와는 다른 개념 (같은 단어).
velocity·속도
위치의 변화율. 벡터 — 크기 (속력)와 방향을 모두 가진다. 1차원에서 `v = dx/dt`, 2차원에서는 속도 벡터가 `(dx/dt, dy/dt)` 성분을 갖는다. 시간에 따라 변하지 않는 속도는 *균일*하다고 하며, 그때 위치는 시간에 선형. 속도가 변한다는 건 가속도가 0이 아니라는 뜻. _속력_ (수)과 _속도_ (벡터) 의 구분은 "빠르다"와 "어느 방향으로 빠르다"의 차이다.
acceleration·가속도
속도의 변화율. 역시 벡터. 1차원에서 `a = dv/dt = d²x/dt²`. 가속도가 일정하면 속도는 시간에 선형, 위치는 이차. 뉴턴의 제2법칙 `F = ma`는 힘과 가속도가 비례한다고 말하며, 질량이 변환 상수. 지표면 근처에서 자유낙하하는 _어떤_ 물체든 가속도는 거의 일정하고, 그 값은 *물체의 질량과 무관*하다 — 한 숫자로 다 대신할 수 있다.
simple harmonic motion·단순조화운동
상수 `ω > 0`에 대해 `ẍ = −ω²x`로 지배되는 운동. 해는 사인꼴: `x(t) = A cos(ωt + φ)`. 주기 `T = 2π/ω`는 진폭 `A`와 무관하다. 후크의 법칙을 따르는 용수철은 _정확히_ 이 운동. 진자는 작은 각 극한, 즉 `sin θ`를 `θ`로 바꾼 _뒤에만_ 이 운동. 물리·공학·신호처리의 "진동" 직관 대부분이 이 한 식 안에 산다.
fixed point·고정점
함수 또는 갱신 규칙을 통과해도 그대로인 값. 반복 `x ← f(x)`에서 고정점 `x*`는 `f(x*) = x*`를 만족 — 규칙을 한 번 더 적용해도 아무것도 바뀌지 않는다. 미분방정식 `dx/dt = g(x)`에서는 `g(x*) = 0`이 되는 자리 — 시스템이 더 진화하지 않는 곳. 물리의 _평형_, 최적화의 _최솟값_, 수치해석의 *정상상태*가 모두 같은 대상을 이름만 바꿔 부른 것 — _다음 스텝이 자기 자리로 돌아오는 자리_. 두 종류가 중요하다 — _안정_ (작은 교란이 사라지고 시스템이 돌아옴) 과 _불안정_ (작은 교란이 자라고 시스템이 벗어남). 둘을 가르는 건 국소 도함수 `g'(x*)`의 부호.
damping·감쇠
진동자에서 에너지를 빼내 결국 정지에 이르게 하는 모든 메커니즘. 가장 단순한 모형은 *속도에 비례*하는 것 — 운동 반대 방향으로 힘 `−c · ẋ` — 으로, 식 `m ẍ + c ẋ + k x = 0`을 선형이고 풀기 쉽게 만든다. `c`가 `√(4mk)`와 비교해 어떤지에 따라 세 영역 — _부족 감쇠_ (줄어들면서 진동), _임계 감쇠_ (가장 빠르게 정지, 진동 없음), _과 감쇠_ (느리게 정지, 진동 없음). 감쇠는 *공기 저항*보다 더 일반적이다 — 공기 저항은 한 특정 원천 (유체 저항) 이고, 감쇠는 마찰, 점성 흐름, 전기 저항, 구조적 이력 등 진동자의 에너지를 가져가서 돌려주지 않는 모든 것을 포괄한다.
resonance·공명
외부 구동력이 진동자의 _자연 진동수_ 근처에서 (또는 정확히 그곳에서) 밀 때 일어나는 일. 매 번의 밀기가 진동자가 이미 같은 방향으로 움직이고 있을 때 도착 — 에너지가 동기적으로 들어가고, 진폭이 자란다. 공명에서 벗어나면, 밀기가 번갈아 에너지를 더하고 빼면서 반응이 작게 유지된다. 구동 진동수 `ω`의 함수로서 정상상태 진폭은 `A(ω) = F / √((ω₀² − ω²)² + (2γω)²)`, 가벼운 감쇠에서는 `ω = ω₀` 근처에 피크. _감쇠가 가벼울수록 더 날카롭고 높은 피크._ 같은 항등식이 오페라 가수가 유리잔을 깨뜨리는 것, 타코마 협곡 다리 붕괴, MRI 핵의 뒤집힘, 하늘 가득한 신호에서 라디오 다이얼이 한 방송을 골라내는 것 — 모두를 지배한다. 공명은 *특별한 힘*이 아니라, 시스템이 이미 가지고 있는 박자에 에너지를 주입하는 일.
gradient·그래디언트
함수의 여러 방향 기울기를 한 번에 모은 것. 함수 f(x, y, z, ...) 에 대해 그래디언트는 편미분의 벡터 — 가장 가파른 상승 방향을 가리킨다. 머신러닝에서 이 벡터는 손실을 줄이려면 파라미터를 어느 쪽으로 옮겨야 하는지 옵티마이저에게 알려준다.
⚠ ML에서: 모든 파라미터에 대한 손실의 편미분 벡터. 최적화는 그래디언트의 반대 방향으로 한 걸음씩 이동한다 ("경사하강"). 그래디언트 계산에 들어가는 값이 언더플로우로 0이 되면 사슬 전체가 끊긴다 — 그래서 로그 공간이 중요하다.