Quant for Life · 궁금증 기록

1로 시작하는 숫자가 30%인 이유, 그리고 그것이 복리·트레이딩과 만나는 지점

비전문가의 궁금증을 AI에게 조사·추론하게 한 기록입니다. 어떤 주장이나 투자 조언이 아닙니다. 1~3장은 수학적으로 확립된 내용에 가깝지만, 4장의 수치는 AI가 든 예시로 그대로 따르라는 권고가 아니며, 모두 독립 검증되지 않았습니다(미검증). 지금의 생각을 남겨 두고 시간이 지나 되돌아보려는 사고 기록입니다.

기록일 2026-06-27by ridingyo조사: AI

1 / 왜 이런 생각이 들었나

어떤 통계에서 첫자리가 1로 시작하는 값이 30%나 된다는 말을 들었다. 계좌잔고도 그렇다는데, 정말일까? 그러다 문득 엉뚱한 연결이 떠올랐다 — 자산을 모을 때 0에서 1억이 가장 어렵고, 1억→2억이 그다음, 2억→3억은 더 쉽다는 통념과 같은 구조 아닐까? 단위가 10억·100억이 돼도 비슷할까?

여기서 한 발 더 나갔다. 그렇다면 트레이딩으로 일정한 수익률을 낸다고 가정하면, 시드머니별로 가장 빠르게 불리는 수익률을 계산할 수 있을까? 그리고 퀀트 트레이더라면 결과가 좋을 때와 나쁠 때 리스크를 어떻게 조절해야 할까?

혼자 풀기엔 수학이 얽혀 있어 AI에게 차근차근 물어봤다. 아래는 그 정리다(수치·출처는 AI 조사 결과, 미검증).

2 / 벤포드의 법칙은?

AI에 따르면, 벤포드의 법칙(Benford's Law, 첫자리 법칙)은 자연 발생적 수치 데이터에서 첫 유효숫자 d(1~9)가 다음 확률로 나타난다는 것이다.

P(d) = log₁₀(1 + 1/d) → P(1) = log₁₀2 ≈ 30.1%

그러니까 "30% 정도"는 어림값이 아니라 log₁₀2의 정확값이었다.

AI가 제시한 분포(수학적으로 확립). 뒤에서 보겠지만, 이 막대 높이는 "한 자릿수 구간을 지나는 동안 그 첫자리에 머무는 시간 비중"과 정확히 같다.

왜 1이 압도적인가, 그리고 검증됐나

직관은 로그 스케일의 구간 너비다. 1에서 2로 가려면 100% 증가가 필요하지만(1을 유지하는 구간이 넓다), 9에서 10으로는 약 11%만 증가하면 첫자리가 바뀐다. 한 자릿수 구간에서 첫자리가 1인 영역이 log₁₀2 ≈ 0.301로 가장 넓다.

AI에 따르면 이건 수학·경험 양면에서 입증됐다. 수학적으로는 Theodore Hill(1995)이 척도 불변성(scale invariance — 측정 단위가 달러든 원이든 분포가 같다면 그 분포는 벤포드여야 함)과 혼합 표본의 수렴을 증명했다. 경험적으로는 Frank Benford(1938)가 강 면적·인구·물리상수 등 약 20개 데이터셋에서 확인했고, 이후 주가·회계장부·파일 크기 등에서 반복 검증됐다. 다만 보편 법칙은 아니다 — 여러 자릿수에 걸쳐 분포하고, 인위적 상하한이 없으며, 할당된 번호(전화·우편번호)가 아닐 때만 성립한다(사람 키처럼 범위가 좁으면 안 따른다).

계좌잔고는 전형적인 양성 사례라고 했다. 수천 원~수억 원까지 여러 자릿수에 걸쳐 있고 입출금·이자 누적의 결과라 조건을 잘 만족한다. 그래서 법회계(forensic accounting)에서 부정 탐지에 쓴다 — 사람이 숫자를 조작하면 첫자리 분포가 벤포드에서 이탈하는 경향이 있어, 그 이탈 자체가 신호가 된다(Mark Nigrini가 정립, IRS 탈세 탐지에 실제 활용).

AI가 든 근거(미검증): Theodore Hill(1995), Frank Benford(1938), Mark Nigrini(법회계).

3 / 자산 증식 속도와의 연관 — 덧셈과 곱셈의 차이

여기서 내 엉뚱한 직관이 맞았다. AI는 "유사한 게 아니라 수학적으로 같은 것"이라고 했다. 복리(compounding) 성장률 g에서 자산이 A→B로 가는 시간은 다음과 같다.

t = ln(B/A) / ln(1+g)

같은 1억을 더해도 분자 ln(B/A)가 달라진다. g=10%로 계산하면:

구간	필요 증가율	= 벤포드 확률	소요 시간(g=10%)
1억 → 2억	+100%	30.1%	7.3년
2억 → 3억	+50%	17.6%	4.3년
3억 → 4억	+33%	12.5%	3.0년
4억 → 5억	+25%	9.7%	2.3년
9억 → 10억	+11%	4.6%	1.1년

가운데 열이 2장의 벤포드 확률과 완전히 같다. 우연이 아니다. 구간 d의 로그 너비 log₁₀(1+1/d)가 곧 벤포드 P(d)의 정의식이기 때문이다. "첫자리 1이 30.1%로 가장 흔하다"와 "한 자릿수 올리는 동안 1→2 더블링에 시간의 30.1%를 쓴다"는 같은 사실의 두 가지 읽기였다. 그래서 위로 갈수록 쉬워진다.

척도 불변 — 10억, 100억도 동일. g=10%면 1억→10억에 약 24.2년, 10억→100억도 같은 24.2년이다. 각 자릿수가 동일한 시간을 차지하고 내부 분배(30.1%, 17.6%…)도 매 구간 반복된다. 단, 이건 g가 일정할 때만 성립한다. 규모가 커지면 고수익 배치처가 줄고 마찰이 늘어 실효 g가 떨어지므로, 현실에선 윗 자릿수일수록 시간이 더 든다.

그런데 "0 → 첫 1억"은 벤포드가 아니다. 0에서는 곱셈이 작동하지 않는다(0 × 무엇 = 0). 벤포드와 복리는 로그 공간에 사는데 0은 −∞라 그림 밖이다. 첫 1억이 가장 어려운 건 로그 너비 효과가 아니라 덧셈(저축) → 곱셈(복리)으로의 레짐(regime) 전환 때문이다. 전환점은 대략 W* = S/r(S=연 저축, r=수익률) — 연 저축 2,000만·수익률 8%면 W* ≈ 2.5억. 이 아래선 저축이, 위에선 복리가 지배한다.

4 / 직장인과 사업가의 차이

이 지점에서 내 직관의 빈틈이 드러났다. AI의 지적은 이랬다 — 순수 월급은 덧셈 과정이라, 그것만으로는 매 1억이 똑같이 어렵다. 위로 갈수록 쉬워지는 효과가 전혀 없다. 즉 "위로 갈수록 쉬워진다"는 관찰 자체가 이미 곱셈 엔진(투자·사업)을 암묵적으로 전제하고 있었다. 내가 단 "월급만으론 힘들고 투자나 사업으로 증식하면"이라는 단서가 사실은 이 효과의 필요조건이었던 것.

덧셈 엔진 (월급·저축)

매 기간 일정액을 더한다 → 직선적 성장
1억이든 10억이든 다음 1억은 똑같이 무겁다
"위로 갈수록 쉬워짐"이 없음
W* 이전 구간을 지배

곱셈 엔진 (투자·사업)

자본이 비율로 늘어난다 → 로그 공간에서 직선
윗 자릿수일수록 같은 1억의 무게가 가벼워짐(벤포드 구조)
"돈이 돈을 번다"의 수학적 실체
W* 이후 구간을 지배

"처음 몇억은 내가 벌고, 그 위부터는 돈이 번다"는 흔한 말에 정확한 임계값 W*가 대응한다. 다만 이건 직업을 바꾸라는 얘기가 아니라 소득 구조의 수학이다 — 월급쟁이도 저축을 곱셈 엔진(투자)에 태우는 순간 같은 곡선에 올라탄다. 핵심은 직업이 아니라, 내 자산에 곱셈 과정이 얼마나 작동하고 있는가다.

5 / 퀀트 트레이더로서 추구할 방향과 방법

그래서 "시드별로 가장 빠른 수익률"을 물었더니, AI는 먼저 함정을 짚었다. 순수 복리 모델엔 "성장을 최대화하는 최적 수익률"이 없다. 도달 시간 t = ln(T/W₀)/ln(1+r)은 r에 대해 단조 감소라, 30% > 20% > 10%로 높을수록 빠를 뿐 중간 정점이 없다. 그리고 로그 공간에서 시드머니는 출발 높이(상수 오프셋), 수익률은 기울기(속도)다 — 시드가 크다고 복리가 빨라지지 않고, 출발점만 위로 평행이동할 뿐이다.

현실 게이트 — 월 두 자릿수 수익률은 환상. 월 수익률을 연환산하면 가정이 무너진다. 월 10% → 연 +213.8%, 월 20% → 연 +791.6%, 월 30% → 연 +2,229.8%. 역대 최고로 꼽히는 Renaissance Medallion 펀드가 수수료 후 연 ~39% 수준인데, 월 10% 가정만으로 인류 최고 펀드를 3배 이상 초과한다. "꾸준히"라는 말이 월 단위 두 자릿수에 붙는 순간 계획이 아니라 환상이 된다.

진짜 최적값이 존재하는 유일한 지점은 변동성을 넣었을 때다. 수익률에 변동성이 있으면 실제 복리 성장률은 산술평균(arithmetic mean) μ가 아니라 기하평균(geometric mean) g ≈ μ − σ²/2다. 더 큰 변동성으로 더 높은 수익을 좇으면 σ² 항이 성장을 깎는다(변동성 드래그, variance drag). 그래서 베팅 비율 f에 진짜 정점이 생긴다 — 이게 켈리 기준(Kelly criterion) f* = μ/σ².

g(c) = g*·c(2−c). ½켈리와 1.5×켈리는 성장률(75%)이 같지만 변동성은 3배 — 과베팅은 열등하다. 그래서 보통 ¼~½켈리를 쓴다(추정오차에 대한 헤지).

여기서 핵심 방향이 나온다 — 일정 비율만 베팅하되, 키울 때보다 줄일 때 더 빠르게, 드로다운(drawdown)이 깊어질수록 감축을 가속한다(anti-martingale). 마틴게일(martingale; 손실 후 베팅 2배)은 이 원칙의 정확한 역방향이고 수학적으로 파산에 수렴한다. AI가 든 네 개의 조절 레버:

① 기준 베팅 — ¼~½ 켈리. 풀켈리는 추정오차 때문에 위험. 내 실측 f*가 과대평가면 풀켈리가 이미 "성장률 0" 영역일 수 있다.
② 변동성 — 역방향(volatility targeting). 포지션 ∝ σ_target/σ_realized. 변동성이 커지면 자동 축소. 단 저변동 구간에서 레버리지를 키우므로 상한 캡(예: 3×) 필수.
③ 드로다운 — 가속 감축. 회복 비대칭(아래 표) 때문에 깊을수록 초선형으로 어렵다 → 감축도 선형이 아니라 가속. 예: 노출배수 m = clip(1 − DD/0.20, 0, 1).
④ 연속 손실 — 줄인다(anti-martingale). 고정 비율 + 연패 시 추가 감축. 트레이드당 리스크가 곧 "몇 연패까지 생존하나"를 정한다.

회복 비대칭 (③의 근거)

−10% → 복구 +11.1%
−20% → 복구 +25.0%
−30% → 복구 +42.9%
−50% → 복구 +100%

트레이드당 리스크 → 생존력 (④)

0.5% → 20연패 시 −9.5%
1.0% → 20연패 시 −18.2%
2.0% → 12연패에서 −20% 돌파
"몇 %를 거나" = "몇 연패까지 사나"

AI가 제시한 통합 예시는 세 계층을 곱으로 쌓되 최하층을 최적화 불가능한 하드 경계로 두는 구조였다: L1 포지션 사이징(¼켈리·1% 상한 × 변동성 타게팅·3× 캡) → L2 자산곡선 스로틀(드로다운 배수 × 4연패 시 ×0.5) → L3 서킷 브레이커(일 −3%·주 −6%·고점대비 −20% 정지, 파라미터 탐색 대상 아님). 세 층 모두 "줄이는 건 빠르고 자동, 키우는 건 느리고 상한"이라는 비대칭을 공유한다.

이 방향은 사이트의 다른 자료와 정확히 이어진다 — 켈리·파산확률은 Learn 모듈 6(Surviving risk)에서, 직접 수치를 넣어보는 건 Position Size & Risk of Ruin 도구에서 다룬다. 위 파라미터는 그대로 쓰는 값이 아니라, 자기 데이터로 워크포워드·다중검정 보정을 거쳐 레짐별로 재추정해야 하는 출발점이다.

6 / 정량화 가능한 것 vs 추론

① 확립된 수학 (검증됨)

벤포드 P(d)=log₁₀(1+1/d) — Hill 정리·법회계 실무
복리 시간 t=ln(B/A)/ln(1+g), 구간 점감 = 벤포드 너비
회복 비대칭 D/(1−D)
변동성 드래그 g≈μ−σ²/2, 켈리 f*=μ/σ², 과베팅→파산
연환산(월10%=연214%) > Medallion 연~39%

② 가정·추론 (검증 불가)

일정한 g/수익률 유지 가정 (현실: 규모↑ → g↓)
내 실제 edge(p, b, μ, σ) 추정값
레짐 안정성 — 같은 f*도 레짐 바뀌면 과베팅
구체 파라미터(1%, 20% DD halt, 3× 캡)는 출발점일 뿐
"위로 갈수록 쉬워짐"의 현실 지속성

되돌아보기 · Revisit log

이론과 내 실제 매매를 대조한다

이번 건 예측이라기보다 방법론에 가깝다. 그래서 되돌아볼 것은 "이 리스크 가드가 내 실제 결과에서 작동했는가"다.

¼~½켈리 + 변동성 타게팅 + 드로다운 브레이크를 적용했을 때 실제 최대 낙폭이 의도한 경계(−20%) 안에 머물렀나
레짐이 바뀌었을 때 f*를 재추정했나, 아니면 옛 추정치로 과베팅했나
월 두 자릿수 수익률 같은 "환상"의 유혹에 흔들리지 않았나
줄일 때 빠르게·키울 때 느리게라는 비대칭을 규칙으로 지켰나

업데이트 [ ] — 시간이 지난 뒤 내 매매 기록과 대조해 여기 적는다.