1로 시작하는 숫자가 30%인 이유, 그리고 그것이 복리·트레이딩과 만나는 지점
1 / 왜 이런 생각이 들었나
어떤 통계에서 첫자리가 1로 시작하는 값이 30%나 된다는 말을 들었다. 계좌잔고도 그렇다는데, 정말일까? 그러다 문득 엉뚱한 연결이 떠올랐다 — 자산을 모을 때 0에서 1억이 가장 어렵고, 1억→2억이 그다음, 2억→3억은 더 쉽다는 통념과 같은 구조 아닐까? 단위가 10억·100억이 돼도 비슷할까?
여기서 한 발 더 나갔다. 그렇다면 트레이딩으로 일정한 수익률을 낸다고 가정하면, 시드머니별로 가장 빠르게 불리는 수익률을 계산할 수 있을까? 그리고 퀀트 트레이더라면 결과가 좋을 때와 나쁠 때 리스크를 어떻게 조절해야 할까?
혼자 풀기엔 수학이 얽혀 있어 AI에게 차근차근 물어봤다. 아래는 그 정리다(수치·출처는 AI 조사 결과, 미검증).
2 / 벤포드의 법칙은?
AI에 따르면, 벤포드의 법칙(Benford's Law, 첫자리 법칙)은 자연 발생적 수치 데이터에서 첫 유효숫자 d(1~9)가 다음 확률로 나타난다는 것이다.
그러니까 "30% 정도"는 어림값이 아니라 log₁₀2의 정확값이었다.
왜 1이 압도적인가, 그리고 검증됐나
직관은 로그 스케일의 구간 너비다. 1에서 2로 가려면 100% 증가가 필요하지만(1을 유지하는 구간이 넓다), 9에서 10으로는 약 11%만 증가하면 첫자리가 바뀐다. 한 자릿수 구간에서 첫자리가 1인 영역이 log₁₀2 ≈ 0.301로 가장 넓다.
AI에 따르면 이건 수학·경험 양면에서 입증됐다. 수학적으로는 Theodore Hill(1995)이 척도 불변성(scale invariance — 측정 단위가 달러든 원이든 분포가 같다면 그 분포는 벤포드여야 함)과 혼합 표본의 수렴을 증명했다. 경험적으로는 Frank Benford(1938)가 강 면적·인구·물리상수 등 약 20개 데이터셋에서 확인했고, 이후 주가·회계장부·파일 크기 등에서 반복 검증됐다. 다만 보편 법칙은 아니다 — 여러 자릿수에 걸쳐 분포하고, 인위적 상하한이 없으며, 할당된 번호(전화·우편번호)가 아닐 때만 성립한다(사람 키처럼 범위가 좁으면 안 따른다).
계좌잔고는 전형적인 양성 사례라고 했다. 수천 원~수억 원까지 여러 자릿수에 걸쳐 있고 입출금·이자 누적의 결과라 조건을 잘 만족한다. 그래서 법회계(forensic accounting)에서 부정 탐지에 쓴다 — 사람이 숫자를 조작하면 첫자리 분포가 벤포드에서 이탈하는 경향이 있어, 그 이탈 자체가 신호가 된다(Mark Nigrini가 정립, IRS 탈세 탐지에 실제 활용).
AI가 든 근거(미검증): Theodore Hill(1995), Frank Benford(1938), Mark Nigrini(법회계).
3 / 자산 증식 속도와의 연관 — 덧셈과 곱셈의 차이
여기서 내 엉뚱한 직관이 맞았다. AI는 "유사한 게 아니라 수학적으로 같은 것"이라고 했다. 복리(compounding) 성장률 g에서 자산이 A→B로 가는 시간은 다음과 같다.
같은 1억을 더해도 분자 ln(B/A)가 달라진다. g=10%로 계산하면:
| 구간 | 필요 증가율 | = 벤포드 확률 | 소요 시간(g=10%) |
|---|---|---|---|
| 1억 → 2억 | +100% | 30.1% | 7.3년 |
| 2억 → 3억 | +50% | 17.6% | 4.3년 |
| 3억 → 4억 | +33% | 12.5% | 3.0년 |
| 4억 → 5억 | +25% | 9.7% | 2.3년 |
| 9억 → 10억 | +11% | 4.6% | 1.1년 |
가운데 열이 2장의 벤포드 확률과 완전히 같다. 우연이 아니다. 구간 d의 로그 너비 log₁₀(1+1/d)가 곧 벤포드 P(d)의 정의식이기 때문이다. "첫자리 1이 30.1%로 가장 흔하다"와 "한 자릿수 올리는 동안 1→2 더블링에 시간의 30.1%를 쓴다"는 같은 사실의 두 가지 읽기였다. 그래서 위로 갈수록 쉬워진다.
척도 불변 — 10억, 100억도 동일. g=10%면 1억→10억에 약 24.2년, 10억→100억도 같은 24.2년이다. 각 자릿수가 동일한 시간을 차지하고 내부 분배(30.1%, 17.6%…)도 매 구간 반복된다. 단, 이건 g가 일정할 때만 성립한다. 규모가 커지면 고수익 배치처가 줄고 마찰이 늘어 실효 g가 떨어지므로, 현실에선 윗 자릿수일수록 시간이 더 든다.
W* = S/r(S=연 저축, r=수익률) — 연 저축 2,000만·수익률 8%면 W* ≈ 2.5억. 이 아래선 저축이, 위에선 복리가 지배한다.4 / 직장인과 사업가의 차이
이 지점에서 내 직관의 빈틈이 드러났다. AI의 지적은 이랬다 — 순수 월급은 덧셈 과정이라, 그것만으로는 매 1억이 똑같이 어렵다. 위로 갈수록 쉬워지는 효과가 전혀 없다. 즉 "위로 갈수록 쉬워진다"는 관찰 자체가 이미 곱셈 엔진(투자·사업)을 암묵적으로 전제하고 있었다. 내가 단 "월급만으론 힘들고 투자나 사업으로 증식하면"이라는 단서가 사실은 이 효과의 필요조건이었던 것.
덧셈 엔진 (월급·저축)
- 매 기간 일정액을 더한다 → 직선적 성장
- 1억이든 10억이든 다음 1억은 똑같이 무겁다
- "위로 갈수록 쉬워짐"이 없음
- W* 이전 구간을 지배
곱셈 엔진 (투자·사업)
- 자본이 비율로 늘어난다 → 로그 공간에서 직선
- 윗 자릿수일수록 같은 1억의 무게가 가벼워짐(벤포드 구조)
- "돈이 돈을 번다"의 수학적 실체
- W* 이후 구간을 지배
"처음 몇억은 내가 벌고, 그 위부터는 돈이 번다"는 흔한 말에 정확한 임계값 W*가 대응한다. 다만 이건 직업을 바꾸라는 얘기가 아니라 소득 구조의 수학이다 — 월급쟁이도 저축을 곱셈 엔진(투자)에 태우는 순간 같은 곡선에 올라탄다. 핵심은 직업이 아니라, 내 자산에 곱셈 과정이 얼마나 작동하고 있는가다.
5 / 퀀트 트레이더로서 추구할 방향과 방법
그래서 "시드별로 가장 빠른 수익률"을 물었더니, AI는 먼저 함정을 짚었다. 순수 복리 모델엔 "성장을 최대화하는 최적 수익률"이 없다. 도달 시간 t = ln(T/W₀)/ln(1+r)은 r에 대해 단조 감소라, 30% > 20% > 10%로 높을수록 빠를 뿐 중간 정점이 없다. 그리고 로그 공간에서 시드머니는 출발 높이(상수 오프셋), 수익률은 기울기(속도)다 — 시드가 크다고 복리가 빨라지지 않고, 출발점만 위로 평행이동할 뿐이다.
진짜 최적값이 존재하는 유일한 지점은 변동성을 넣었을 때다. 수익률에 변동성이 있으면 실제 복리 성장률은 산술평균(arithmetic mean) μ가 아니라 기하평균(geometric mean) g ≈ μ − σ²/2다. 더 큰 변동성으로 더 높은 수익을 좇으면 σ² 항이 성장을 깎는다(변동성 드래그, variance drag). 그래서 베팅 비율 f에 진짜 정점이 생긴다 — 이게 켈리 기준(Kelly criterion) f* = μ/σ².
여기서 핵심 방향이 나온다 — 일정 비율만 베팅하되, 키울 때보다 줄일 때 더 빠르게, 드로다운(drawdown)이 깊어질수록 감축을 가속한다(anti-martingale). 마틴게일(martingale; 손실 후 베팅 2배)은 이 원칙의 정확한 역방향이고 수학적으로 파산에 수렴한다. AI가 든 네 개의 조절 레버:
- ① 기준 베팅 — ¼~½ 켈리. 풀켈리는 추정오차 때문에 위험. 내 실측 f*가 과대평가면 풀켈리가 이미 "성장률 0" 영역일 수 있다.
- ② 변동성 — 역방향(volatility targeting). 포지션 ∝ σ_target/σ_realized. 변동성이 커지면 자동 축소. 단 저변동 구간에서 레버리지를 키우므로 상한 캡(예: 3×) 필수.
- ③ 드로다운 — 가속 감축. 회복 비대칭(아래 표) 때문에 깊을수록 초선형으로 어렵다 → 감축도 선형이 아니라 가속. 예: 노출배수 m = clip(1 − DD/0.20, 0, 1).
- ④ 연속 손실 — 줄인다(anti-martingale). 고정 비율 + 연패 시 추가 감축. 트레이드당 리스크가 곧 "몇 연패까지 생존하나"를 정한다.
회복 비대칭 (③의 근거)
- −10% → 복구 +11.1%
- −20% → 복구 +25.0%
- −30% → 복구 +42.9%
- −50% → 복구 +100%
트레이드당 리스크 → 생존력 (④)
- 0.5% → 20연패 시 −9.5%
- 1.0% → 20연패 시 −18.2%
- 2.0% → 12연패에서 −20% 돌파
- "몇 %를 거나" = "몇 연패까지 사나"
AI가 제시한 통합 예시는 세 계층을 곱으로 쌓되 최하층을 최적화 불가능한 하드 경계로 두는 구조였다: L1 포지션 사이징(¼켈리·1% 상한 × 변동성 타게팅·3× 캡) → L2 자산곡선 스로틀(드로다운 배수 × 4연패 시 ×0.5) → L3 서킷 브레이커(일 −3%·주 −6%·고점대비 −20% 정지, 파라미터 탐색 대상 아님). 세 층 모두 "줄이는 건 빠르고 자동, 키우는 건 느리고 상한"이라는 비대칭을 공유한다.
이 방향은 사이트의 다른 자료와 정확히 이어진다 — 켈리·파산확률은 Learn 모듈 6(Surviving risk)에서, 직접 수치를 넣어보는 건 Position Size & Risk of Ruin 도구에서 다룬다. 위 파라미터는 그대로 쓰는 값이 아니라, 자기 데이터로 워크포워드·다중검정 보정을 거쳐 레짐별로 재추정해야 하는 출발점이다.
6 / 정량화 가능한 것 vs 추론
① 확립된 수학 (검증됨)
- 벤포드 P(d)=log₁₀(1+1/d) — Hill 정리·법회계 실무
- 복리 시간 t=ln(B/A)/ln(1+g), 구간 점감 = 벤포드 너비
- 회복 비대칭 D/(1−D)
- 변동성 드래그 g≈μ−σ²/2, 켈리 f*=μ/σ², 과베팅→파산
- 연환산(월10%=연214%) > Medallion 연~39%
② 가정·추론 (검증 불가)
- 일정한 g/수익률 유지 가정 (현실: 규모↑ → g↓)
- 내 실제 edge(p, b, μ, σ) 추정값
- 레짐 안정성 — 같은 f*도 레짐 바뀌면 과베팅
- 구체 파라미터(1%, 20% DD halt, 3× 캡)는 출발점일 뿐
- "위로 갈수록 쉬워짐"의 현실 지속성
이론과 내 실제 매매를 대조한다
이번 건 예측이라기보다 방법론에 가깝다. 그래서 되돌아볼 것은 "이 리스크 가드가 내 실제 결과에서 작동했는가"다.
- ¼~½켈리 + 변동성 타게팅 + 드로다운 브레이크를 적용했을 때 실제 최대 낙폭이 의도한 경계(−20%) 안에 머물렀나
- 레짐이 바뀌었을 때 f*를 재추정했나, 아니면 옛 추정치로 과베팅했나
- 월 두 자릿수 수익률 같은 "환상"의 유혹에 흔들리지 않았나
- 줄일 때 빠르게·키울 때 느리게라는 비대칭을 규칙으로 지켰나
관련 도구·자료
도구Position Size & Risk of Ruin — 승률·손익비를 넣어 켈리 비율과 파산확률을 직접 확인 Learn · Module 6 (English)
Surviving risk — 파산확률·켈리·드로다운·재량 갭을 다루는 입문 모듈