ADsP2026년 4월 15일· 9 min read

비전공자 ADsP 준비, 통계·R 처음이면 이렇게

통계와 R을 한 번도 안 써본 비전공자가 ADsP를 준비할 때 겪는 어려움과 실용적인 극복 전략을 정리했어요.

안녕하세요. 문어입니다 🐙


"통계 한 번도 안 배웠는데 가능할까요?"

ADsP 준비하려는 비전공자 분들이 가장 많이 하는 질문이에요. 결론은 가능하지만, 전공자 기준 "1–2주면 된다"는 후기를 그대로 믿으면 안 됩니다.

비전공자라면 현실적으로 3–4주, 넉넉히는 1–1.5달 잡아야 해요. 그만큼 투자하면 합격 가능성이 충분히 높습니다.


비전공자가 막히는 포인트

1. 통계 용어 자체가 낯섦

"귀무가설", "신뢰구간", "정상성" 같은 단어가 처음이면 교재 읽는 속도가 안 나요. 한 문장 이해하는 데 5분씩 걸리는 구간이 있거든요.

2. R 코드 읽기

x <- c(1, 2, 3, 4, 5)
mean(x, na.rm = TRUE)

이 정도 간단한 코드도 처음 보면 "<- 이게 뭐지? c()는 왜 함수지?" 하고 막혀요. 시험에 R 코드가 3–4문제 나오는데, 코드 자체를 읽을 수 있어야 풀 수 있습니다.

3. 알고리즘 이름이 너무 많음

KDD·CRISP-DM·SEMMA, 릿지·라쏘, 배깅·부스팅, K-means·DBSCAN… 이름만 들어도 머리 아픈데 시험은 이들을 비교해서 물어봐요.


3–4주 플랜 (현실적)

주차집중 영역일일 투자
1주차1·2과목 개념 + 용어 정리1–2시간
2주차3과목 전반부: R 기초 + 통계 + 회귀2시간
3주차3과목 후반부: 분류·앙상블·군집·연관·시계열2시간
4주차기출/모의고사 반복 + 오답 정리2–3시간

시간이 부족하면 4주차의 모의고사 반복을 최소 3회 이상 확보하세요. 개념보다 문제 패턴이 점수를 만드는 시험입니다.


통계 "처음" 파트별 팁

1. 기술통계 vs 추론통계

  • 기술통계 = 요약(평균·중앙값·표준편차) → 쉬움
  • 추론통계 = 추정·검정 → 낯섦

추론통계는 "표본으로 전체를 추측하는 것" 으로 이해하면 충분해요. 깊은 수학적 유도는 시험에 안 나옵니다.

2. 제1종 오류 vs 제2종 오류

귀무가설 참귀무가설 거짓
기각제1종 오류 (α)정답
채택정답제2종 오류 (β)
표 하나로 외우세요. "참인데 기각 = 1종"이라는 한 문장만 입에서 나오면 돼요.

3. 신뢰구간

"95% 신뢰구간"의 정확한 정의는 까다로운데, 시험에서는 이 정도만 알면 됩니다.

  • 신뢰수준 ↑ → 구간 폭 ↑ (99%가 95%보다 넓음)
  • 표본 크기 ↑ → 구간 폭 ↓ (더 좁아짐)

방향만 기억하면 보기 고르기 쉬워요.


R 코드 "처음" 파트별 팁

외울 함수 10개

c(1, 2, 3)           # 벡터 생성
list(a=1, b="x")     # 리스트
matrix(1:6, 2, 3)    # 행렬
data.frame(x=1:3)    # 데이터프레임
mean(x)              # 평균
sum(x, na.rm=TRUE)   # NA 제외 합계
length(x)            # 길이
nrow(df) / ncol(df)  # 행/열 개수
summary(df)          # 요약 통계
head(df) / tail(df)  # 앞/뒤 미리보기

이 10개만 알면 시험 R 문제의 80%는 대응 가능해요. apply, sapply 같은 함수는 시간 여유 있을 때 보세요.

연산자

  • <- = 할당 (변수에 값 넣기, = 과 거의 동일하게 써도 됨)
  • : = 연속 수열 (1:5 → 1,2,3,4,5)
  • %in% = 포함 여부
  • na.rm = TRUE = NA 제외

알고리즘 "처음" 접근법

알고리즘 이름이 너무 많아서 전부 깊게 이해하려 하면 시간이 부족해요. 한 줄 정의만 외우고 넘어가세요.

알고리즘한 줄 정의
로지스틱 회귀범주형(0/1) 예측용 회귀
릿지(Ridge)L2 규제, 계수 크기 줄임
라쏘(Lasso)L1 규제, 일부 계수를 0으로
의사결정나무불순도 기반으로 분할
KNN가장 가까운 K개 이웃 참조
랜덤포레스트의사결정나무 여러 개 묶음(배깅)
K-meansK개 중심점에 데이터 할당 반복

동작 원리 설명할 수준은 필요 없어요. 보기 중에서 맞는 거 고를 정도면 합격권입니다.


계산 문제는 "암기 + 훈련"

비전공자가 처음엔 무서워하는 계산 문제지만, 사실은 여기서 점수 벌기 가장 쉬워요. 공식이 고정이고 답이 명확하거든요.

연관분석 공식만 외우면 됨

100건 중 A 40건, B 50건, A∩B 20건일 때:
  지지도(A,B) = 20/100 = 20%
  신뢰도(A→B) = 20/40 = 50%
  향상도(A→B) = 신뢰도 / P(B) = 0.5/0.5 = 1.0

공식 3개만 외우고 5문제 정도 직접 풀어보면 시험장에서 자동으로 나옵니다.

혼동행렬은 표 암기

혼동행렬 4칸과 정확도·정밀도·재현율 공식만 외우세요. 여기서 1–2문제는 거의 확정적으로 맞출 수 있어요.


비전공자가 피해야 할 함정

1. "이해 못했는데 일단 다음 장"

통계에서 한 번 막히면 뒤 챕터도 줄줄이 막혀요. 모르는 단어는 그날 안에 정리하고 넘어가세요. 네이버 블로그·유튜브 5분 영상이면 대부분 해결됩니다.

2. 기출만 돌리기

개념 없이 기출만 반복하면 변형 문제에서 무너져요. 개편 이후 객관식은 보기 패턴을 바꾸기 쉽거든요. 기출 풀고 → 틀린 주제 교재로 되돌아가기 루프가 효율적이에요.

3. "3과목 너무 많아서 1·2과목만 잘 보자"

3과목이 30문항이에요. 1·2과목 합쳐 봤자 20문항입니다. 3과목을 포기하면 합격선 60점을 못 넘깁니다.


시험 전 1주일 체크리스트

  • 1·2과목 핵심 용어 암기 완료
  • CRISP-DM 6단계 순서대로 나옴
  • 릿지(L2) / 라쏘(L1) 방향 입에서 나옴
  • 연관분석 3공식 직접 계산 가능
  • 혼동행렬 지표 공식 암기
  • 모의고사 3회 이상 완료
  • 오답 노트 정리됨

정리

비전공자의 ADsP는 "이해"보다 "암기 + 패턴 훈련" 으로 접근하는 게 효율적이에요. 통계와 R을 처음 보는 부담은 있지만, 공식과 분류체계는 고정이라 시간만 투자하면 잡힙니다. 3주 플랜으로 꾸준히 돌리면 충분히 합격권이에요.

ADsP 모의고사 풀러 가기 →

직접 문제를 풀어보세요

매번 새로운 모의고사와 무한 풀이 모드로 실전 감각을 키울 수 있습니다.